🧠AI 八股 · 大白话

题库 Agent 接入关于

← 返回题库

模型与 Agent 评估进阶本类第 4 题

评估一个 Agent 为什么比评估一个基础 LLM 更加困难和复杂?评估的维度有哪些不同?

什么是'LLM-as-a-Judge'?用 LLM 来评估另一个 LLM 的输出,有哪些优点和潜在的偏见?

什么是 Prompt 工程(提示工程)?为什么它对 AI 应用如此关键?

内容 AI 辅助生成,使用前请自行核对 · 题源见各题底部 ·开源于 GitHub