像刷 LeetCode 一样刷 AI 面试八股

AI 面试八股,讲成人话

100 道真实 AI 面试题,配零基础也能看懂的大白话讲解。先自测、再看答案, 进度存本地。题库还以 MCP / REST API 开放,可接入任意 AI agent。

100

真实面试题

知识方向

大白话

零基础讲解

🤖 接入你的 AI →

学习进度0 / 100 已掌握

🔍

100 题

1✓什么是词元化(tokenization)?请比较 BPE 和 WordPiece 这两种主流子词切分算法。大模型基础入门

2✓LLM 推理时有哪些常见的解码策略?请解释 Greedy Search、Beam Search、Top-K 采样和 Top-P(Nucleus)采样的原理和优缺点。大模型基础入门

3✓请解释 Transformer 中的自注意力机制是如何工作的?它为什么比 RNN 更适合处理长序列?大模型基础入门

4✓什么是位置编码?在 Transformer 中为什么它是必需的?请列举至少两种实现方式。大模型基础入门

5✓你觉得 NLP 和 LLM 最大的区别是什么?两者有何共同点和不同点?大模型基础入门

6✓请比较 Encoder-Only、Decoder-Only 和 Encoder-Decoder 三种架构,说明各自最擅长的任务类型。大模型基础入门

7✓怎么理解大模型的'涌现能力'?它通常在模型规模达到什么程度时出现?大模型基础入门

8✓LLM 常用的激活函数有哪些?为什么选用它?大模型基础入门

9✓什么是 Scaling Laws(规模定律)?它揭示了模型性能、计算量和数据量之间的什么关系?大模型基础入门

10✓你知道 MHA、MQA、GQA 的区别吗?请详细解释一下。大模型基础入门

11✓请详细介绍 RoPE(旋转位置编码),对比绝对位置编码,它的优劣势分别是什么?大模型基础入门

12✓混合专家模型(MoE)是如何在不显著增加推理成本的情况下,有效扩大模型参数规模的?请简述其工作原理。大模型基础入门

13✓你如何定义一个基于 LLM 的智能体(Agent)?它通常由哪些核心组件构成?AI Agent(智能体)进阶

14✓请详细解释 ReAct 框架。它是如何将思维链和行动结合起来,以完成复杂任务的?AI Agent(智能体)进阶

15✓在 Agent 设计中规划能力很重要。目前有哪些主流方法可以赋予 LLM 规划能力?(例如 CoT、ToT、GoT)AI Agent(智能体)进阶

16✓Memory 是 Agent 的关键模块。如何为 Agent 设计短期记忆和长期记忆系统?可以借助哪些外部工具或技术?AI Agent(智能体)进阶

17✓Tool Use 是扩展 Agent 能力的有效途径。请从 Function Calling 角度解释 LLM 是如何学会调用外部 API 或工具的?AI Agent(智能体)进阶

18✓请比较 LangChain 和 LlamaIndex 这两个流行的 Agent 开发框架。它们的核心应用场景有何不同?AI Agent(智能体)进阶

19✓什么是多智能体系统?让多个 LLM Agent 协同工作相比单个 Agent 有什么优势?又会引入哪些新的复杂性?AI Agent(智能体)进阶

20✓在构建一个复杂的 Agent 时,你认为最主要的挑战是什么?AI Agent(智能体)进阶

21✓如何确保一个 Agent 的行为是安全、可控且符合人类意图的?在 Agent 设计中有哪些保障对齐的方法?AI Agent(智能体)进阶

22✓请解释 RAG 的工作原理。与直接对 LLM 进行微调相比,RAG 主要解决了什么问题?有哪些优势?RAG(检索增强)进阶

23✓一个完整的 RAG 流水线包含哪些关键步骤?请从数据准备到最终生成,详细描述整个过程。RAG(检索增强)进阶

24✓在构建知识库时文本切块(chunking)策略至关重要。你会如何选择合适的切块大小和重叠长度?背后有什么权衡?RAG(检索增强)进阶

25✓如何选择一个合适的嵌入(Embedding)模型?评估一个 Embedding 模型的好坏有哪些指标?RAG(检索增强)进阶

26✓除了基础的向量检索,你还知道哪些可以提升 RAG 检索质量的技术?RAG(检索增强)进阶

27✓请解释'Lost in the Middle'问题。它描述了 RAG 中的什么现象?有什么方法可以缓解?RAG(检索增强)进阶

28✓如何全面地评估一个 RAG 系统的性能?请分别从检索和生成两个阶段提出评估指标。RAG(检索增强)进阶

29✓了解搜索系统吗?它和 RAG 有什么区别?RAG(检索增强)进阶

30✓传统 RAG 是'先检索后生成',你是否了解更复杂的 RAG 范式,比如在生成过程中多次检索或自适应检索?RAG(检索增强)进阶

31✓在什么场景下,你会选择用图数据库或知识图谱来增强或替代传统的向量数据库检索?RAG(检索增强)进阶

32✓为什么传统的 NLP 评估指标(如 BLEU、ROUGE)对于评估现代 LLM 的生成质量存在很大局限性?模型与 Agent 评估进阶

33✓请介绍几个目前行业内广泛使用的 LLM 综合性基准测试,并说明各自侧重点。(例如 MMLU、Big-Bench、HumanEval)模型与 Agent 评估进阶

34✓什么是'LLM-as-a-Judge'?用 LLM 来评估另一个 LLM 的输出,有哪些优点和潜在的偏见?模型与 Agent 评估进阶

35✓评估一个 Agent 为什么比评估一个基础 LLM 更加困难和复杂?评估的维度有哪些不同?模型与 Agent 评估进阶

36✓什么是 Prompt 工程(提示工程)?为什么它对 AI 应用如此关键?Prompt 工程入门

37✓请用例子解释 zero-shot、one-shot 和 few-shot 提示。Prompt 工程入门

38✓什么是自洽性(self-consistency)提示?它是如何提升模型推理能力的?Prompt 工程入门

39✓什么是系统提示(system prompt)?它如何影响模型的行为?Prompt 工程入门

40✓如何设计提示,让模型稳定地输出结构化结果(如 JSON、XML)?Prompt 工程入门

41✓什么是提示注入(prompt injection)攻击?如何防御?Prompt 工程入门

42✓什么是越狱(jailbreaking)?常见的越狱手法有哪些?Prompt 工程入门

43✓如何针对成本和延迟来优化提示词?Prompt 工程入门

44✓提示工程(prompt engineering)和提示微调(prompt tuning)有什么区别?Prompt 工程入门

45✓什么是提示模板(prompt template)?生产环境里该怎么设计它?Prompt 工程入门

46✓什么是角色提示(role prompting)?它在什么情况下最有效?Prompt 工程入门

47✓什么是微调(fine-tuning)?什么时候应该对一个 LLM 进行微调?微调与对齐进阶

48✓全量微调和参数高效微调(PEFT)有什么区别?微调与对齐进阶

49✓什么是 LoRA(低秩适配)?它是怎么工作的?微调与对齐进阶

50✓什么是 QLoRA?它是如何让消费级显卡也能微调大模型的?微调与对齐进阶

51✓什么是指令微调(instruction tuning)?为什么它对聊天模型很重要?微调与对齐进阶

52✓什么是灾难性遗忘(catastrophic forgetting)?微调时如何避免?微调与对齐进阶

53✓如何准备一份用于微调 LLM 的数据集?微调与对齐进阶

54✓什么是 RLHF(基于人类反馈的强化学习)?它是如何用来对齐 LLM 的?微调与对齐进阶

55✓什么是 DPO(直接偏好优化)?它和 RLHF / PPO 有什么不同?微调与对齐进阶

56✓什么是合成数据(synthetic data)?在微调中怎么用?微调与对齐进阶

57✓微调、RAG、提示工程三者到底该怎么选?微调与对齐进阶

58✓什么是 Model Context Protocol(MCP)?它是如何标准化工具接入的?工具调用 & MCP进阶

59✓如何为一个 AI Agent 设计和定义工具(tools)?工具调用 & MCP进阶

60✓什么是 AI SubAgents(子智能体)?什么时候该拆出一个子 Agent?工具调用 & MCP进阶

61✓LLM 选对了工具,却把参数传错了,如何修复参数提取?工具调用 & MCP进阶

62✓Agent 工具很多却总挑错工具,如何提升工具选择的准确性?工具调用 & MCP进阶

63✓什么是 Agent 循环(agent loop)?它是如何决定何时停止的?工具调用 & MCP进阶

64✓如何在长流程 Agent 工作流里控制 token 消耗和成本?工具调用 & MCP进阶

65✓什么是 Plan-and-Execute(先规划后执行)的 Agent 模式?工具调用 & MCP进阶

66✓什么是 KV cache?它是如何加速推理的?部署与推理优化挑战

67✓什么是模型量化(quantization)?它如何减小模型体积、加速推理?部署与推理优化挑战

68✓什么是 Flash Attention?它解决了什么问题?部署与推理优化挑战

69✓大模型推理又慢又贵,有哪些优化延迟和吞吐的常见手段?部署与推理优化挑战

70✓什么是流式输出(streaming)?为什么 AI 的回答是一个字一个字往外蹦的?部署与推理优化挑战

71✓你的 LLM 回答太啰嗦,如何控制输出长度?部署与推理优化挑战

72✓如何让 LLM 学会说'我不知道',而不是硬编一个答案?部署与推理优化挑战

73✓处理长文档时撞到了模型的上下文窗口上限,如何应对?部署与推理优化挑战

74✓什么是 LLMOps?LLM 应用上线后如何监控、应对性能衰退?部署与推理优化挑战

75✓什么是模型蒸馏(distillation)?大模型是怎么'教'小模型的?部署与推理优化挑战

76✓什么是小语言模型(SLM)和大推理模型(LRM)?它们分别适合什么场景?部署与推理优化挑战

77✓什么是 embedding(向量)?模型是怎么把文字变成一串数字的?向量与 Embedding入门

78✓稀疏向量(sparse)和稠密向量(dense)有什么区别?向量与 Embedding入门

79✓余弦相似度、点积、欧氏距离在向量检索里分别怎么用?怎么选?向量与 Embedding入门

80✓什么是向量数据库?它和传统数据库有什么不同?向量与 Embedding入门

81✓向量维度(dimensionality)如何影响检索性能和成本?向量与 Embedding入门

82✓当 embedding 模型升级后出现'向量漂移'(embedding drift),该如何处理?向量与 Embedding入门

83✓什么是多模态 embedding?它是怎么生成的?向量与 Embedding入门

84✓什么是混合检索(hybrid search)?为什么它常常比纯向量检索更好?向量与 Embedding入门

85✓Transformer 本来是处理文本的,它也能理解图像吗?多模态是怎么回事?多模态进阶

86✓什么是视觉语言模型(VLM)?它和纯文本 LLM 有什么不同?多模态进阶

87✓请解释 CLIP 模型的工作原理。它是如何通过对比学习把图像和文本'对齐'的?多模态进阶

88✓扩散模型(Diffusion,如 Stable Diffusion、DALL·E)生成图像的基本原理是什么?多模态进阶

89✓一个只处理文本的 RAG / Agent 系统,现在需要处理图片和表格,如何扩展?多模态进阶

90✓多模态大模型的核心挑战是什么?即如何实现视觉和语言等不同模态信息的有效对齐和融合?多模态进阶

91✓什么是幻觉?如果 RAG 系统已经检索到了正确上下文却还在幻觉,该怎么修?AI 应用实战 & 安全挑战

92✓如何给 AI Agent 加护栏(guardrails),防止它做出有害操作?AI 应用实战 & 安全挑战

93✓什么是人在回路(human-in-the-loop)模式?什么时候需要它?AI 应用实战 & 安全挑战

94✓AI Agent 可能执行不可逆操作(比如误删生产数据库),如何防范?AI 应用实战 & 安全挑战

95✓如何用沙箱(sandbox)安全地运行一个会执行代码的 Agent?AI 应用实战 & 安全挑战

96✓聊天机器人聊了十几轮后就丢失上下文,如何维持长对话?AI 应用实战 & 安全挑战

97✓什么是查询改写(query transformation,如 HyDE、查询分解、step-back)?它如何提升检索?AI 应用实战 & 安全挑战

98✓RAG 如何实现引用和来源标注(citation),让答案可追溯?AI 应用实战 & 安全挑战

99✓LLM 可能把训练数据里的隐私/专有信息泄露出来,如何防止?AI 应用实战 & 安全挑战

100✓包含业务逻辑的系统提示被用户套出来了,如何防止系统提示泄露?AI 应用实战 & 安全挑战