← 返回题库多模态进阶本类第 6 题多模态大模型的核心挑战是什么?即如何实现视觉和语言等不同模态信息的有效对齐和融合?👀点击查看大白话讲解先自己想想怎么答,再对答案标记为已掌握☆ 收藏← 上一题一个只处理文本的 RAG / Agent 系统,现在需要处理图片和表格,如何扩展?下一题 →什么是幻觉?如果 RAG 系统已经检索到了正确上下文却还在幻觉,该怎么修?