← 返回题库多模态进阶本类第 1 题Transformer 本来是处理文本的,它也能理解图像吗?多模态是怎么回事?👀点击查看大白话讲解先自己想想怎么答,再对答案标记为已掌握☆ 收藏← 上一题什么是混合检索(hybrid search)?为什么它常常比纯向量检索更好?下一题 →什么是视觉语言模型(VLM)?它和纯文本 LLM 有什么不同?