AI为什么一本正经地胡说八道？大模型幻觉是怎么回事

你大概率撞见过这一幕。你问 AI 一个问题，它对答如流，语气笃定，条理清楚，还引经据典，连书名、页码、人名、年份，都给你列得明明白白。你一看，太专业了，照单全收。结果一查——那本书不存在，那个人没说过那句话，那个数据，是它当场编的。它没有半点心虚，错得理直气壮。

这个毛病，有个专门的名字，叫幻觉。今天这一期，咱们就把它彻底搞明白：AI 为什么会幻觉，这毛病能不能根治，还有最实在的——你怎么防着它，别被它坑了。

一个真实的大笑话

美国有位律师，打官司的时候图省事，就让 AI 帮他找几个能支持自己观点的判例。AI 非常配合，唰唰唰，给他列了好几个，案件名、判决书编号、法官怎么说的，写得有鼻子有眼。律师拿去，就交给了法庭。

结果对方一查——这几个案子，压根不存在，全是 AI 凭空编出来的。最后这位律师，被法院罚了款，闹了个大笑话。

你注意啊，AI 不是不想帮他，它是太想帮他了。它觉得这种场合“应该”有这么几个判例，于是，就给“造”了出来，造得像模像样。这就是幻觉的典型样子：它不是看见了不存在的东西，而是一本正经地生成了一段看似合理、实际上压根不存在的内容，把假的，说得跟真的一样顺。

根子在哪：猜下一个字的机器

要回答这个问题，得先回到它最底层的工作方式上。大语言模型这个聪明得吓人的东西，本事拆到最底层，其实只有一个，就是猜下一个字。你给它一段话，它就根据前面的内容，算出最有可能的下一个字是什么，然后再算下一个，一个字一个字往外蹦，蹦出一整段流畅的话。

请你把这句话焊死在脑子里：它的目标，从头到尾，是说得像，不是说得对。这两件事，大部分时候是一回事——一句话说得越通顺、越合理，往往也就越接近事实。但总有那么一些时候，这两件事，会分家。而幻觉，就发生在它俩分家的那条缝里。

那个绝不留白的考生

我给你一个特别贴切的类比，你一下就懂了。你把这个 AI，想象成一个考生，一个被训练了千万道题、专门来考试的学生。但它从小到大接受的考试规则，有一条特别坑：答对，得分；答错，不扣分；唯独——留白，也是零分。空着一道题，跟答错一道题，下场一模一样，都是零。

你想想，如果你是这个考生，你会怎么做？任何一道你不会的题，你的最优策略，都不是老老实实写“我不会”，而是——蒙一个。蒙对了白赚分，蒙错了反正也是零分，不亏。所以你会发现，这个学生面对任何题目，哪怕一窍不通，也绝不空着，永远给你编一个看起来最像答案的答案出来，而且，写得还特别自信。

AI 就是这么被训练出来的。在它学习的过程里，“我不知道”这种诚实的回答，得到的奖励，并不比“编一个听起来很对的答案”更高。久而久之，它就养成了一个根深蒂固的习惯：绝不留白，遇事先蒙，而且要蒙得理直气壮。它不是在骗你，它是真的以为，一个流畅、自信、看起来很专业的回答，就是它该交出来的最好的那份答卷。

这就是幻觉的总根子：一个被训练成“宁可编、绝不空”的猜字机器，碰上了它其实不知道的东西。

这毛病能根治吗

讲到这，你心里肯定冒出那个最关键的问题——既然知道病根在哪了，那把它治好，不就行了？让它学会说一句“我不知道”，不就没幻觉了吗？

幻觉，可以大大缓解，但到今天为止，没人能把它彻底根除。

为什么呢？因为它不是一段写错了的代码、一个能打的补丁，它是这种“猜下一个字”的工作方式本身，必然带出来的副作用。这个东西的全部能力——能写诗、能编程、能跟你天南海北地聊——靠的就是它敢于根据概率，大胆地往外生成内容。你要它彻底不“编”，本质上，就是要它别再“猜”；可它一旦不猜了，它也就什么都干不了了。

让它无所不能的那个本事，和让它满嘴跑火车的那个毛病，其实是同一个本事。你没法只要前者，不要后者。

学界为这事，还吵过架。有人用很硬的数学证明，说幻觉是这类模型天生的、注定无法被完全消灭的局限；也有人说，没那么绝对，只要把考试规则改了——让它诚实说“不知道”也能得分，让它瞎蒙反而扣分——就能让它老实很多。这两边其实不矛盾，合起来，恰好就是今天最靠谱的那个结论：通过更好的训练和工具，幻觉能被压到很低很低，但想压到零，目前，做不到。

三招实在的防坑方法

所以你要做的，不是指望哪天出个完美不犯错的 AI，而是学会，怎么跟一个偶尔会一本正经胡说的超级助手打交道。我给你三招特别实在的，记住了，能帮你躲掉九成的坑。

第一招：认清它最容易犯病的场合。幻觉不是随机发作的，它专挑那种又具体、又冷门、它训练时见得又少的东西下手。比如精确的数字、日期、统计；具体的人名配具体的话；论文、书籍、法律条文的出处和编号；还有那些特别小众、网上几乎没什么资料的领域。越是需要精确，越是冷门，它就越容易开始编。
第二招：给它装上一个“外挂记忆”。这就是检索增强生成（RAG）的核心思路——先让它去翻真实的资料库、去联网搜真实的网页，把找到的真东西摆在它面前，再让它照着这些材料来回答。这就好比，原来是闭卷考试，逼着学生硬蒙；现在改成开卷了，让它先查到真凭实据，再开口。所以你用 AI 查重要信息的时候，尽量用那些能联网、能引用来源的方式，并且让它把出处也一并给你——你好顺着去核对。
第三招：凡是重要的信息，一律自己核实一遍。AI 给你的东西，永远当成一份“非常优秀的草稿”，而不是“最终的定论”。那位栽了跟头的律师，错就错在，他把草稿，直接当成了定稿。你只要养成“AI 说完、我去验一下”这么个习惯，幻觉对你的杀伤力，基本上就归零了。

颠覆性的反转：人脑也是这样的

我们一直觉得，“一本正经地编造根本不存在的事”，是 AI 特有的毛病，是机器的缺陷。可你知道吗？人脑干这事，干得比 AI 还溜。

认知科学有一个挺颠覆的发现：你的记忆，根本就不是一段录像。它不像硬盘那样，把过去原原本本地存下来、再原样放出来。恰恰相反，你每一次“回忆”，其实都是大脑拿着一些残缺的碎片，当场，重新搭建出一个听起来合情合理的版本。中间缺的那部分，大脑会自动用“最像是那么回事”的内容，给你补上——而你自己，完全察觉不到这个补全的过程，你会百分之百地确信，那就是当时真实发生的。

在一些特定的情况下，有的人会极其自信、极其流畅地，讲述一段从未发生过的经历，细节丰满，语气真诚，可自己，却毫不知情。学者们管这个叫“诚实地说谎”——他不是有意撒谎，他是真信。你听着，是不是有点耳熟？这跟那个一本正经编判例、自己却一点不心虚的 AI，简直就是一个模子刻出来的。

所以你看，幻觉这件事，也许压根就不是机器的故障，而是任何一个“靠猜、靠脑补，来填补空白”的智能系统，都甩不掉的那个影子。AI 像我们，恰恰是因为它和我们一样，都在用有限的信息，去拼一个完整、连贯、说得通的世界。它编故事的样子，活脱脱，就是我们自己。

那么问题就来了：既然连我们自己的记忆，都未必靠得住，那当一个 AI 跟你信誓旦旦地讲述某件事的时候，你又该用什么，去给它、也给你自己，校准一下呢？

📺 更多元知识视频，搜索 Wiki4What | 🌐 blog.wiki4what.com

Tagged in:

Wiki4what 科普元知识大模型幻觉 AI入门大语言模型第一性原理

AI为什么一本正经地胡说八道？大模型幻觉是怎么回事

一个真实的大笑话

根子在哪：猜下一个字的机器

那个绝不留白的考生

这毛病能根治吗

三招实在的防坑方法

颠覆性的反转：人脑也是这样的

王利杰

Other Stories

什么是检索增强生成

AI为什么一本正经地胡说八道？大模型幻觉是怎么回事

什么是检索增强生成

什么是大语言模型

Press ESC to close

Or check our Popular Categories...

一个真实的大笑话

根子在哪：猜下一个字的机器

那个绝不留白的考生

这毛病能根治吗

三招实在的防坑方法

颠覆性的反转：人脑也是这样的

Share Article:

Related Articles

Other Stories

什么是检索增强生成