你大概率撞见过这一幕。你问 AI 一个问题,它对答如流,语气笃定,条理清楚,还引经据典,连书名、页码、人名、年份,都给你列得明明白白。你一看,太专业了,照单全收。结果一查——那本书不存在,那个人没说过那句话,那个数据,是它当场编的。它没有半点心虚,错得理直气壮。

这个毛病,有个专门的名字,叫幻觉。今天这一期,咱们就把它彻底搞明白:AI 为什么会幻觉,这毛病能不能根治,还有最实在的——你怎么防着它,别被它坑了。

一个真实的大笑话

美国有位律师,打官司的时候图省事,就让 AI 帮他找几个能支持自己观点的判例。AI 非常配合,唰唰唰,给他列了好几个,案件名、判决书编号、法官怎么说的,写得有鼻子有眼。律师拿去,就交给了法庭。

结果对方一查——这几个案子,压根不存在,全是 AI 凭空编出来的。最后这位律师,被法院罚了款,闹了个大笑话。

你注意啊,AI 不是不想帮他,它是太想帮他了。它觉得这种场合“应该”有这么几个判例,于是,就给“造”了出来,造得像模像样。这就是幻觉的典型样子:它不是看见了不存在的东西,而是一本正经地生成了一段看似合理、实际上压根不存在的内容,把假的,说得跟真的一样顺。

根子在哪:猜下一个字的机器

要回答这个问题,得先回到它最底层的工作方式上。大语言模型这个聪明得吓人的东西,本事拆到最底层,其实只有一个,就是猜下一个字。你给它一段话,它就根据前面的内容,算出最有可能的下一个字是什么,然后再算下一个,一个字一个字往外蹦,蹦出一整段流畅的话。

请你把这句话焊死在脑子里:它的目标,从头到尾,是说得像,不是说得对。这两件事,大部分时候是一回事——一句话说得越通顺、越合理,往往也就越接近事实。但总有那么一些时候,这两件事,会分家。而幻觉,就发生在它俩分家的那条缝里

那个绝不留白的考生

我给你一个特别贴切的类比,你一下就懂了。你把这个 AI,想象成一个考生,一个被训练了千万道题、专门来考试的学生。但它从小到大接受的考试规则,有一条特别坑:答对,得分;答错,不扣分;唯独——留白,也是零分。空着一道题,跟答错一道题,下场一模一样,都是零。

你想想,如果你是这个考生,你会怎么做?任何一道你不会的题,你的最优策略,都不是老老实实写“我不会”,而是——蒙一个。蒙对了白赚分,蒙错了反正也是零分,不亏。所以你会发现,这个学生面对任何题目,哪怕一窍不通,也绝不空着,永远给你编一个看起来最像答案的答案出来,而且,写得还特别自信。

AI 就是这么被训练出来的。在它学习的过程里,“我不知道”这种诚实的回答,得到的奖励,并不比“编一个听起来很对的答案”更高。久而久之,它就养成了一个根深蒂固的习惯:绝不留白,遇事先蒙,而且要蒙得理直气壮。它不是在骗你,它是真的以为,一个流畅、自信、看起来很专业的回答,就是它该交出来的最好的那份答卷。

这就是幻觉的总根子:一个被训练成“宁可编、绝不空”的猜字机器,碰上了它其实不知道的东西。

这毛病能根治吗

讲到这,你心里肯定冒出那个最关键的问题——既然知道病根在哪了,那把它治好,不就行了?让它学会说一句“我不知道”,不就没幻觉了吗?

幻觉,可以大大缓解,但到今天为止,没人能把它彻底根除。

为什么呢?因为它不是一段写错了的代码、一个能打的补丁,它是这种“猜下一个字”的工作方式本身,必然带出来的副作用。这个东西的全部能力——能写诗、能编程、能跟你天南海北地聊——靠的就是它敢于根据概率,大胆地往外生成内容。你要它彻底不“编”,本质上,就是要它别再“猜”;可它一旦不猜了,它也就什么都干不了了。

让它无所不能的那个本事,和让它满嘴跑火车的那个毛病,其实是同一个本事。你没法只要前者,不要后者。

学界为这事,还吵过架。有人用很硬的数学证明,说幻觉是这类模型天生的、注定无法被完全消灭的局限;也有人说,没那么绝对,只要把考试规则改了——让它诚实说“不知道”也能得分,让它瞎蒙反而扣分——就能让它老实很多。这两边其实不矛盾,合起来,恰好就是今天最靠谱的那个结论:通过更好的训练和工具,幻觉能被压到很低很低,但想压到零,目前,做不到。

三招实在的防坑方法

所以你要做的,不是指望哪天出个完美不犯错的 AI,而是学会,怎么跟一个偶尔会一本正经胡说的超级助手打交道。我给你三招特别实在的,记住了,能帮你躲掉九成的坑。

  • 第一招:认清它最容易犯病的场合。幻觉不是随机发作的,它专挑那种又具体、又冷门、它训练时见得又少的东西下手。比如精确的数字、日期、统计;具体的人名配具体的话;论文、书籍、法律条文的出处和编号;还有那些特别小众、网上几乎没什么资料的领域。越是需要精确,越是冷门,它就越容易开始编。
  • 第二招:给它装上一个“外挂记忆”。这就是检索增强生成(RAG)的核心思路——先让它去翻真实的资料库、去联网搜真实的网页,把找到的真东西摆在它面前,再让它照着这些材料来回答。这就好比,原来是闭卷考试,逼着学生硬蒙;现在改成开卷了,让它先查到真凭实据,再开口。所以你用 AI 查重要信息的时候,尽量用那些能联网、能引用来源的方式,并且让它把出处也一并给你——你好顺着去核对。
  • 第三招:凡是重要的信息,一律自己核实一遍。AI 给你的东西,永远当成一份“非常优秀的草稿”,而不是“最终的定论”。那位栽了跟头的律师,错就错在,他把草稿,直接当成了定稿。你只要养成“AI 说完、我去验一下”这么个习惯,幻觉对你的杀伤力,基本上就归零了。

颠覆性的反转:人脑也是这样的

我们一直觉得,“一本正经地编造根本不存在的事”,是 AI 特有的毛病,是机器的缺陷。可你知道吗?人脑干这事,干得比 AI 还溜。

认知科学有一个挺颠覆的发现:你的记忆,根本就不是一段录像。它不像硬盘那样,把过去原原本本地存下来、再原样放出来。恰恰相反,你每一次“回忆”,其实都是大脑拿着一些残缺的碎片,当场,重新搭建出一个听起来合情合理的版本。中间缺的那部分,大脑会自动用“最像是那么回事”的内容,给你补上——而你自己,完全察觉不到这个补全的过程,你会百分之百地确信,那就是当时真实发生的。

在一些特定的情况下,有的人会极其自信、极其流畅地,讲述一段从未发生过的经历,细节丰满,语气真诚,可自己,却毫不知情。学者们管这个叫“诚实地说谎”——他不是有意撒谎,他是真信。你听着,是不是有点耳熟?这跟那个一本正经编判例、自己却一点不心虚的 AI,简直就是一个模子刻出来的。

所以你看,幻觉这件事,也许压根就不是机器的故障,而是任何一个“靠猜、靠脑补,来填补空白”的智能系统,都甩不掉的那个影子。AI 像我们,恰恰是因为它和我们一样,都在用有限的信息,去拼一个完整、连贯、说得通的世界。它编故事的样子,活脱脱,就是我们自己。

那么问题就来了:既然连我们自己的记忆,都未必靠得住,那当一个 AI 跟你信誓旦旦地讲述某件事的时候,你又该用什么,去给它、也给你自己,校准一下呢?

📺 更多元知识视频,搜索 Wiki4What | 🌐 blog.wiki4what.com