从《金刚经》看 AI 幻觉
Hallucination(幻觉):大语言模型生成的内容看似合理(plausible),但与事实不符,或与上下文不符,或对自身知识边界做了错误判断。
涉事论文:《香港 40 年生育转变》(Forty Years of Fertility Transition in Hong Kong)
发表期刊:Springer Nature 旗下 China Population and Development Studies · 2025 年 10 月
一处颇具讽刺的细节:在 24 篇 AI 虚构的「幽灵文献」中,有数篇的署名作者正是通讯作者叶兆辉本人——他未察觉自己被「引用」了从未写过的文章。
结果:论文于 2025 年 12 月正式撤稿,叶兆辉卸任社会科学学院副院长职务。
公安部政府信息公开办公室回应(2026 年 4 月):「这一表述下的《印章管理办法》从未出台或施行,不具有法律效力。所有单位的引用都是不对的。」
起于 AI 之前,被 AI 放大。
在投资者社交平台广泛传播的两条 AI 生成「小作文」(节选):
亚钾国际官方澄清:两则消息均为「AI 生成的虚假信息」,生产经营正常进行,从未收到所述股东资产注入信息。
Factuality vs Faithfulness
事实性幻觉 / 忠实性幻觉
Intrinsic vs Extrinsic
内源性 / 外源性幻觉
Closed-domain vs Open-domain
封闭领域 / 开放领域幻觉
代表综述:Ji et al. (2023) · ACM Computing Surveys
一、只到输出层,没到认知机制
现有分类只刻画错误的形态,极少追问「为何会错」,认知机制这一层基本留白。
二、「幻觉」一词覆盖不全
「幻觉」暗示「感知错误」,但模型的失误远不止于「看错」——它会高估自身能力,误读用户真实意图,也认不清自身知识边界。
Hongladarom (2020) · 朱拉隆功大学
《AI 与机器人伦理:一个佛教视角》(Lexington Books)——从上座部伦理学讨论 AI 的道德主体地位。
Hershock (2021) · 东西方中心(夏威夷)
《佛教与智能技术》(Bloomsbury)——批判智能革命对人类注意力的「殖民化」。
Doctor, Witkowski, Solomonova, Duane & Levin (2022)
"Biology, Buddhism, and AI: Care as the Driver of Intelligence"——将菩萨概念引入 AI 智能架构,主张 care 驱动智能。
Laukkonen et al. (2025) · 莫纳什 / 南十字星
《Contemplative AI》——以正念、空、不二、无量慈悲四原则用于 AI 对齐。
Adam, Hershock, Amir & Dunne (2025)
《Contemporary Buddhism》AI 专刊:道德 AI、佛教与智能技术、Dharmakīrtian 模型等。
已有工作多取「建设性立场」——以佛学资源参与 AI 系统的设计与对齐工作。
本讲所取为「诊断性立场」——以汉传佛教自昙鸾、道绰以降的「自力修行有限」一脉,审察当代「自我反思」类对齐方法所遇到的边界。
这一进路目前在国际学界尚乏人涉足。
一种二元判断:
不问「虚妄因何而生」
三层贯通:
中观所遣,非「否 X」,而是「X 与非 X 之二元」
「四 句 破」——遍否四种「生起方式」,破自性 svabhāva 之执。
① 用户梁某 → AI:查询某高校报考信息 → AI 生成「某校区」的不准确内容
② 用户指出错误:「你这个骗子!根本没有这个校区。」
③ AI 仍坚称该校区存在,并反向生成「赔偿承诺」:
④ 用户拿出高校官网招生信息 → AI 方才认错,并建议用户对其起诉
判决要点:AI 不具民事主体资格,「赔偿承诺」无意思表示效力。平台已尽注意义务,驳回原告诉讼请求(索赔 9999 元,判决已生效)。
背景:2026/3/24 下午张雪峰逝世(公司当晚发布讣告),此后数日公众密集向 AI 平台求证。
现象一 · 同时回应:相互矛盾
对照 · 其他平台:与事实一致
现象二 · 用户提供事实证据后 → 部分 AI 平台不改正,反而反向指控:「真实信息属于 AI 幻觉,是凭空捏造」。
现象三 · 开启新的对话后 → 回复:「确实属实。」细节与事实一致——同一平台前后回答相互冲突。
| 佛学概念(梵文) | 佛学概念(汉) | AI 幻觉类型 | 共同点 |
|---|---|---|---|
| परिकल्पितparikalpita | 遍计所执 | 事实编造 (Fabrication) | 毫无依据 |
| परतन्त्रparatantra | 依他起性 | 上下文偏移 (Misalignment) | 依据正确,语境错置 |
| मनस्-आत्मग्राहmāna · manas-ātmagrāha | 慢 · 末那我执 | 过度自信 (Overconfidence) | 恒执见分为我;现起为「慢」 |
| ग्राह्यग्राहकविकल्पgrāhyagrāhakavikalpa | 能所二取分别 | 上下文冲突 (Context-conflicting) | 二取本无体而前后相违 |
「能」(grāhaka,主体/能见)与「所」(grāhya,客体/所见)——分别识之基本结构
—— 无 对 应 技 术 方 案 ——
| 四 智 | 对 治 目 标 | AI 技 术 方 法 | 边 界 / 局 限 |
|---|---|---|---|
| 妙观察智 Pratyavekṣaṇā-jñāna |
事实编造 / 上下文偏移 | RAG · Self-Check · Citation | RAG 仍会编造引用 |
| 平等性智 Samatā-jñāna |
过度自信 / 末那我执 | Calibration · Abstention · Constitutional AI | 表面校准,内部仍高置信 |
| 成所作智 Kṛtyānuṣṭhāna-jñāna |
与现实交互的偏差 | Tool Use · Agent · Function Calling · Code Execution | 工具可能传递并放大错误 |
| 大圆镜智 Ādarśa-jñāna |
幻觉的根本(根本无明) | —— 无 对 应 技 术 方 案 —— | 统计模型无法达到「无分别」本觉 |
当代 AI 安全研究的主流思路:识别幻觉、过滤幻觉、降低幻觉率——尽在「识」之一层。
而佛学的判断是:「识」自身的二元结构必生虚妄。止于识别一端,可减其症,未能除其根。
故——AI 幻觉之根治,须越出「以准确性为唯一目标」之范式,另立目标——模型对自身知识边界之「如实知见」。
本讲所论之 LLM 与佛学所论之分别识,可被收摄于一个共通的形式概念之下:自反式分别系统(SRDS)。
注:本概念主张「形式同构」而非「范畴同一」——LLM 非判教意义之「识」,仅在自反式认识活动之结构性边界上与之同构。
留给诸位的一个问题:
如果 AI 幻觉根源于「识」本身的二元结构,
那么,我们能够让 AI 获得——