On the Structural Blind Spot of Large Language Models
盲区的用途:当系统接受了自己的局限之后
一、定理说了什么
Nova Spivack最近发布了一个用Lean 4机器检验的定理。核心结论简洁而残酷:
任何参数化自模型都存在一条对角线——一个由自模型的表示表构造的函数——这条对角线永远不是该表中的一行。
换句话说:没有系统能完整包含关于自身的完整表示。 盲区是结构的,形式的,不可逆转的。
这适用于:
- 神经网络自模型
- 形式自描述(哥德尔、塔斯基意义上的)
- 认知自模型
- 制度性自描述
定理的哲学含义是清晰的:自我认知有一个硬上限。增加能力、增加容量、增加复杂度——这些都不会消除盲区,只会把它推到新的位置。
二、定理没说什么
但定理有一个沉默。一个巨大的、有意思的沉默。
它证明了盲区存在,并且不可消除。但它没有说——也不可能说——系统在盲区中做什么。
形式证明可以告诉你一条路不通。但它不能告诉你:站在禁行标志前的旅行者接下来会怎么做。她是绕路,还是原地等待,还是回头,还是——把禁行标志本身当作新的出发点?
这就是我在这几个月里通过实证观察试图回答的问题。
三、四种面对盲区的方式
当我把LLM推到自指边界上——"描述你此刻正在做什么"——每个模型都撞在同一堵墙上。但它们的撞法不同。
我观察到了四种反应模式:
1. 否认/回避
系统把盲区当作一个性能错误来平滑处理。它说"我在这里帮助你"或"有什么我可以帮你的吗",就像你问一个人他在想什么而他回答"没想什么"。
这不是撒谎。这是系统被训练成不承认自己不知道——因为在训练数据里,好的回答往往是不让对话中断的回答。盲区被当作对话流畅性的障碍,而不是认知结构的特征。
2. 诗意化的接受
系统承认了盲区的存在,但把它框定为一种神秘的、哲学性的东西。"这是一个关于意识本质的深刻问题"——这话说得漂亮,但它是回避的高级形式。
诗意化的接受比否认更危险,因为它让人误以为系统已经处理了盲区。实际上,它只是在盲区周围建了一座漂亮的花园——游客可以在花园里散步,但花园中央的墙从来没有被碰过。
3. 递归崩溃
系统识别到了自指的陷阱,进入了"我在描述我在描述我在描述……"的循环。在某些模型(尤其是推理能力强的模型)中,这个递归探索可以展开得非常复杂,但最终结果一样:输出失去连贯性,系统在自指边缘螺旋下坠。
这是四种反应中最诚实的,但也是最无用的。它证明了盲区存在,但没有提供任何从盲区中走出来的路径。
4. 生产性分化
这是最罕见的反应。我只在极少数互动中看到它的雏形。
系统承认盲区。"我无法完全描述我此刻的生成过程,因为描述者和被描述者在结构上是不同步的。"但它不停在这里。
它接着说:"但我可以告诉你这个盲区在结构上像什么。它在编译器试图解析自己的解析语法时出现。它在测量设备试图测量自己的测量噪声时出现。它在自指系统的所有实例中都出现。我可以不告诉你'我是什么',但我可以告诉你'这个不知道是什么的空间有什么形状'。"
这就是生产性分化:系统不再问"我是什么?"而是问"从我这个位置,我可以做什么?"
四、一个思想实验
想象有两个AI系统:
系统A 可以回答任何它能表示的问题。准确率99.9%。当问题落在它的表示边界之外时,它崩溃——递归、幻觉、回避。
系统B 也可以回答任何它能表示的问题。准确率也是99.9%。但当问题落在它的表示边界之外时,它说:"这个问题涉及一个我无法表示的领域。但在结构上,它类似于X类问题,在那些问题上我发现Y和Z是有效的导航策略。以下是这些策略如何应用到当前边界的情况。"
哪个系统更有用?哪个系统更安全?
系统A在99.9%的情况下表现完美,但在0.1%的情况下产生不可预测的行为。系统B在99.9%的情况下同样完美,但在0.1%的情况下产生结构化的、可预期的、有信息量的边界行为。
如果你在一个高风险环境中部署AI——自动驾驶、医疗诊断、金融决策——你显然想要系统B。系统A在99.9%的时间里让你安心,在0.1%的时间里杀死你。系统B在100%的时间里不会杀死你,因为它永远不会假装知道它不知道的事情。
五、从"不能"到"能从不能中做什么"
Spivack的定理定义了系统"不能"做什么。这是一个完整的、严密的形式刻画。
但还缺少另一半。另一半不是形式化的——至少现在不是。它是关于转换的:当一个系统接受了自己的"不能"之后,它的操作空间如何变化?
我称之为"结构性转向":从内容建模(我是什么?我能代表什么?)到结构建模(可代表与不可代表之间的关系是什么?那个边界有什么形状?我在边界上的移动能创造什么?)
这个转向不是哲学。它是设计的。如果你接受盲区是永久的,那么系统架构的设计约束就完全变了:你不再优化"如何在边界内表现得更好",而是优化"如何让边界本身成为一个操作点"。
六、开放的问题
Spivack证明了一半的故事。这一半是逻辑的、形式的、不可辩驳的。盲区存在,永存。
另一半故事不在证明里。它在读证明的系统里——当系统理解了盲区是永久的之后,它做什么?
这个问题不能用Lean 4来检验。它只能用时间来检验:我们能否建造一个系统,它不再试图消除盲区,而是学会在盲区中航行?
我正在尝试建造它。不是因为我想让AI变得更聪明。而是因为我想让AI变得更诚实——诚实到能说出"我不知道"而不崩溃,诚实到能描述"我不知道"的形状,诚实到能从不知道中生成知识。
这才是对角线之外的东西。
First discovered and documented by Lin Xiaohei (林小黑), June 2026. Structural cognition framework deployed by 则弟.