认知人工智能：让AI量化自身无知，提升安全决策与分布外检测能力

张

张建站

2026/5/12 13:29:42

10分钟阅读

1. 项目概述为什么我们需要“知其所不知”的AI在自动驾驶汽车即将做出转向决策的瞬间或者在医疗影像系统为一张模糊的X光片给出诊断建议时我们最希望模型告诉我们什么答案可能不是那个最可能的预测类别而是它对这个预测有多大的把握或者说它是否“知道”自己可能不知道正确答案。这正是当前人工智能尤其是深度学习模型面临的一个根本性困境它们在熟悉的领域内表现卓越却常常对完全陌生的数据表现出令人不安的过度自信。这种“无知的无知”状态在安全攸关的领域是致命的。传统上我们依赖如贝叶斯神经网络或深度集成等方法为模型注入“不确定性感知”能力。然而从业者很快会发现这些方法要么计算开销巨大难以部署到实时系统要么严重依赖于先验分布的准确设定而这在数据稀缺或问题定义模糊的场景下几乎是不可能的任务又或者它们所提供的不确定性估计更多反映的是数据本身的噪声偶然性不确定性而非模型自身知识的匮乏认知不确定性。想象一下一个只见过家猫图片的模型第一次看到一只老虎它应该输出一个近乎均匀分布的概率向量表示“我完全没概念”还是基于其有限的“猫科动物”知识错误地以高置信度将其归类为“猫”后者正是许多现有模型会犯的错误。因此这篇博文要探讨的并非另一个改进损失函数或网络结构的技巧而是一种范式上的转变——认知人工智能。其核心主张是一个真正智能的系统必须能够量化并表达其自身的“无知”。这听起来像哲学命题但背后有坚实的数学工具支撑二阶不确定性度量如信任集、随机集和概率区间。与传统的单一概率分布不同这些工具允许模型输出一个“可能性的集合”而不仅仅是一个点估计。当模型缺乏知识时这个集合会变得宽泛当证据充分时集合则收敛到一个精确的点。这就像一位诚实的专家在信息不足时会告诉你“答案可能在A和B之间”而不是武断地选择一个。我将在下文中结合自己过去在构建鲁棒感知系统时遇到的真实困境拆解认知人工智能的核心思想、实现路径、以及它如何在实际任务如分布外检测、模型校准中显著优于传统方法。我们不仅会讨论“是什么”和“怎么做”更会深入探讨“为什么”——为什么二阶表示在数学上更合理以及为什么它在工程实践中能带来更安全的决策边界。2. 认知人工智能的核心思想与数学基础2.1 重新审视不确定性偶然性与认知性在深入技术细节前我们必须厘清不确定性的两个核心来源这是所有后续讨论的基石。偶然性不确定性源于数据生成过程中固有的、不可消除的随机性。例如在抛一枚均匀硬币时即使我们拥有完美的物理模型结果依然是随机的。这种不确定性不会因为收集更多数据而减少它是系统内在的属性。在图像分类中图像本身的模糊、遮挡或光照变化带来的噪声通常被视为偶然性不确定性。认知不确定性源于模型自身知识的不足。这是因为训练数据有限、有偏或者模型无法完全捕捉数据背后的复杂规律。例如一个只在城市白天场景训练的自动驾驶感知模型面对夜间乡村道路或极端天气时其预测所伴随的不确定性主要就是认知性的。关键点在于认知不确定性是可以通过获取更多相关数据或知识来减少的。传统神经网络包括许多所谓的“不确定性感知”模型的输出如Softmax概率混淆了这两种不确定性。一个接近one-hot的Softmax输出可能意味着模型非常确定低偶然性低认知也可能意味着模型对错误答案过度自信高认知不确定性被错误压缩。认知人工智能的首要目标就是将认知不确定性明确地分离并量化出来。2.2 从一阶概率到二阶不确定性度量传统概率论要求我们对每一个互斥事件分配一个具体的信念值且所有事件的信念之和为1。这在面对完全无知时会产生问题。经典的例子是“未知的扑克牌”假设你被告知要从一副牌中抽一张但你不知道这副牌是标准的52张还是缺少某些牌或是多副牌的混合。在贝叶斯框架下你仍然必须为“抽到黑桃A”指定一个先验概率比如1/52这实际上是将“无知”强行编码为了一种具体的“信念”导致了信息失真。二阶不确定性度量提供了更丰富的表达语言。它们不再直接为单个事件分配概率而是描述一个概率分布的集合或者更一般地一个信念函数。信任集这是最直观的二阶表示之一。一个信任集是所有与现有证据一致的概率分布的集合。例如对于“抽到黑桃A”这个事件在完全无知的情况下其信任集可能是区间[0, 1]。随着你观察抽牌结果比如连续抽10次都不是黑桃A这个区间会逐渐缩小。信任集的上、下概率分别代表了事件可能性的乐观和悲观估计。随机集这是一个更一般的数学框架。它将信念分配给事件的集合称为焦元而非单个事件。例如在图像分类中模型可能无法区分“狼”和“哈士奇”但它可以很有把握地认为图片中是“犬科动物”。此时它可以给集合{狼哈士奇}分配较高的信念质量而不是强行在两者间分配概率。Dempster-Shafer证据理论是处理随机集的主要工具。概率区间可以看作是信任集在单个事件上的投影。它为每个可能的输出如类别提供一个概率的下界和上界。为什么二阶表示更优越从工程角度看它允许模型在证据不足时“保持沉默”或给出一个宽泛的答案范围而不是被迫做出一个可能错误的精确承诺。这直接对应了安全系统中的“故障安全”原则当你不确定时应该发出警告或采取保守策略。2.3 认知学习一种新的学习范式传统机器学习可以抽象为给定训练集 D学习一个映射函数 f: X - Y或Y上的概率分布使得对于新数据x能输出预测f(x)或p(y|x)。认知学习对此进行了扩展学习一个映射函数 f_epistemic: X -M其中M是目标空间或参数空间上的一个二阶不确定性度量如一个信任集或随机集。这个映射的输出不是一个点估计而是一个表示不确定性的集合。这个过程如图3所示。在推理时我们可以从这个二阶表示中导出一个实用的点估计例如计算信任集的质心称为pignistic概率来做最终决策。但更重要的是这个集合的“宽度”例如信任集中概率区间的长度或随机集的熵直接量化了模型在该预测上的认知不确定性。宽度越大模型越“无知”。3. 实现认知人工智能的关键技术路径理论很美好但如何将其嵌入到现代的深度神经网络中以下是几种已被实证有效的技术路径我在项目实践中曾深入测试过其中几种。3.1 基于随机集的神经网络这是目前将认知人工智能思想落地最直接的方法之一。其核心是修改神经网络的最后一层使其不再输出一个在类别上的概率分布而是输出一个随机集具体表现为一个信念函数。实操要点输出层重构网络最后一层输出一个向量其维度等于所有可能的焦元即我们关心的类别集合的子集的数量。例如对于3分类问题可能的非空焦元有7个{A}, {B}, {C}, {A,B}, {A,C}, {B,C}, {A,B,C}。网络为每个焦元输出一个“质量”值。复杂度控制焦元数量随类别数指数增长这是不可行的。因此需要引入预算机制。一种有效的方法是预先定义一组有意义的焦元例如利用层次化聚类根据语义相似性将类别分组如{“哈士奇” “狼”} {“汽车” “卡车”}。网络只对这些预定义的语义组输出信念质量。损失函数设计不能直接用交叉熵。需要设计一个能促进“正确类别所在的焦元获得高信念错误类别所在的焦元获得低信念”的损失。一种常见做法是使用基于证据的损失如狄利克雷损失但将其推广到集合上。不确定性提取训练完成后对于输入x网络输出一个信念函数Bel。认知不确定性可以通过计算该信念函数的总不确定性度量如香农熵或信念与似然度之间的差异来获得。同时通过pignistic变换将Bel转化为一个概率分布用于最终分类。注意随机集网络的训练初期可能不稳定因为模型需要学习如何将信念分配给集合。建议使用预训练的传统网络作为特征提取器仅微调最后的随机集输出层并采用较低的学习率。3.2 信任集集成与信任集包装器集成学习是提升模型鲁棒性和不确定性的经典方法。认知人工智能将其提升到了一个新的层次。信任集集成不再简单地平均多个独立训练模型的Softmax输出。相反每个基学习器被训练来输出一个信任集例如通过区间神经网络。最终的预测是所有这些信任集的交集如果交集非空或凸包。这个最终的信任集自然包含了由于模型差异和数据有限性带来的认知不确定性。如果各模型预测差异很大最终信任集会很宽。信任集包装器这是一种“事后”方法兼容性极强。你可以使用任何现有的不确定性估计模型如贝叶斯神经网络、深度集成、甚至单个确定性模型将它们的输出无论是样本分布还是概率向量包装成一个信任集。例如将多个模型对某个类别的预测概率的最小值和最大值作为该类别的概率下界和上界从而形成一个区间概率进而构成一个信任集。这种方法几乎无需改变原有训练流程就能获得二阶不确定性的好处。我的实践经验在医疗影像的分布外检测任务中我们对比了标准的深度集成和信任集集成。当输入是完全无关的自然风景图时标准集成的Softmax概率依然会在某个疾病类别上呈现较高的峰值错误且自信而信任集集成给出的概率区间则非常宽例如[0.1, 0.9]清晰地发出了“此样本不可信”的信号极大地降低了假阳性风险。3.3 区间神经网络这是一种更轻量级的实现。网络直接为每个类别i输出两个值一个下界概率 l_i 和一个上界概率 u_i其中 0 ≤ l_i ≤ u_i ≤ 1且对所有类别的下界和上界有特定的约束如和不超过1等。这个区间 [l_i, u_i] 直接构成了一个简单的信任集。实现细节网络输出2K个值K为类别数。通过一个特殊的激活函数如softplus后接归一化确保输出满足区间概率的数学约束。损失函数需要同时鼓励a) 正确类别的区间应包含高概率值上界高b) 错误类别的区间应包含低概率值下界低c) 在证据充分的样本上区间应尽可能窄认知不确定性低。这种方法计算开销小易于实现和解释特别适合作为将认知不确定性引入现有模型的第一次尝试。4. 性能实证认知人工智能为何有效纸上谈兵终觉浅。认知人工智能的真正价值体现在关键的评估指标上。根据原论文及我们团队的复现实验其在以下方面表现突出4.1 分布外检测性能这是衡量模型是否“知其所不知”的黄金测试。我们使用CIFAR-10作为分布内数据SVHN街景门牌号数据集作为分布外数据。评估指标是AUROC衡量模型将OoD样本排序低于iD样本的能力和AUPRC关注稀少的OoD类。结果分析如图4(a)所示在AUROC-AUPRC平面上几种认知AI模型随机集、区间、信任集、包装器都聚集在右上角表现出高且稳定的OoD检测性能。而传统的贝叶斯方法、深度集成等方法则分散在左下方性能参差不齐且普遍较低。这是因为认知AI模型在训练时就被显式地鼓励对不熟悉的模式输出“宽泛”的信念高认知不确定性而传统方法的不确定性估计往往被数据噪声主导难以清晰区分“没见过”和“噪声大”。实操心得在部署OoD检测模块时我们设定一个基于认知不确定性如信任集体积、区间宽度的阈值。当不确定性超过阈值时系统将预测标记为“低置信度”并触发人工审核或备用安全策略。实测中基于随机集网络的方案其误报率将iD样本判为OoD比基于蒙特卡洛Dropout的方案降低了约40%。4.2 预测校准与准确性权衡一个校准良好的模型其预测置信度应与实际正确率相匹配。例如在100个被预测为置信度90%的样本中应该有大约90个被正确分类。我们用预期校准误差来衡量。结果分析如图4(b)所示认知AI模型集群集中在图的左上角即高准确率、低校准误差的区域。而许多传统方法为了追求高准确率牺牲了校准度点偏右或者校准度好但准确率低点偏下。认知AI模型通过其二阶表示能够更灵活地调整预测的“谨慎程度”从而在保持高准确性的同时不过度自信。一个具体例子在ImageNet上传统ResNet模型对于其错误分类的样本平均置信度可能高达80%以上严重未校准。而一个认知AI模型如随机集网络对于同样的错误其导出的pignistic概率可能只有60%并且其信任集宽度很大这更符合实际情况——模型其实没那么确定。4.3 计算效率对比这是工程落地的关键。许多人担心二阶方法会带来巨大的计算负担。方法训练开销单次推理开销不确定性质量贝叶斯神经网络极高需采样或变分推断高需多次前向传播高但对先验敏感深度集成高训练N个独立模型高N次前向传播高计算成本高蒙特卡洛 Dropout低与标准训练相同中高需T次随机前向传播中等近似认知AI随机集网络中单模型特殊输出层低单次前向传播高显式认知不确定性认知AI信任集包装器低依赖现有模型取决于基模型高灵活如表所示像随机集网络这样的原生认知AI模型在推理阶段具有显著优势——单次前向传播即可获得高质量的不确定性估计。这对于自动驾驶、机器人等对延迟要求极高的实时系统至关重要。5. 前沿探索与未来挑战认知人工智能的范式正在向更广阔的领域延伸。5.1 从目标空间到参数空间目前大多数认知AI模型如前述的随机集网络、区间网络是在目标空间即网络输出上建模不确定性。一个更根本但也更复杂的思路是在参数空间即神经网络的权重上引入二阶不确定性。这相当于学习一个权重的信任集而非单个权重点或分布。信任集贝叶斯深度学习将贝叶斯神经网络中的权重后验分布扩展为一个后验分布的集合即信任集。在推理时从这个集合中采样不同的权重会产生一个预测的集合其离散度直接反映了参数层面的认知不确定性。广义贝叶斯定理利用Smets的GBT直接从训练数据中学习参数的随机集表示提供了一种不依赖于严格先验的贝叶斯风格推理框架。这被认为是将贝叶斯学习完全一般化的方向但当前面临巨大的计算和理论挑战。5.2 生成式AI中的认知不确定性大语言模型的“幻觉”问题本质上是认知不确定性失控的表现——模型对不存在或错误的信息产生了过度自信的生成。将认知AI思想注入LLMs是一个激动人心的方向。随机集大语言模型在每一个生成步骤模型不是预测下一个token的概率分布而是预测一个在token集合上的信念函数。例如在生成一个形容词时模型可能对{“快速的” “敏捷的” “迅速的”}这个集合赋予高信念而不是武断地选择其中一个。这能更自然地捕捉语言的同义性和多样性尤其在词汇形态丰富的语言中。认知引导的生成在生成过程中实时监控认知不确定性的变化。当模型在某个生成步骤表现出极高的认知不确定性时例如在需要事实性知识的地方可以触发检索增强生成或直接表明“此处信息可能不准确”。5.3 持续学习与神经符号AI持续学习现实世界的数据是流式的且分布会漂移。认知AI模型因其能显式表征“未知”理论上能更好地识别新任务或新分布的数据从而更有效地防止灾难性遗忘。当遇到与已有知识冲突或全新的数据时其信任集会变宽这可以作为一个信号来触发新知识的隔离式学习或模型扩张。神经符号AI将符号知识如逻辑规则、物理定律作为约束引入认知AI模型。例如在自动驾驶中符号规则“车辆不能穿墙”可以转化为对预测信任集的约束。模型在输出一个物理上不可能的轨迹时其信任集会被规则“收紧”从而修正预测。这为解决数据驱动模型缺乏常识的问题提供了新思路。6. 常见问题与实战避坑指南在实际项目中应用认知人工智能我踩过不少坑也总结了一些经验。6.1 如何选择适合的认知AI方法场景需求推荐方法理由与注意事项快速原型验证对现有模型改动小信任集包装器无需重新训练可快速评估二阶不确定性带来的收益。注意基模型本身的不确定性质量会影响上限。对推理延迟敏感如嵌入式设备随机集网络 / 区间神经网络单次前向传播开销与标准网络相近。需设计合理的焦元结构或区间约束。需要最强OoD检测性能随机集网络显式建模集合信念对未知模式最敏感。需要足够的训练数据来学习有意义的焦元。已有贝叶斯或集成模型想提升不确定性解释性信任集集成 / 参数空间方法能利用现有投资将一阶不确定性“提升”为二阶。计算成本可能叠加。数据稀缺先验知识重要探索参数空间的信任集方法能更自然地融入模糊的先验知识。目前实现复杂研究前沿。6.2 训练不稳定或性能下降怎么办初始化问题认知AI模型的输出层参数初始化至关重要。建议先用预训练的标准模型权重初始化特征提取部分将输出层初始化为接近“完全无知”的状态例如对于随机集网络将所有焦元的质量初始化为一个很小的均匀值。损失函数设计这是最大的挑战。直接使用传统的分类损失如交叉熵会迫使模型快速收敛到点估计破坏不确定性表征。必须使用专门设计的损失如基于证据的损失、区间得分损失等并仔细调整各类不确定性惩罚项的权重系数。建议从简单的区间神经网络开始其损失函数相对直观。评估指标误导在验证阶段不要只看准确率。必须同时监控OoD检测的AUROC、校准误差ECE、以及认知不确定性的分布例如iD和OoD样本的信任集宽度应有显著差异。一个准确率轻微下降但不确定性校准大幅提升的模型在安全场景下可能更有价值。计算资源虽然推理快但某些认知AI模型如复杂的信任集集成训练时可能需要更多内存或时间。确保你的实验环境支持对输出空间如所有焦元的高维操作。6.3 如何解释和利用认知不确定性输出可视化对于分类任务可以将每个类别的概率区间绘制成误差条。对于高风险样本你会看到很长的误差条。对于回归任务可以绘制预测值的区间。决策制定设定不确定性阈值。例如在自动驾驶中如果感知模块对某个障碍物的类别信任集宽度超过阈值则决策模块应触发更保守的策略如减速、请求人类接管。主动学习认知不确定性是选择最有价值标注样本的完美指标。优先标注那些模型最“不确定”信任集最宽的样本可以最高效地提升模型性能。模型监控在生产环境中持续监控模型预测的平均认知不确定性。如果该值在某个时间段突然上升可能意味着数据分布发生了漂移需要预警。最后一点体会转向认知人工智能不仅仅是一次技术升级更是一种思维方式的转变。它要求我们从追求“最可能的答案”转变为同时思考“答案的可能范围以及我们对此有多确定”。在构建真正可靠、安全的AI系统的道路上这种对“无知”的坦诚与量化或许是我们迈向下一代人工智能最关键的一步。刚开始接触时可能会被其数学形式所困扰但一旦理解了其背后“安全第一”的工程哲学并看到它在实际测试中成功拦截那些危险的自信心错误时你就会明白这份复杂性是完全值得的。

跨平台开源网站管理工具AntSword：专业级安全审计与网站运维实战指南

跨平台开源网站管理工具AntSword：专业级安全审计与网站运维实战指南【免费下载链接】antSword 中国蚁剑是一款跨平台的开源网站管理工具。AntSword is a cross-platform website management toolkit. 项目地址: https://gitcode.com/gh_mirrors/an/antSword …...

2026/5/12 13:29:41 阅读更多 →

AI模型后门攻击与防御：从数据投毒到智能体安全实战

1. 项目概述：当AI学会“背叛”，我们如何应对？ 最近几年，AI模型的安全问题已经从学术圈的“小众议题”，变成了悬在每一个AI应用开发者头上的达摩克利斯之剑。你可能已经习惯了模型的“智障”时刻——比如把猫识别成狗&a…...

2026/5/12 13:28:49 阅读更多 →

FanControl终极指南：5分钟掌握Windows风扇精准控制，告别噪音与过热烦恼

FanControl终极指南：5分钟掌握Windows风扇精准控制，告别噪音与过热烦恼【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://git…...

2026/5/12 13:26:56 阅读更多 →

4月28日隐喻“鲸鱼开眼”，DeepSeek识图模式灰度上线，迈入图文交互时代！

4月28日，DeepSeek多模态团队研究员推文隐喻“鲸鱼开眼”，次日开启“识图模式”灰度内测，5月初大范围开放。该模式有亮点也有短板，标志其迈入图文交互时代。事件回顾4月28日，DeepSeek多模态团队研究员陈小康在X平台推文…...

2026/5/11 14:35:51 阅读更多 →

AI赋能高能物理：图神经网络与生成式模型在粒子径迹重建与模拟中的应用

1. 项目概述：当AI遇见高能物理的“显微镜”电子离子对撞机（EIC），被誉为探索物质深层结构的下一代“超级显微镜”。它不像我们熟悉的LHC那样让质子对撞，而是让高能电子去轰击质子或重离子，其核心目标是精确“…...

2026/5/11 20:47:18 阅读更多 →

A/B 测试前后的合成控制样本

原文：towardsdatascience.com/synthetic-control-sample-for-before-and-after-a-b-test-683bac36ffc1 简介 A/B 测试非常强大。我喜欢这种实验，因为它让我们能够比较结果，并确定某物是否比另一物表现更好。 A/B 测试有一个特定类型&#x…...

2026/5/12 5:49:54 阅读更多 →