Meta 研究人员揭开大语言模型黑箱，修复 AI 推理缺陷

DDD

发布时间：2025-10-31 16:49:12

802人浏览过

来源于php中文网

原创

meta 研究人员揭开大语言模型黑箱，修复 ai 推理缺陷

Meta的人工智能研究团队联合爱丁堡大学，推出了一项创新技术，能够判断大型语言模型（LLM）在推理过程中是否出错，并在发现问题时主动进行修正。该方法被称为电路基础推理验证（CRV），其核心理念是深入探查LLM内部的“推理电路”，实时监控模型在解决问题时是否存在计算偏差。

研究显示，CRV通过构建并分析模型内部激活状态的计算图，能以很高的准确率识别出推理错误。这一进展使得研究人员可以基于模型深层内部信息，对错误的推理过程实施精准干预。

尽管链式思维推理（CoT）已被广泛用于提升LLM在复杂任务中的表现，但其输出结果仍存在不可靠的风险。当前主流的验证手段主要分为两类：一类是“黑箱”方法，依赖对最终生成token或置信度评分的外部分析；另一类为“灰箱”方法，尝试窥探模型的部分内部状态，但均难以揭示推理失败的根本机制。

MusicAI

AI音乐生成工具

下载

CRV则采用了“白箱”验证路径，假设模型在处理任务时会调用特定的神经元子网络。研究人员通过将传统的稠密层替换为经过训练的“转码器”，使目标LLM具备可解释性，从而能够清晰观察其内部运作流程。随后，CRV构建一个“归因图”，用以刻画信息在模型各组件之间的因果传递关系，并从中提取反映图结构特征的“结构指纹”。基于这些指纹，再训练一个“诊断分类器”来判断每一个推理步骤的正确性。

实验在Llama3.1模型上展开，结果显示CRV在多个数据集和评估指标上均显著优于现有验证方案，展现出卓越的检测能力。研究还发现，不同推理任务中的错误模式具有领域特异性，表明各类推理依赖于各自独特的内部神经回路。

尤为关键的是，CRV不仅停留在相关性层面，而是提供了透明的计算过程视图，使得预测失败能够被追溯到具体的模型组件。这使得研究人员可以通过抑制异常激活特征，在推理过程中实时调整模型的行为路径，实现动态纠错。

广告业大地震！Luma AI仅花2天、预算万分之1 完成千万级全球广告

Google搜寻大升级！新功能Canvas让AI帮你写程式、做笔记

工研院筹组学界、法人联合舰队！投入中长程技术发展

黄仁勋：投资OpenAI「可能是最后一次」 IPO前资金布局逐步收尾

AI时代下的挑战应用材料：能效是决胜关键

相关标签:

人工智能 ai 子网 Token

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：智元牵手上海电气，组建全国首个机器人租赁联盟下一篇：文远知行 CFO 李璇炮轰小马智行港股路演书造假

作者最新文章

SPOJ PRIME1 题解：分段筛法的正确实现与边界修复

2026-03-05 14:03

前Xbox高管爆料：索尼放弃PC移植是忌惮V社新主机

2026-03-05 14:05

将大字符串按 UTF-8 字符边界安全切分为 10KB 子串的 Go 实现方法

2026-03-05 14:07

手机Excel如何保存

2026-03-05 14:07

如何修复 Simon 游戏中因阻塞式循环导致的网页冻结问题

2026-03-05 14:13

Laravel Nova 4 中使用依赖容器实现动态字段显示的完整指南

2026-03-05 14:16

《生化危机9》性感里昂模组发布：上半身完全赤裸！

2026-03-05 14:17

足够惊艳！《红色沙漠》试玩获媒体压倒性好评

2026-03-05 14:18

如何在 Go 中合理组织存在双向依赖的业务模型包

2026-03-05 14:18

《零红蝶：重制版》试玩版上线！PC版容量15.86GB

2026-03-05 14:20

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6559

2023.09.14

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

840

2023.09.14

token怎么获取

获取token值的方法：1、小程序调用“wx.login()”获取临时登录凭证code，并回传到开发者服务器；2、开发者服务器以code换取，用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容，可以阅读本专题下面的文章。

1089

2023.12.21

token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易，用来购买或出售特定的虚拟货币，也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1898

2024.03.01

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

164

2026.03.04