人脑90%都是自监督学习，AI大模型离模拟大脑还有多远？

WBOY

发布时间：2023-04-11 20:29:13

1459人浏览过

来源于51CTO.COM

转载

我们都知道，人类的大脑90%都是自监督学习的，生物会不断对下一步发生的事情做出预测。自监督学习，就是不需要外部干预也能做出决策。只有少数情况我们会接受外部反馈，比如老师说：「你搞错了」。而现在有学者发现，大型语言模型的自监督学习机制，像极了我们的大脑。知名科普媒体Quanta Magazine近日报道，越来越多的研究发现，自监督学习模型，尤其是大型语言模型的自学方式，与我们的大脑的学习模式非常类似。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

过去常见的AI系统都是使用大量标记数据进行训练的。例如，图像可能被标记为「虎斑猫」或「虎猫」，用以训练人工神经网络来正确区分虎斑和虎。

这种「自监督」训练需要人工费力地标记数据，而神经网络通常会走捷径，学习将标签与最少、有时甚至是肤浅的信息联系起来。例如，神经网络可能会使用草的存在来识别奶牛的照片，因为奶牛通常是在田野中拍摄的。加州大学伯克利分校的计算机科学家阿列克谢·埃弗罗斯 (Alexei Efros) 说：

我们正在培养的算法，就像是一整个学期都没来上课的本科生，虽然他们并没有系统学习这些材料，但他们在考试中表现出色。

此外，对于对动物智能和机器智能的交叉感兴趣的研究人员来说，这种「监督学习」可能仅限于它对生物大脑的揭示。许多动物，包括人类不使用标记数据集来学习。在大多数情况下，他们自己探索环境，并且通过这样做，他们对世界获得了丰富而深刻的理解。

现在，一些计算神经科学家已经开始探索使用很少或没有人工标记数据进行训练的神经网络。最近的研究结果表明，使用自我监督学习模型构建的动物视觉和听觉系统的计算模型比监督学习模型更接近大脑功能。

对一些神经科学家来说，人工神经网络似乎开始揭示用大脑来类比机器学习的途径。

有缺陷的监督

大约10年前，受人工神经网络启发的大脑模型开始出现，同时一个名为AlexNet的神经网络彻底改变了对未知图像进行分类的任务。

这项成果在Alex Krizhevsky、Ilya Sutskever和Geoffrey E. Hinton 的论文「ImageNet Classification with Deep Convolutional Neural Networks」中发表。

论文地址：https://dl.acm.org/doi/10.1145/3065386 与所有神经网络一样，该网络由多层人工神经元组成，其中不同神经元之间连接的权重不同。

如果神经网络未能正确分类图像，学习算法会更新神经元之间连接的权重，以降低在下一轮训练中错误分类的可能性。该算法重复此过程多次，调整权重，直到网络的错误率低到可以接受的程度。之后，神经科学家使用AlexNet开发了第一个灵长类视觉系统（Primate Visual System）的计算模型。

当猴子和人工神经网络显示相同的图像时，真实神经元和人工神经元的活动显示出类似的反应。在听觉和气味检测的人工模型上也取得了相似的结果。但随着该领域的发展，研究人员意识到自监督训练的局限性。 2017年，德国蒂宾根大学的计算机科学家Leon Gatys和他的同事拍摄了一张福特T型车的照片，然后在照片上覆盖了豹皮图案。

而人工智能神经网络将原始图像正确分类为Model T，但将修改后的图像视为豹子。原因是它只专注于图像纹理，不了解汽车（或豹子）的形状。自监督学习模型旨在避免此类问题。瑞士巴塞尔弗里德里希·米歇尔生物医学研究所的计算神经科学家弗里德曼·岑克 (Friedemann Zenke) 说，

在这种方法中，人类不会标记数据，相反，标签来自数据本身。自监督算法本质上是在数据中创建空白，并要求神经网络填补空白。

例如，在所谓的大型语言模型中，训练算法将向神经网络显示句子的前几个单词，并要求它预测下一个单词。当使用从互联网收集的大量文本进行训练时，该模型似乎可以学习语言的句法结构，展示出令人印象深刻的语言能力——所有这些都没有外部标签或监督。计算机视觉方面也正在进行类似的努力。 2021年底，何恺明及其同事展示了著名的掩码自动编码器研究「Masked Auto-Encoder」（MAE）。

论文地址：https://arxiv.org/abs/2111.06377 MAE将未掩码部分转换为潜在表示——压缩的数学描述，其中包含有关对象的重要信息。在图像的情况下，潜在表示可能是一种数学描述，其中包括图像中对象的形状。然后解码器将这些表示转换回完整的图像。

大脑也是「自监督」的

在这样的系统中，一些神经科学家认为，我们的大脑实际上也是自监督学习的。麦吉尔大学和魁北克人工智能研究所（Mila）的计算神经科学家布莱克-理查兹（Blake Richards）说：「我认为毫无疑问，大脑所做的90%都是自监督学习。」生物大脑被认为是在不断地预测，例如，一个物体在移动时的未来位置，或一句话中的下一个词，就像自我监督学习算法试图预测图像或一段文字的间隙一样。

计算神经科学家布莱克-理查兹（Blake Richards）创建了一个AI系统，模仿活体大脑中的视觉网络理查兹和他的团队创建了一个自监督模型，暗示了一个答案。他们训练了一个结合两种不同神经网络的人工智能。

小羊标书

一键生成百页标书，让投标更简单高效

下载

第一个，称为ResNet架构，是为处理图像而设计的；第二个，称为递归网络，可以跟踪先前的输入序列，对下一个预期输入进行预测。为了训练联合AI，该团队从一连串的视频开始，比如说10帧，让ResNet逐一处理。

然后，递归网络预测了第11帧的潜在表示，而不是简单地匹配前10帧。自监督学习算法将预测值与实际值进行比较，并指示神经网络更新其权重，以使预测效果更好。

为了进一步测试，研究人员向AI展示了一组视频，西雅图艾伦脑科学研究所的研究人员以前曾向小鼠展示过这些视频。与灵长类动物一样，小鼠的大脑区域专门用于静态图像和运动。艾伦研究人员在小鼠观看视频时记录了小鼠视觉皮层的神经活动。

理查兹的团队发现了AI和活体大脑对视频的反应方式的相似之处。在训练过程中，人工神经网络中的一条途径变得与小鼠大脑的腹侧、物体探测区域更加相似，而另一条途径则变得与注重运动的背侧区域相似。

这些结果表明，我们的视觉系统有两条专门的通路，因为它们有助于预测视觉的未来；单一的通路是不够好的。人类听觉系统的模型讲述了一个类似的故事。6月，由Meta AI的研究科学家Jean-Rémi King领导的团队训练了一个名为Wav2Vec 2.0的人工智能，它使用一个神经网络将音频转化为潜在的表征。研究人员对这些表征中的一些进行了屏蔽，然后将其送入另一个称为转化器的组件神经网络。

在训练过程中，转化器预测被屏蔽的信息。在这个过程中，整个人工智能学会了将声音转化为潜在的表征，同样，不需要标签。该团队使用了大约600小时的语音数据来训练网络。「这大约是一个孩子在前两年的经验中得到的东西。」金说。

Meta AI的让-雷米-金帮助训练了一种人工智能，它以模仿大脑的方式处理音频--部分是通过预测下一步应该发生什么一旦该系统被训练出来，研究人员给它播放英语、法语和普通话的有声读物部分，然后将AI的表现与412人的数据进行了比较（这些人都是以这三种语言为母语的人），他们在核磁共振扫描对自己的大脑进行成像时，听了同样长的一段音频。

结果显示，尽管fMRI图像有噪音且分辨率不高，但AI神经网络和人类的大脑「不仅相互关联，而且还以系统的方式关联」。 AI早期层的活动与初级听觉皮层的活动一致，而AI最深层的活动则与大脑中较高层的活动相一致，比如前额叶皮层。「

这是非常漂亮的数据，虽然算不上是决定性的，但算得上是令人信服的证据，表明我们学习语言的方式在很大程度上是在预测接下来会说的话。」

有人不同意：模拟大脑？模型、算法都差的远

当然，也并非所有人都认同这种说法。

MIT的计算神经科学家乔希-麦克德莫特（Josh McDermott）曾使用监督和自监督学习研究视觉和听觉的模型。他的实验室设计了一些人工合成的音频和视觉信号，对于人类来说，这些信号只是难以捉摸的噪音。

然而，对于人工神经网络来说，这些信号似乎与真实语言和图像没有区别。这表明，在神经网络的深层形成的表征，即使是自监督学习，也与我们大脑中的表征不一样。麦克德莫特说：「这些自我监督的学习方法是一种进步，因为你能够学习能够支持很多识别行为的表征，而不需要所有标签。但仍然有很多监督模型的特征。」

算法本身也需要更多改进。比如在Meta AI的Wav2Vec 2.0模型中，AI只预测了几十毫秒的声音的潜在表征，比人发出一个噪音音节的时间还要短，更不用说预测一个词了。

要真正实现让AI模型和人类大脑相类似，我们还有很多事情要做，金说。如果目前发现的大脑和自我监督学习模型之间的相似性在其他感官任务中也成立，将更有力地表明，无论我们的大脑有什么神奇的能力，都需要以某种形式进行自监督学习。

QClaw怎么绑定QQ号_QClawQQ通道开通与双端登录【操作】

workbuddy基本功能有哪些_workbuddy核心功能详解【详解】

LMStudio如何加载AI模型_LMStudio模型加载操作方法【教程】

GitHubCopilot新手怎么安装_GitHubCopilot插件安装方法【方法】

WorkBuddy如何实现电脑本地大模型的离线调用_WorkBuddy隐私模式设置【安全】

相关专题

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

117

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

350

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

109

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

108

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

243

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

684

2026.03.04