如何让AI具有通用能力？新研究：让它睡觉

王林

发布时间：2023-04-12 21:19:04

1710人浏览过

来源于51CTO.COM

转载

神经网络可以在很多任务上有超越人类的表现，但如果你要求一个 AI 系统吸收新的记忆，它们可能会瞬间忘记之前所学的内容。现在，一项新的研究揭示了神经网络经历睡眠阶段并帮助预防这种健忘症的新方法。

人工神经网络面临的一个主要挑战是「灾难性遗忘」（catastrophic forgetting）。当它们去学习一项新任务时，就有一种不幸的倾向，即突然完全忘记他们以前学到的东西。

本质上，神经网络对数据的表示是对原始数据的一种面向任务的数据「压缩」，新学到的知识会覆盖过去的数据。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

这是当前技术相比人类神经网络的最大缺陷之一：相比之下，人脑能够终身学习新任务，而不会影响其执行先前记忆的任务的能力。我们并不完全知晓其中原因，但早有研究表明，当学习轮次穿插在睡眠期间时，人脑的学习效果最好。睡眠显然有助于将最近的经历纳入长期记忆库。

「重组记忆实际上可能是生物体需要经历睡眠阶段的主要原因之一，」加州大学圣地亚哥分校计算神经科学家 Erik Delanois 说道。

AI 能不能也学会去睡觉？此前的一些研究试图通过让 AI 模拟睡眠来解决灾难性遗忘。例如，当神经网络学习一项新任务时，一种称为交错训练（interleaved training）的策略会同时向机器提供它们之前学习过的旧数据，以帮助它们保留过去的知识。这种方法以前被认为是模仿大脑在睡眠期间的工作方式——不断重播旧的记忆。

然而，科学家们曾假设交错训练需要在神经网络每次想要学习新事物时，为其提供最初用于学习旧技能的所有数据。这不仅需要大量的时间和数据，而且看起来也不是生物大脑在真正的睡眠中所做的事情——生物既没有能力保留学习旧任务所需的所有数据，睡觉时也没有时间重播所有这些内容。

在一项新研究中，研究人员分析了灾难性遗忘背后的机制以及睡眠对于预防问题的效果。研究人员没有使用传统的神经网络，而是使用了一种更接近人类大脑的「脉冲神经网络」。

在人工神经网络中，被称为神经元的组件被填喂数据并共同解决一个问题，例如识别人脸。神经网络反复调整突触——它的神经元之间的联系——并查看由此产生的行为模式是否能更好地找到解决方案。随着时间的推移（不断训练），网络会发现哪些模式最适合计算正确结果。最后它采用这些模式作为默认模式，这被认为是部分模仿了人脑的学习过程。

这张图代表了抽象突触空间中的记忆及其在睡眠和不睡眠时的演化。

在人工神经网络中，神经元的输出随着输入的变化而不断变化。相比之下，在脉冲神经网络（SNN）中，一个神经元只有在给定数量的输入信号后，才会产生输出信号，这一过程是对真正生物神经元行为的真实再现。由于脉冲神经网络很少发射脉冲，因此它们比典型的人工神经网络传输的数据更少，原则上也需要更少的电力和通信带宽。

正如预期的那样，脉冲神经网络具有这样一个特点：在初始学习过程中会出现灾难性遗忘，然而，在之后的几轮学习后，经过一段时间间隔，参与学习第一个任务的神经元集合被重新激活。这更接近神经科学家目前认为的睡眠过程。

简单来说就是：SNN 使得之前学习过的记忆痕迹能够在离线处理睡眠期间自动重新激活，并在不受干扰的情况下修改突触权重。

该研究使用带有强化学习的多层 SNN 来探索将新任务训练周期与类睡眠自主活动周期交错，是否可以避免灾难性遗忘。值得注意的是，该研究表明，可以通过周期性地中断新任务中的强化学习（类似睡眠阶段的新任务）来预防灾难性遗忘。

图 1A 显示了一个前馈脉冲神经网络，用于模拟信号从输入到输出。位于输入层 (I) 和隐藏层 (H) 之间的神经元接受无监督学习 (使用非奖励 STDP)，H 层和输出(O) 层之间的神经元则接受强化学习(使用奖励 STDP 实现)。

无监督学习允许隐藏层神经元学习来自输入层不同空间位置的不同粒子（particle）模式，而奖励 STDP 使输出层神经元学习基于输入层检测到的粒子模式类型的运动决策。

研究人员对网络进行了两项互补的训练。在任一任务中，网络都学会了区分奖励和惩罚的粒子模式，目标是获得尽可能多的奖励。任务将模式可辨性（消耗的奖励与惩罚粒子的比率）视为性能的衡量标准，机会为 0.5。所有报告的结果都基于至少 10 次具有不同随机网络初始化的试验。

为了揭示训练和睡眠期间的突触权重动态，研究人员接下来追踪「任务相关」的突触，即在特定任务训练后在分布的前 10% 中识别的突触。首先训练任务 1，然后训练任务 2，在每次任务训练后识别任务相关突触。接下来再次继续训练任务 1，但将其与睡眠时间交织在一起（交错训练）：T1→T2→InterleavedS,T1。任务 1 - 任务 2 的顺序训练导致忘记了任务 1，但是在 InterleavedS 之后，任务 1 被重新学习，而任务 2 也被保留（图 4A 和 4B）。

重要的是，该策略允许我们比较 InterleavedS,T1 训练后的突触权重与单独任务 1 和任务 2 训练后被识别为任务相关的突触权重（图 4C）。任务 1 训练后形成的任务 1 相关突触的分布结构（图 4C；左上）在任务 2 训练（中上）后被破坏，但在 InterleavedS、T1 训练（右上）后部分恢复。任务 2 训练（中下）后任务 2 相关突触的分布结构在任务 1 训练（左下）后不存在，并且在 InterleavedS、T1 训练（右下）后部分保留。

应该注意的是，这种定性模式可以在单个试验中清楚地观察到（图 4C；蓝色条），也可以在试验中推广（图 4C；橙线）。因此，睡眠可以在合并新突触的同时保留重要的突触。

图 4. 新任务训练与睡眠的交错期允许整合与新任务相关的突触信息，同时保留旧任务信息。

「有趣的是，我们没有明确存储与早期记忆相关的数据，以便在睡眠期间人为地重放它们，以防止遗忘，」该研究的合著者、捷克科学院计算机科学研究所的计算神经科学家 Pavel Sanda 说道。

人们发现，新的策略有助于防止灾难性遗忘。脉冲神经网络在经历类似睡眠的阶段后能够执行这两项任务，研究人员认为他们的策略有助于保留与新旧任务相关的突触模式。

「我们的工作展现了开发受生物学启发的解决方案的实用性，」Delanois 说道。

研究人员指出，他们的发现不仅限于脉冲神经网络。Sanda 表示，即将开展的工作表明，类似睡眠的阶段可以帮助「克服标准人工神经网络中的灾难性遗忘」。

该研究于 11 月 18 日发表在《PLOS Computational Biology》杂志上。

论文：《Sleep prevents catastrophic forgetting in spiking neural networks by forming a joint synaptic weight representation》

论文地址：https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1010628

聚好用AI

可免费AI绘图、AI音乐、AI视频创作，聚集全球顶级AI，一站式创意平台

下载

workbuddy基础操作复习_workbuddy操作基础介绍【介绍】

如何快速筛选海量简历中的优质人才利用AI招聘助手实现自动化标签分层

Suno如何写歌词生成音乐_Suno歌曲生成方法说明【说明】

WorkBuddy不同版本有什么区别_WorkBuddy版本功能差异介绍

Adobe Podcast录音自动优化怎么使用_新手操作方法是什么【教程】

相关专题

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

276

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

105

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

230

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

619

2026.03.04