0

0

赛博树突觉醒!AI 仿生革命:更少参数,更强性能,过拟合?不存在的!

花韻仙語

花韻仙語

发布时间:2025-02-01 17:42:01

|

805人浏览过

|

来源于机器之心

转载

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

编辑丨&

人工神经网络(ANN)是大多数深度学习(DL)算法的核心,这些算法可以成功解决图像识别、自动驾驶和自然语言处理等复杂问题。然而,与能够高效解决类似问题的生物大脑不同,DL 算法需要大量可训练参数,这使得它们能耗高且容易过拟合。

来自希腊研究与技术基金会两位研究员示了一种新的 ANN 架构,它结合了生物树突的结构化连接和受限采样特性,抵消了这些限制。

树突状人工神经网络在多项图像分类任务中表现优于传统人工神经网络,同时使用的可训练参数明显较少。树突特性的结合可以使 ANN 中的学习更加精确、有弹性和参数高效,并为生物学特征如何影响 ANN 的学习策略提供了新的思路。

他们的研究以「Dendrites endow artificial neural networks with accurate, robust and parameter-efficient learning」为题,于 2025 年 1 月 22 日刊登于《Nature Communications》。

图片

研究结果表明,树突特性的结合可以使 ANN 中的学习更加精确、有弹性和参数高效,并为生物学特征如何影响 ANN 的学习策略提供了新的思路。

生物树突与 DL

DL 架构在很大程度上依赖于受其生物对应物启发的多层人工神经网络(ANN)。在这些网络中,人工节点的构造通常是输入的线性加权和加上非线性激活函数,大致模仿生物神经元的胞体或轴突如何整合输入,并且通过更改这些节点之间的连接强度进行学习。

比之下,生物神经元要复杂得多,由一个体细胞、一个轴突和许多树突组成,使它们能够并行处理数千个突触输入,其方式在细胞类型之间差异很大。尽管生物神经元的体细胞和轴突功能在人工神经元中得到了突破,但目前缺少树突计算。

生物树突,因为它们能够产生局部再生事件(树突尖峰),与神经元胞体具有相似的尖峰特征。因此,生物神经元可以充当多层人工神经网络,能够执行复杂的计算。

鉴于树突的高计算能力和生物网络中的相关优势,目前人工神经元的设计似乎已经过时了。树突特性的掺入可能会增强人工神经网络的能力,培养更有效、更高效和更有弹性的学习行为,就像在生物网络中看到的那样。

上述主张得到了最近的研究的支持,这些研究将树突结构及其特性整合到传统人工神经网络中,在机器学习 (ML) 任务上显示出有希望的结果。

在这里,他们提出了一种生物逼真的树突状架构,旨在改善使用反向传播算法训练的人工神经网络的学习。在所提出的架构中,输入被部分采样并馈送到树突层,而树突层又以稀疏和高度结构化的方式连接到体细胞层。

图片

图 1:树突状 ANN (dANN) 与经典香草 ANN (vANN) 的示意图。

通过结合树突结构和采样特征,所提出的树突状 ANN 模型在多个图像分类任务上匹配或优于传统 ANN,并抵消过拟合,同时使用的可训练参数减少了几个数量级。

这些改进可能是由于更广泛地使用了可训练权重,并且树突状 ANN 与传统 ANN 使用的学习策略不同。

总的来说,研究结果表明,树突可以在不牺牲其性能准确性的情况下提高人工神经网络的计算效率,为开发继承生物大脑一些主要优势的仿生 ML 系统开辟了新的途径。

树突 ANN 模型

在树突 ANN 模型中,每个树突都充当一个典型的点神经元:它线性地对其加权输入(突触)求和,并通过非线性传递总和。树突激活随后乘以电缆权重,并在胞体处求和,然后进行第二次非线性传递。

扣子编程
扣子编程

扣子推出的AI编程开发工具

下载

为了训练模型,他们将其实现为传统的 ANN,具有两个稀疏连接的隐藏层,分别代表树突和体细胞单元,以及一个完全连接的输出层。除此之外,他们还实现了一个具有相同层数的完全普通的 ANN 来进行对比。

除了结构化的连接性外,生物神经元的树突仅接收来自视觉场景的部分信息。为了研究这一特性的贡献,树突状 ANN 模型实施了三种类型的输入采样:a 输入特征(R)的随机采样,b 局部感受(LRF),其中每个树突都从图像的空间限制部分采样,以及 c 全局感受(GRF),其中所有树突都属于来自图像同一空间限制部分的 soma 样本。

对于大小匹配和更大的 vANN 架构(就可训练参数而言),这三个树突状 ANN 比 vANN 模型更有效地实现了更好的学习和对抗过拟合。

这些过拟合减少并不像在 dANN 中看到的那么大,这表明这里测试的生物启发树突结构可能是更有效的正则化器。虽然这些发现并不构成与所有传统正则化方法的比较,但它们表明观察到的正则化是仿生结构的一个新兴特性。

图片

图 2:树突特征改善了对时尚 MNIST 分类的学习。

除了过拟合的好处外,dANN 还通过使用更少的可训练参数来匹配 vANN 的最佳性能。

在测试的三种 dANN 配置中,具有局部感受的 dANN 是最有效的。它达到了最高的精度和最小的损耗,而可训练参数比 vANN 少了一个数量级以上。

最后,正如预期的那样,dANN 和 pdANN 模型中的学习随着网络大小的增加而提高。更重要的是,与其他仿生架构不同、dANN和 pdANN 模型随着层数的增加而表现出更好的性能或稳定性,揭示了它们在更深层次架构中使用的潜力。

图片

图 3:树突提高了各种基准数据集的效率。

在所有测试的数据集中,dANN 模型表现出比 vANN 和 pdANN 更高的效率。然而,它比 vANN 更不容易受到过拟合的影响,从而在大多数测试的数据集中它实现相似准确性的较小损失。

图像辨别结果表明,对于更困难的任务,dANN 和 vANN 模型之间的差异可能更大。当任务难度增加时,在 ANN 中加入树突特征可能会带来更大的稳健性、准确性和效率增益。

研究讨论的小结

仿生机器学习是 AI 领域最前沿的方向之一,而生物树突及其学习机制正成为研究的热点。这些仿生设计已经在人工神经网络中展现出巨大的潜力,为相关领域的发展打开了新的可能性。

然而,主要依赖树突处理的生物网络的能力和效率仍远无法与相应的人工神经网络相匹配。为了解决这一困境,研究者们构建了一组树突状 ANN,利用生物树突的结构化连接和受限采样特征来增强学习。

全新的模型为在经典人工神经网络中采用树突特征可以获得的好处提供了新的见解,这些发现具有远大的前景,它们表明整合生物特征对于优化 ML 算法的可持续性和有效性至关重要。

相信这些优势与它们相对较好地扩展深度的能力相结合,能使所提出的 dANN 网络整合到 DL 架构中,成为经典 ANN 的潜在强大替代品。

论文链接:https://www.nature.com/articles/s41467-025-56297-9

代码链接:https://github.com/Poirazi-Lab/dendritic_anns

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

864

2026.01.21

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

407

2023.08.14

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2081

2024.08.16

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

165

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

34

2026.01.28

ao3中文版官网地址大全
ao3中文版官网地址大全

AO3最新中文版官网入口合集,汇总2026年主站及国内优化镜像链接,支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

73

2026.01.28

php怎么写接口教程
php怎么写接口教程

本合集涵盖PHP接口开发基础、RESTful API设计、数据交互与安全处理等实用教程,助你快速掌握PHP接口编写技巧。阅读专题下面的文章了解更多详细内容。

2

2026.01.28

php中文乱码如何解决
php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

4

2026.01.28

Java 消息队列与异步架构实战
Java 消息队列与异步架构实战

本专题系统讲解 Java 在消息队列与异步系统架构中的核心应用,涵盖消息队列基本原理、Kafka 与 RabbitMQ 的使用场景对比、生产者与消费者模型、消息可靠性与顺序性保障、重复消费与幂等处理,以及在高并发系统中的异步解耦设计。通过实战案例,帮助学习者掌握 使用 Java 构建高吞吐、高可靠异步消息系统的完整思路。

8

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 3.1万人学习

Django 教程
Django 教程

共28课时 | 3.6万人学习

MySQL 教程
MySQL 教程

共48课时 | 2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号