0

0

连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹

看不見的法師

看不見的法師

发布时间:2025-10-12 17:00:02

|

200人浏览过

|

来源于php中文网

原创

刚刚过去的国庆,各行各业进入放假模式,但大模型行业却一刻也没闲着。

过去的半个月,国内外大模型的头部团队有十余款重磅产品发布,但每个团队的产品侧重不同。

其中,九月下旬,阿里发布以Qwen3-Max为代表的全家桶产品,大秀了一把肌肉;九月末,DeepSeek和Anthropic瞄准真实编程场景,先后发布了DeepSeek V3.2-Exp和Claude Sonnet 4.5,此外,智谱也拿出GLM-4.6,目标冲击国内最强代码模型。

有人全盘布局,也有人专攻精尖,在大模型领域竞争驶向深水区后,各个公司战略路线出现了分野。

10月9日凌晨,蚂蚁百灵大模型团队奇袭般官宣了一款自家最新语言大模型Ling-1T,参数量达到1000B(即1万亿参数)。然而,就在十天前,百灵团队才将自研Ring-1T-preview大模型开源。

短短十天内,发布并开源两款万亿参数模型,如此密集的产品发布让蚂蚁百灵大模型成为了行业热议对象。

与此同时,这样毫无保留的开源动作,也让业界猜测:蚂蚁到底意图何在?

01

探索智能上限是终极目标

据PHP中文网(公众号:PHP中文网)了解,蚂蚁集团研发的基础大模型取名“百灵”,寓意“百试百灵”,也蕴含科技普惠之意,和阿里一样,蚂蚁也是独立团队独立研发,Ling-1T和Ring-1T-preview分别是蚂蚁百灵团队研发的非思考模型和思考模型。

过去半年时间里,蚂蚁一直在对百灵大模型进行迭代优化,并且自上而下形成了三条技术探索路线:

一条是以MoE架构为基础的非思考模型Ling-Series,另一条是思考模型Ring-Series,第三条是原生全模态大模型Ming-Series。

如今,蚂蚁百灵团队在Ling和Ring两款模型路线上都已经将参数量扩大到万亿参数。

万亿参数,几乎等同于人类大脑神经元数量,相当于让AI拥有等同于人脑的处理能力,但万亿参数非常难训。目前,国内能达到万亿参数规模的大模型也是凤毛麟角。

除了刚才提到的百灵大模型Ling-1T和Ring-1T-preview,目前国内公开资料可查的万亿参数大模型只有Kimi K2、阿里Qwen3-Max和腾讯混元大模型等少数几个模型,可见大模型领域“万亿俱乐部”的门槛之高。

虽然今年以来盛行“数据撞墙论”和“预训练终结”的观点,但越来越多科学家也形成了一个新的共识:更大的参数,更多的数据,仍然能带来持续的性能提升。

阿里的算法负责人林俊旸公开表态:Scaling Law仍然没见顶,训练数据的增加,参数规模的扩大,都还能看到模型性能的提升。

杨植麟的Kimi团队更是克服万难闷头苦干,终于在两个月前,拿出了万亿参数的旗舰模型K2。通义千问团队直接提出了“大就是好”的暴论,并且让Qwen3坚定不移地沿着“Just Scale it”的扩展路径前进。

由此可见,大家都还在朝着“探索智能上限”出发。

02

百灵大模型加速涌现

据PHP中文网了解,过去一年里,平均7天就有一款高性能大模型诞生。可以说,国内不缺大模型。

但在参数和效率之间,能做到完美平衡的大模型却不多。

就拿万亿参数模型来说,模型变大了,往往会牺牲推理速度,推理速度上去了,准确率又很难达到。业界知名的旗舰款大参数模型,都能在推理能力和思考效率上做到很不错的平衡。

这个平衡点,被称之为帕累托最优,我们经常用多维基准测试的分数来量化对比。这次蚂蚁发布的Ling-1T在公开的对比榜单中,表现让人非常意外。

下图是Ling-1T在部分权威基准评测的表现,红色加粗代表Ling-1T的得分获得Top1,黑色加粗下划线表示Top2:

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹

我们重点关注的编程与数学推理(Coding & Math)两个维度上,Ling-1T表现非常亮眼,甚至多个得分超过DeepSeek。在知识理解方面,Ling-1T也比Kimi、GPT-5主干模型等的得分,高出几分。

这意味着,Ling-1T的深度思考能力和泛化能力,以及逻辑推理能力,都非常全面。因此,Ling-1T会非常擅长从事代码生成、软件开发、竞赛数学、专业数学、逻辑推理等场景。

但对于万亿参数模型来说,除了综合性能,还需要考虑一个问题:推理正确率。这就需要引入竞赛数学榜单AIME 25竞赛数学榜单AIME 25的挑战,Ling-1T的成绩如下:

连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹

Ling-1T在AIME 25测试中,与DeepSeek-V3.1-Terminus、Kimi-K2-Instruct-0905(开源)以及GPT-5-main、Gemini-2.5-Pro(闭源)这些旗舰模型对比,展示出更短的思考路径和更高的推理准确率,能做到支持128K长文本窗口处理能力,每个token做到约50B参数的激活量。

这样的成绩,源自蚂蚁百灵团队长时间的积累与创新。

ImgGood
ImgGood

免费在线AI照片编辑器

下载

依托于团队储备的二十万亿Token高质量文本语料训练,Ling-1T吃进了大量优质知识。在预训练阶段,Ling-1T的训练团队让由Ling Scaling Laws自我设置关键超参,简单地说,就是让大模型自我优化。

同时在强化训练阶段,加入了百灵团队原创的LPO策略优化算法,让模型回答得更对。

此外,团队还额外提出了“语法-功能-美学”的混合奖励机制,提高模型审美。下面这张是Ling-1T工程师绘制的模型架构图:

连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹

不止是刚发布的Ling-1T和9月30日发布的Ring-1T-preview,蚂蚁实际上已经形成了完整的百灵大模型家族。

从尺寸上,包含从160亿总参数到1万亿总参数的大语言模型产品矩阵;从模态上,包含了能看能听能说能画的,从理解到生成能统一的大模型;

从场景上,也形成了包括手机上可以运行的Ling-mini,还有能在中小企业服务器上部署的Ling-flash,以及云端可调用的Ling-1T。

连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹

这些模型,在过去一段时间,无论是社区榜单还是实际使用上,都得到了很多有效回应。

蚂蚁百灵团队开发的全模态模型Ming-lite-omni v1.5甚至在Hugging Face模型趋势榜(any to any)排到过第一的位置。

Ring-1T-preview发布完的第二天,就冲上了Hugging Face模型榜Text Generation总榜排名第三,排名第四的也是9月Ling团队发布的混合架构思考模型Ring-flash-linear-2.0。

图灵奖得主Yann LeCun(杨立昆)甚至点赞并评论“Impressive”(了不起),了解这位特立独行大佬的网友表示:“ LeCun愿意给LLM(大模型)说句好话不容易”。

一位苹果工程师量化完跑起来模型,评价蚂蚁百灵模型的性能“Getting closer to GPT-5 at home”(在本地部署上的性能接近GPT-5)。

这些技术从业者和开发者们的真实声音,给予了百灵模型非常正向的反馈。

03

探索AGI,亟需参与者们的共建意识

百灵团队,如此快速地跻身“万亿参数俱乐部”,背后跟蚂蚁的战略动作分不开。作为一家成立了20年的互联网公司”,蚂蚁在AI领域的投入一直是非常巨大的。

去年蚂蚁20周年时候,蚂蚁集团董事长井贤栋宣布:未来20年,蚂蚁要做一家科技驱动、创新驱动的公司。蚂蚁集团还提出了AI First战略,并将其与“支付宝双飞轮”和“加速全球化”一齐,并称为蚂蚁集团的三大战略。

而Ling-1T和Ring-1T-preview的出现,则是蚂蚁AI First战略持续加速的表现。

不选择闭源道路,而是选择了开源,足以证明,蚂蚁想干一件更长远的事:

通过技术开放的方式,不断迭代技术,构建一个真正开放的AGI生态。

根据AI科技评论了解,目前“万亿参数俱乐部”里能做到完全开源的,只有蚂蚁百灵的Ling-1T和Ring-1T-preview,以及Kimi的K2。

在大模型参数军备竞赛愈演愈烈的2025年,投入如此巨大之后,蚂蚁选择直接开源,看似让人费解。

但如果了解大模型开源背后的意图,就会明白,当Ling-1T和Ring-1T-preview这样万亿参数模型,公布了背后的训练数据、算法、模型,开发者可以直接利用这些“庞然大物”作为起点,快速构建复杂的应用程序,无需关心底层模型的训练。一个“使用-反馈-迭代”的正向循环,将极大推动技术共建,加快智能涌现。

这条"技术平权化"的道路,我们并不陌生。今年年初,DeepSeek的横空出世,已经为众多中国大模型头部玩家们指明了道路。

今年接任蚂蚁集团CEO的韩歆毅,曾在内部技术日上表达了蚂蚁AI的主张:

“大家说(蚂蚁)聚焦AI应用,还要不要做基础大模型,年初讨论的时候我们答案非常坚决,一定要,因为如果基于AI做服务和应用,就像训练一个人去做所有的事,追求智能上限,会让这个人更加聪明,能够做更多、更好的服务。我们很坚定去探索AGI、探索智能上限。”

蚂蚁还专门成立了InclusionAI开源组织,建设了大模型全技术,包含强化学习推理框架AReaL、多智能体框架AWorld等,这些技术也已经通过开源、开放合作的形式与行业共享共建,让创作者可以交流共创。

能看得出来,相比于登台唱戏,蚂蚁更加愿意把戏台搭好,AI的基础设施铺设好,才能吸引更多的人来共建,真正迈向AGI。

连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析的方法
数据分析的方法

数据分析的方法有:对比分析法,分组分析法,预测分析法,漏斗分析法,AB测试分析法,象限分析法,公式拆解法,可行域分析法,二八分析法,假设性分析法。php中文网为大家带来了数据分析的相关知识、以及相关文章等内容。

504

2023.07.04

数据分析方法有哪几种
数据分析方法有哪几种

数据分析方法有:1、描述性统计分析;2、探索性数据分析;3、假设检验;4、回归分析;5、聚类分析。本专题为大家提供数据分析方法的相关的文章、下载、课程内容,供大家免费下载体验。

292

2023.08.07

网站建设功能有哪些
网站建设功能有哪些

网站建设功能包括信息发布、内容管理、用户管理、搜索引擎优化、网站安全、数据分析、网站推广、响应式设计、社交媒体整合和电子商务等功能。这些功能可以帮助网站管理员创建一个具有吸引力、可用性和商业价值的网站,实现网站的目标。

759

2023.10.16

数据分析网站推荐
数据分析网站推荐

数据分析网站推荐:1、商业数据分析论坛;2、人大经济论坛-计量经济学与统计区;3、中国统计论坛;4、数据挖掘学习交流论坛;5、数据分析论坛;6、网站数据分析;7、数据分析;8、数据挖掘研究院;9、S-PLUS、R统计论坛。想了解更多数据分析的相关内容,可以阅读本专题下面的文章。

534

2024.03.13

Python 数据分析处理
Python 数据分析处理

本专题聚焦 Python 在数据分析领域的应用,系统讲解 Pandas、NumPy 的数据清洗、处理、分析与统计方法,并结合数据可视化、销售分析、科研数据处理等实战案例,帮助学员掌握使用 Python 高效进行数据分析与决策支持的核心技能。

82

2025.09.08

Python 数据分析与可视化
Python 数据分析与可视化

本专题聚焦 Python 在数据分析与可视化领域的核心应用,系统讲解数据清洗、数据统计、Pandas 数据操作、NumPy 数组处理、Matplotlib 与 Seaborn 可视化技巧等内容。通过实战案例(如销售数据分析、用户行为可视化、趋势图与热力图绘制),帮助学习者掌握 从原始数据到可视化报告的完整分析能力。

60

2025.10.14

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

42

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

79

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

234

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.5万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号