0

0

智谱首席科学家唐杰:很快将推出新一代模型 GLM-5

心靈之曲

心靈之曲

发布时间:2026-01-08 15:28:02

|

152人浏览过

|

来源于php中文网

原创

智谱首席科学家唐杰:很快将推出新一代模型 glm-5

晚点独家获悉,1 月 8 日智谱上市当天,清华大学计算机系教授、智谱创立发起人兼首席科学家唐杰发布内部信,宣布很快将推出新一代模型 GLM-5。

唐杰说,今天是 “智谱生命中激动人心的一天”。他没有直接回应大模型公司的商业模式争议或给出智谱 2026 年商业化目标,但强调,真正 “有人用”,能帮到更多的人的理论、技术或产品才是智谱在追逐 AGI 路上的重要成就。

除了 GLM-5 的发布,内部信还介绍了 2026 年智谱聚焦的三个技术方向,包括全新的模型架构设计,更通用的 RL(强化学习)范式以及对模型持续学习与自主进化的探索。它们均围绕基础模型能力提升展开。

天工大模型
天工大模型

中国首个对标ChatGPT的双千亿级大语言模型

下载

以下是唐杰公开信全文:

用“咖啡”的精神做 AGI 在香港科技大学做短期访问时,和杨强教授在实验室一楼的咖啡厅偶然碰到。我说这几天咖啡喝的太多,感觉有点上瘾,需要戒一戒了。 杨老师说:“为什么要戒呢?上瘾也不一定是坏事呀,如果我们做研究能像喝咖啡一样上瘾,又何愁研究做不好呢?”。 是啊,“上瘾”便是人生的精彩所在,无论是研究,还是其它事,只要专注、努力,就一定能做好。 “让机器像人一样思考”是智谱自始至终的愿景和理想,也是智谱人持之以恒奋斗的唯一目标。 2018年底,在人脑认知的双系统理论的启发下,我们设计了一个拥有快思考+慢思考的机器“认知”系统。2019年我们正式成立智谱,开始尝试探索AGI,实现“让机器像人一样思考”的宏伟愿景。 这里的最大挑战可能是直到今天也没有人包括我们自己能够给出一个准确的AGI定义以及如何实现AGI的技术路径,也许这正是探索AGI的魅力所在。 我们处在历史上一个从未有过的非凡时刻,一个技术再一次颠覆式地改变世界的时刻。大模型不仅是通用人工智能的关键底座,更有望成为驱动生产力变革的核心引擎。 回顾一路走来的历程,我们能走到今天的一个重要原因是,我们始终坚持做让用户真正用得上的AI技术。只有真正有人用的理论、技术或产品才能最终成为AGI之路上的重要成就。当然,不是所有的创新都能成功,我们也有很多有风险的项目都以败告终,但这也往往教会了我们从失败中汲取力量,这让智谱变得更强大,对AGI的理解也更深刻。更重要的是,这让我们注重实用的同时,不再只盯着短期收益:帮助用户、帮助国家、帮助全球科技进步成为智谱的长期目标。 2020年,我们推出了自己的大模型算法架构GLM,并开始尝试训练100亿参数的基座模型,模型很成功,得到包括美团在内的很多企业试用,这是一个很大胆的尝试,因为当年还是BERT模型横行的小模型时代。但当时的成功距离我们梦想中的AGI还遥不可及。部分原因是模型的知识量还不够大,而另一部分原因则是模型还不会像人一样推理思考。 2021到2022年,大模型发展并不顺利,大多数人并不接受“让机器像人一样思考”这种类似登月一样的疯狂计划,也不认为这可能是个非常大的技术变革机会,或者害怕失败。我们还是决定赌一把,用更多数据训练一个1300亿参数的大模型。 这个决策很难,因为还不能影响公司总体发展节奏。为此我们成立了两个专门的小型创新团队,一个负责模型训练,这就是后来公司的GLM三剑客;另一个则独立负责MaaS平台建设,当时这两个小团队可能互相都不知道对方的存在。2022年中,GLM-130B训出来了,其中很多精细的设计引起了全球关注;同时MaaS平台上线,也就是现在的bigmodel.cn,有了第一批真正的API用户。随后,我们正式在公司成立了AI院,专注下一代大模型研发;成立MaaS平台部,负责对外提供大模型API服务。有时候,我们需要找到有足够大胆梦想的人(甚至专门投入更多精力去找这样的人),一个大胆宏伟的目标也许决定了一半的成功。 2023年,我和国内一个顶尖的创业前辈(其实他比我小不少)聊AI可能对未来的改变,我们一致认为AI会颠覆搜索、颠覆浏览器,会给每个人带来一个全新的AI助手;甚至有了这个AI助手后,我们也不再需要应用商店,反之我们可能需要为AI打造一个“API商店”,可能这个API商店的底层逻辑就是颠覆现有的操作系统;随后,也许更重大的颠覆是计算机本身,因为届时我们可能不是需要一个给人用的计算机了,而是适合AI的计算机。 这个变革发生的意义将是无穷的,因为它将彻底重塑计算机底层逻辑,挑战计算机界用了80年的奠基石——冯诺伊曼体系。聊到这里的时候,我们不约而同觉得我们对AI的投入还太少了,还不够All-in。 现实也是残酷的,All-in不仅需要坚定的信念,也需要极其强大的资金、团队支持,更需要精准的预判。2023到2024年是全球大模型的爆发年,大厂纷纷“All-in”大模型,国内也掀起创业高潮,百模大战、各种AI助手层出不穷。 我们那时候可能也有失误,有技术的也有商业的。现在复盘,可能原因是我们自己在追逐AGI的路上有迷失的时候,会被眼前的短期收益、短期热闹所迷惑。AGI是个技术变革,技术是平权的,是公开透明的,是要让所有人都能用的上并从中获益。 随后DeepSeek的出现警醒了我们,文锋2023年创业的时候和我聊过,当时我并没有意识到他对AGI如此执着,感谢他带给我很多不一样的思考。选择对AGI技术的执着追求,不断探索AGI的上界,同时精准的未来预判成为下一步智谱需要不断改进和升华的地方。这两年让我们经历很多,更重要的是“强化学习”了我们对AGI、对公司治理和商业竞争的认知。 过去一年,我们其实做了一次比较系统的"强化"。我们喊出了“定力”与“成就”的口号,要求大家保持定力,不骄不躁,不妄自菲薄,成就智谱每个人手上的事,成就自己。 年初的时候,一切都那么难,模型效果达不到预期,全国上下价格战,杀出重围需要找到一个精准的突破口。 我们坚守了阵地,终于找到Coding作为突破口。 如果说4月份GLM-4.1的发布像是象征性的试探,那7月底的GLM-4.5的发布几乎更是一场决战,所有技术、平台、业务团队捏一把汗,日日夜夜加班,我们终于迎来一场久逢的胜利,接着GLM-4.6和GLM-4.7让我们模型能力方面和那些国际顶尖模型并驾齐驱。我们的GLM-4.7 在包括AA、竞技场等多项评测中获得开源模型、国产模型的SOTA,来自用户侧的模型Coding和Agent真实体感也非常好,全球184个国家的15万开发者朋友使用GLM Coding Plan,GLM-4.7发布后MaaS平台ARR年化收入超过5亿(其中海外收入超过2亿),从2000万到5亿(25倍)仅用了10个月。 总体来说,在模型侧我们如期完成了年初定下的4月发一个“稳住阵脚”的模型、年中发一个“上牌桌”的模型(即成为 one of the best)、年底发一个Top 1的模型的整体战略。这为我们后续继续冲刺AGI技术高地打下重要根基。 我们的「主权AI」也迎来全新进展:马来西亚国家级MaaS平台基于Z.ai开源模型构建,GLM成为马来的国民级模型。主权AI出海是我参加了总书记座谈会后被总书记的“中国AI要走出国门”感召,但说实话我也不知道应该怎么做,我们的国际团队敢拼敢打敢成事,完成中国大模型出海从无到有的一个里程碑。业务方面,我们敢于竞争,再次完成了年度超一倍的营收增长目标。 在种种困难和机遇并存的情况下,今天,我们以一种几乎不可能的姿势成为了全球大模型第一股,这表明了市场对我们技术与商业价值的认可。“Make impossible possible”—— 还记得我们曾经说过的吗? 这一年来,蜕变最大的可能是不是智谱,而是一群一线的年轻人,他们把很多看起来不可能的事,真的做成了。 2026年,公司的目标是成为国际领跑的大模型企业。过去一年大家讨论大模型,很多在聊应用、聊生态。 真正决定下一阶段格局的,还是更底层的两件事——模型架构与学习范式。同时,应用侧可能会出现一个清晰的方向:AI替代不同工种/任务的爆发年。 基于这一判断,我们在 2026 年将聚焦于: GLM-5。很快GLM-5将跟大家见面,通过进一步的Scaling和很多全新技术改进,相信GLM-5会带给大家很多新奇体验,让AI帮大家完成更多真实任务。 全新的模型架构设计。已经广泛使用近10年的Transformer架构已经显露出一些不足,包括超长上下文的计算开销、记忆机制、更新机制等。这些都需要探索全新的模型架构,发现新的Scaling范式,通过芯片-算法协同设计等技术提高计算效率。 具有更强泛化能力的RL。当前主流的RLVR范式虽然在数学和代码领域取得了成功,但其依赖人工构造可验证环境的局限性也日益凸显。今年需要探索更通用的RL范式,支持AI不仅能在人类指令下完成特定任务,更要能理解并执行跨越数小时甚至数天的长时程任务。 最具挑战性的探索,是开启通往持续学习与自主进化的道路。当前所有主流的AI模型,其智能在部署后基本上是静态的。它们通过一次性的、耗资巨大的训练过程获得知识,然后在应用中逐渐过时。这与人脑能够从与世界的持续交互中不断学习、进化的方式截然不同。我们需要对下一代学习范式——在线学习(Online Learning)或持续学习(Continual Learning)进行前瞻性布局。 我们不是一家传统公司,我们也不打算成为其中之一。我们希望成为一家一切皆有可能发生的AI原生公司:打造不断提升智能上界的下一代模型,研发AI为核心的产品服务用户。我们要让AI成为每个人最得力的助手,帮助我们完成任务。我们认为还需要利用AI参与治理公司降本增效、做到更公平。 随着时间的推移,一个公司往往会习惯于做同样的事情,做渐进式的改进,这会限制我们的创新力。但在AI时代,一切都是变革式的,我们需要有点“不舒服”才能保持创新力,才能提出革命性的想法推动下一个大的增长领域。 因此,我们在智谱内部设立了一个全新部门X-Lab,这个部门将致力于用开放的方式把更多年轻人聚集,做前沿性探索,包括全新的模型架构、新的认知范式、还将孵化新项目,不局限于软件或是硬件。同时,我们也会扩大对外投资,不仅仅是战略联合已有的被投企业,也要开辟新的版图,让整个行业贯通起来,让整个生态一起繁荣。在X-Lab,每个人的使命就是做完全颠覆式的创新,最终回归到AGI的主线。 今天是智谱生命中激动人心的一天,是智谱历史上一个重要的里程碑,更是智谱一个全新时代的开启。我很喜欢Z.ai这个品牌,Z是字母表中的最后一个,代表终极境地,我们希望在AGI的探索历程上能走到智能的终极境地,这是我们努力的目标。我们非常兴奋: - 有一个雄心勃勃、改变世界的事业 - 着眼长远利益、放眼未来 - 更加专注,探索 AGI 的本质 - 用 AI 赋能伟大的企业家和公司的蓬勃发展 - 用更精准的预判抓住企业发展机遇 - 最终,希望我们能够为人类社会带来不一样的 AI,切实推动人类福祉的进步。 这是一个无与伦比的开心时刻,这种开心不是一时的多巴胺,而是探索 AGI 之路上积累起来的内啡肽,让我们更加专注,脚踏实地,持续前行! 唐杰 2026.1.8

源码地址:点击下载

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

497

2023.08.14

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

38

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

83

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

97

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

223

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

458

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

169

2026.03.04

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

246

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
SQL 教程
SQL 教程

共61课时 | 4.3万人学习

C++教程
C++教程

共115课时 | 21.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号