在ICLR 2024这场演讲中，智谱AI首次公开神秘项目「GLM-zero」

WBOY

发布时间：2024-05-11 15:28:37

1228人浏览过

来源于机器之心

转载

在机器学习社区中，iclr (国际学习表征会议)被评为“年轻”的学术会议，它由深度学习巨头、图灵奖得主yoshua bengio和yann lecun在2013年牵头举办。但iclr很快获得了研究者的广泛认可，并且在ai圈拥有了深度学习会议“无冕之王”的称号。

目前，ICLR是机器学习领域最大、水平最高的会议之一，与ICML和NeurIPS并称为机器学习领域的三大顶会。从影响力上看，ICLR长期处于Google Scholar全球所有学术中期刊、顶会的前十名。

今年，ICLR 已经来到了第十二届。5 月 7 日，ICLR 2024 在奥地利维也纳会展中心开幕。

可能是受到大模型技术浪潮的推动，无论是参会人数、论文提交量还是现场参会规模，ICLR 2024 的热度相比往年都有极大的提升。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

从深度学习的兴起，到生成式 AI 带来的新一波浪潮，ICLR 算是证明了人工智能领域十多年来的发展史。在这个过程中，ICLR 也从第一届只有二十几篇接收论文的小型会议成长为投稿量超过七千的顶会。

^{历届 ICLR 论文数据图。图源：https://papercopilot.com/statistics/iclr-statistics/}

大会首日的开幕式公布了ICLR 2024的一些数据和奖项：比如，在走过第一个十年后，ICLR 迎来了自己的首届时下验证奖，获奖研究《Auto-Encoding Variational Bayes》（VAE）对于今天深度学习和生成模型领域影响深远。

值得关注的是，本次大会上共有七场受邀演讲，Meta、谷歌等科技巨头悉数在列。

其中一场特邀演讲来自中国的 GLM 大模型团队，主题为《The ChatGLM's Road to AGI》。这也是国内鲜有的，大模型相关 Keynote 登上全球学术顶会的讲台。

大模型时代，AGI 会加速到来吗？

在演讲中，GLM 大模型团队回顾了近年来语言模型领域的技术演进与方向碰撞。

大模型技术显著提升了 AI 在各种任务上的表现，例如自然语言理解和文本生成、图像处理、多模态建模，催生了大众对 AGI 的真切期待。从技术上说，这些神奇能力与模型的「智能涌现」分不开，而「涌现」的底层逻辑是「Scaling Law」。

Open AI 的 Jason Wei 2022 年在谷歌工作期间，与 Jeff Dean 等人共同撰写了关于大模型涌现能力的论文，揭示了重要结论：当模型较小时，性能是随机的，一旦模型规模到达一定阈值，性能就会显著超越随机。一般来说，模型越大，能力越强。

对于这种由量变引起的质变现象，人们称之为「涌现（emergence）」。如果「涌现」是真实存在的，那么 AGI 的实现可以依靠模型体量的增加而逼近。

但斯坦福团队的一项研究却提出了相反的观点：大模型能力是否涌现与任务的评价指标强相关，并非模型行为在特定任务和规模下的基本变化，换一些更连续、平滑的指标后，涌现现象就不那么明显了，而是更接近线性。

「它有连续性，但没有能力涌现。」这项具有警示性的研究还获得了 NeurIPS 2023 最佳论文奖。

论文链接：https://arxiv.org/pdf/2304.15004.pdf

目前，学术界对上述命题仍然存在争论。不过，GLM 大模型团队今年 3 月的一篇论文从预训练损失的角度重新讨论了模型涌现能力 —— 只有当预训练损失低于某个阈值时，模型才具有该能力。这为此后的研究提供了新的视角：Loss 才是涌现的关键，而非模型参数。

论文地址：https://arxiv.org/pdf/2403.15796.pdf

在近来的大模型浪潮中，GLM 大模型团队备受关注。去年 6 月，在科技媒体 The Information 的盘点中，GLM 大模型团队所属的智谱 AI，被视为最有可能成为「中国 OpenAI」的 5 家企业之一。

从 GLM 大模型团队的下一阶段目标中可以看出，除了「涌现」命题，GLM 大模型团队对于通往 AGI 的路径还有很多思考。

GLM 大模型团队表示，文本仍然是最关键的基础，而下一步应该把文本、图像、视频、音频等多种模态混合在一起训练，变成一个真正原生的多模态模型，然后还可以开发面向现实任务的虚拟助理，甚至是以大模型为中心的通用计算系统。

‎ Gemini Storybook

Google Gemini推出的AI绘本生成工具

下载

在这一设想中，通用计算系统可基于已有的 All-Tools 能力，再加上内存记忆 memory 和自我反馈 self-reflection 能力，模仿人类的 PDCA 机制，即 Plan-Do-Check-Act 循环，最终实现自我提升。

与此同时，如何大模型拥有人类的「无意识」学习机制，也是 GLM 大模型团队在探索的方向。

「最有希望成为中国 OpenAI」的团队，如何瞄准 AGI？

自 2019 年成立以来，GLM 大模型团队便开始了大语言模型的探索，并选择走开闭源并存的发展路线。

在整体布局上，GLM 大模型团队已经完成了全面对标 OpenAI，从基座模型到对话、文生图、代码、检索增强和视觉模型，包括 GLM、ChatGLM、CogView、CodeGeeX、WebGLM 以及 GLM-4V。这些模型的预训练过程中少不了针对中文语料的大量优化，这也是国产大模型发挥本土化优势的关键。

GLM 大模型团队在 2020 年后开始显现成果。从研发 GLM 预训练架构、到训练完成百亿参数的 GLM-10B、再到 2022 年千亿参数超大规模预训练模型 GLM-130B 的诞生，他们开始围绕这一强大的基座模型持续深拓。

2023 年 3 月，与 GPT-4 同一时间，GLM 大模型团队推出了基于千亿基座模型的对话模型 ChatGLM，理解用户、遵循指令、回答问题的效果显著提升。同时选择开源中英双语对话模型 ChatGLM-6B，实现单张消费级显卡上的本地部署。随后的 6 月和 10 月，GLM 大模型团队又迎来第二代和第三代 ChatGLM，保持三到四个月一次的模型迭代频率。

随着今年初新一代基座大模型 GLM-4 的到来，GLM 系列模型实现了性能比肩 GPT-4，自然语言、多模态、Agent 能力全方位提升的同时推理速度更快、成本更低。

目前，GLM 系列大模型的研究成果已经涵盖了数学、文生图、图像理解、视觉 UI 理解、Agent 等领域。以 ChatGLM-Math 为例，该模型通过独特的「Self-Critique」迭代训练方法和自我反馈机制，实现了 LLM 的数学能力的进一步强化。

论文地址：https://arxiv.org/pdf/2404.02893

与此同时，CogView 文生图模型、CodeGeeX 代码模型、CogVLM 多模态理解模型、GLM-4V 多模态大模型和 All-Tools 功能以及 AI 助手智谱清言也在持续进步，比如基于 CogVLM 开发的具有视觉 Agent 能力的模型 CogAgent、更快更精细的文生图模型 CogView3、让多模态模型具有操作链的通用视觉语言模型 CogCoM。

快速迭代的大模型能力，让研究者们更加期待 GLM 大模型团队未来的进一步动作。在演讲中，GLM 大模型团队深入解读了 GLM 系列大模型下一阶段面向 AGI 的三个探索方向。

第一，GLM-4 的后续升级版本，即 GLM-4.5 及其升级模型，它们将基于超级认知 SuperIntelligence 和超级对齐 SuperAlignment 技术打造。

在持续提升文本能力的基础上，GLM 大模型团队计划将文本、图像、视频、音频等多种模态混合在一起训练，构建真正原生的多模态模型，同时超级对齐 SuperAlignment 技术协助将提升大模型的安全性。

第二，提出 GLM-OS 概念，即以大模型为中心的通用计算系统，旨在解决更加复杂的问题。

在 ICLR 现场，GLM 大模型团队详细阐述了 GLM-OS 的实现方式：基于已有 All-Tools 能力加上内存记忆 memory 和自我反馈 self-reflection 机制，GLM-OS 有望实现模仿人类的 Plan-Do-Check-Act 循环。首先做出计划，然后初步尝试形成反馈，基于反馈结果调整规划，然后再行动以期达到更好的效果。大模型依靠 PDCA 循环机制形成自我反馈和自我提升 —— 恰如人类自己所做的一样。

第三，GLM 大模型团队在现场首次公开了名为「GLM-zero」的技术项目。

这一项目是在 2019 年开展的，旨在研究人类的「无意识」学习机制。该机制是人类认知能力的重要组成部分，包括自我学习 self-instruct、自我反思 self-reflection 和自我批评 self-critics。

「当人在睡觉的时候，大脑依然在无意识地学习。」GLM 大模型团队表示，人脑中存在着反馈 feedback 和决策 decision-making 两个系统，分别对应着大模型和内存记忆两大部分，GLM-zero 的相关研究将进一步拓展人类对意识、知识、学习行为的理解。

GLM 大模型团队认为，尽管还处于非常早期的研究阶段，但 GLM-zero 可以视为通向 AGI 的必经之路。

什么是“人形机器人”？特斯拉Optimus与产业供应链全解析

AI生成活动现场的即时新闻稿

贾跃亭：法拉第未来当前股价被严重低估目标价5美元

内存飙升成本暴涨汽车会涨价还是减配？

10家中国车企入围入围财富世界500强比亚迪进前百

相关专题

http与https有哪些区别

http与https的区别：1、协议安全性；2、连接方式；3、证书管理；4、连接状态；5、端口号；6、资源消耗；7、兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

2953

2024.08.16

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

109

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

326

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

105

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

108

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

236

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

659

2026.03.04

热门下载

网站特效

网站源码

网站素材

前端模板