价格战之后，智谱来到商业化的下一站

絕刀狂花

发布时间：2025-01-09 17:11:55

304人浏览过

来源于php中文网

原创

「php中文网(公众号：php中文网)消息」刚刚过去的 5 月里，中国 ai 大模型领域掀起一场价格战，激起行业热议。

这次价格战的两股势力分别是互联网大厂和大模型创业公司，以字节、阿里云、腾讯和智谱为主要参战代表。

面对这场突如其来的价格战，大家讨论最多的是，创业公司很难承受得住这样的比拼。

相比互联网大厂底子厚、钱多，大模型创业公司跟大厂打价格战，风险很大，一些人认为「价格战」是大模型玩家的淘汰加速赛。

价格战的目的是抢夺用户，但模型能力才是用户留存的主要因素——钱花了、降低了用户使用成本、噱头有了、吸引了新用户同时也维护住了老用户，但最终的目标，「用户留存」依然不会有多少，反倒因小失大。

立即进入“豆包AI人工智官网入口”；

立即学习“豆包AI人工智能在线问答入口”；

在过去的商业长河中，价格战并不少见，当一项技术走向成熟，随着大量玩家入局，竞争加剧，「价格战」往往是殊途同归。

但对比过去的技术浪潮，大模型的价格战似乎开始得早了些。

大模型领域的星辰大海是 AGI，在看到最后的曙光之前，各大模型公司最重要的事情是积累更多筹码、努力留在牌桌上：将大部分资源放在模型能力突破这条主线上，一边努力探索稳定的商业模式，趁早拥有造血能力。

价格战的背后

5 月，智谱将入门级产品 GLM-3-turbo 价格从 5 元每百万 tokens 降至 1 元，降幅达到了80%。

此时每百万 tokens 价格还没下「元」的范围，直到大厂进入。

字节率先点火，宣布将豆包主力模型（豆包通用模型pro-32k）定价为 0.0008 / 千 tokens（即0.8元/百万tokens），做到了「从分到厘」的极致低价，震惊整个行业。

随即，阿里云不甘示弱，将通义千问 GPT-4 级主力模型 Qwen-Long 的输入价格从 0.02 元/千 tokens 降至 0.0005 元/千 tokens，直降 97%，意味很明显，就是要比字节更低。

在行业还没从这突然起飞的价格战中反应过来，百度直接击穿底价，宣布文心大模型两大主力模型全面「免费」，整场价格战被推向高潮。随后科大讯飞、腾讯也加入战局、宣布全面下调大模型价格。

纵观此次价格战，由于大厂的加入，不失疯狂，但仍然保持理智——在百度直接用「免费」击穿底价后，大模型初创公司并没有跟进，此次价格战最终就止步于大厂，参战的几方也都没有恋战，一轮之后便熄火。

用户增长不确定，盲目价格战使得大模型厂商的风险敞口不断扩大，由此带来打价格战的最坏情况：本就不大的盈利空间被不断压缩。

其实，整个大模型行业，包括国外OpenAI、谷歌都在降价，主要原因：

（1）模型能力正在趋同，自 GPT-4发布以来，大家都在朝 GPT-4 看齐，但谁都没有突出优势。能力趋同之下，不得不放弃收费，靠降价/免费来争夺用户，保住底盘，甚至 OpenAI 将 5 月发布的GPT-4o 免费。

（2）大模型的边际收益或许正在持续走低。有研究称，从 GPT-2 到 GPT-4 甚至 GPT-4 Turbo 的性能变化，已经出现了性能递减的迹象。在收益递减的背景下，意味着处理同样的任务，开发者的实际成本是上升的。为了保住用户，大模型厂商不得不推出有吸引力的对策，包括提供更小的蒸馏模型，以及直接降价。

回到国内大模型厂商，模型能力如果达不到 OpenAI 的水平，一味拼价格并不是一个好的策略，甚至会被困住。

一位大模型创业者称，陷入价格战会让那些技术不够领先、商业模式不清晰、融资能力跟不上的公司迅速被淘汰。

因此，在这种情况下，要实现最终的 AGI，中国大模型厂商必须保存实力，探索健康的发展模式：努力实现模型技术突破、探索稳定的商业模式才是破局之道。

而放眼整个国内，唯有智谱在这两个维度都发展得比较平衡。

AI 国家队的筹码

粗暴点说，当下大模型公司遇到的大多数问题，包括模型表现不好、找不到超级应用、落地场景少、用户留存差、商业模式不清晰等都可以归结到模型技术还有待更多突破。

因此，技术上追赶 OpenAI ，依然是中国大模型当下最迫切的任务。

今年 1 月，智谱推出第四代基座大模型 GLM-4，性能逼近 GPT-4，智谱取得的这一进展比国内其他大模型厂商都早，可以说一直以来，国内大模型的技术突破主要看智谱。同时，过去一年里智谱以平均每 3 个月迭代一次的速度更新模型能力，领先于其他厂商。

各大模型公司参与价格战的目的是抢占用户，基础模型之外，开源生态也是大多数厂商不敢轻易放弃的一块。

过去一年里，智谱的ChatGLM-6B 开源模型受到了广泛关注和认可。今天召开的智谱小型品牌活动OpenDay上，智谱又推出了第四代 GLM 系列开源模型：GLM-4-9B，包括：基础版本 GLM-4-9B（8K）、对话版本 GLM-4-9B-Chat（128K）、超长上下文版本 GLM-4-9B-Chat-1M（1M）和多模态版本 GLM-4V-9B-Chat（8K）。

OmniAudio

OmniAudio 是一款通过 AI 支持将网页、Word 文档、Gmail 内容、文本片段、视频音频文件都转换为音频播客，并生成可在常见 Podcast ap

下载

和之前发布的开源模型ChatGLM-6B相比，GLM-4-9B参数略多，预训练计算量增加了 5 倍，但仍然能在大多数用户的显存上运行。

经过技术升级后，GLM-4-9B 模型具备了更强大的推理性能、更长的上下文处理能力、多语言、多模态和All Tools等突出能力。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

价格战之后，智谱来到商业化的下一站

基于强大的预训练基座，GLM-4-9B 的模型中英文综合性能相比 ChatGLM3-6B 提升了 40%，尤其是在中文对齐能力 AlignBench，指令遵从 IFeval，工程代码 Natural Code Bench 方面都取得了非常显著的提升。

GLM-4-9B对比训练量更多的 Llama 3 8B 模型丝毫没有逊色，英文方面有小幅领先，中文学科方面更是有着高达 50% 的提升。

价格战之后，智谱来到商业化的下一站

GLM-4-9B 模型的上下文从 128K 扩展到了 1M tokens，这意味着模型能同时处理 200 万字的输入，大概相当于 2 本红楼梦或者 125 篇论文的长度。GLM-4-9B-Chat-1M 模型在 1M 的上下文长度下进行了“大海捞针”实验，展现出了出色的无损处理能力。

价格战之后，智谱来到商业化的下一站

同时，GLM-4-9B 支持包括汉语、英语、俄语、西班牙语、德语、法语等多达 26 种语言。

过去智谱通过开源积累了一批用户，其开源模型累计下载量高达 1600 万次，成为全球大模型开源生态中一股不可忽视的中国力量，第四代GLM-4-9B 开源模型的推出，进一步巩固了智谱在开源侧的影响力。

在当前大模型发展阶段，持续训练出好的基座模型+持续开源才是吸引用户、创建生态最稳健的策略，从而进一步实现用户留存。

放眼国内，智谱不仅在模型能力上不断取得突破，持续推出更先进的基座模型，在 B 端商业化探索上也至少领先行业半年：智谱从去年 3 月开始探索 B 端商业化（MaaS 模式），根据智谱此前官方消息，过去一年，智谱已经有2000+生态合作伙伴、1000+大模型规模化应用、与200多家企业进行了深度共创。

目前，智谱 MaaS 开放平台已经拥有 30 万企业客户和开发者、400 亿 Tokens 日均调用量、过去6个月API每日消费量增长了50倍以上。

在此次价格战中，智谱并没有盲目跟进，而是迅速基于 MaaS（模型即服务）商业策略，并往后走到下一站——卷用户体验。

智谱GLM大模型首次推出一键微调，包括LoRA微调和全参微调。用户只需要三步，准备训练数据、创建微调任务、部署微调模型就能拥有自己的私有模型。

价格战之后，智谱来到商业化的下一站

使得用户可以用更低的成本访问和门槛使用大模型，也促进了优秀的 AI 应用爆发。OpenDay 上，小米小爱总经理、AiPPT创始人等到场，讲述了基于GLM大模型做企业应用及创业项目的经历。

对于价格战，智谱CEO张鹏的态度是：打价格战，我们不怕，我们不仅打得起，而且不亏钱。这种底气是基于智谱基于自身强大的 GLM 模型能力，以及逐步完善的商业体系、团队的商业策略。

近期针对MaaS 平台智谱做出一系列价格下调。

价格战之后，智谱来到商业化的下一站

张鹏表述，此次价格调整依然是智谱基于技术突破、效率提升和成本控制的综合结果，是符合自身商业化策略，合理的价格调整。

后记

当价格战最猛的时候，有人感叹“大模型这么不值钱吗”“大模型卖出了白菜价”，盲目价格战其实是对大模型行业的一种损伤——压缩了大模型厂商的盈利空间，打乱了大模型行业健康发展的节奏，更严重的是，一旦整个行业被拉进价格战的漩涡，中国大模型将会偏离主要目标，离 AGI 越来越远；同时价格战也加重了外界对大模型的质疑，怎么花费如此昂贵成本训练出来的大模型，突然就这么便宜了呢？这些厂商是不是闹着玩呢？对大模型的价值产生怀疑。

好的模型应该物有所值，一个行业健康发展的前提是，既能让大多人都能用得起大模型，实现技术普惠，也能让大模型厂商有盈利的空间。

价格战往往只是拍拍脑袋就能做的决策，而对于当下中国大模型来说，探索多样化的发展路径，并且沿着这些路径坚持下去，才是中国大模型破局之道。

而对于当前的大模型玩家来说，如何在有限的资源、时间里，积累更多的筹码：融资、领先的技术、稳定的商业模式，才能继续留在牌桌上，拥有更多机率实现共同的 AGI 星辰大海。

价格战之后，智谱来到商业化的下一站

Gemini 3.1 Pro— 谷歌推出的最新AI模型，主打复杂推理

Gemini 3 Deep Think— 谷歌推出的专用推理模型

PaperBanana— 北大联合谷歌推出的AI学术插图自动生成框架

RynnBrain— 阿里达摩院开源的具身智能大脑基础模型

免费AI翻译哪家强？DeepSeek/豆包/谷歌翻译横向对比

相关专题

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

276

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

105

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

230

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

619

2026.03.04