0

0

价格战之后,智谱来到商业化的下一站

絕刀狂花

絕刀狂花

发布时间:2025-01-09 17:11:55

|

304人浏览过

|

来源于php中文网

原创

「php中文网(公众号:php中文网)消息」刚刚过去的 5 月里,中国 ai 大模型领域掀起一场价格战,激起行业热议。

这次价格战的两股势力分别是互联网大厂和大模型创业公司,以字节、阿里云、腾讯和智谱为主要参战代表。

面对这场突如其来的价格战,大家讨论最多的是,创业公司很难承受得住这样的比拼。

相比互联网大厂底子厚、钱多,大模型创业公司跟大厂打价格战,风险很大,一些人认为「价格战」是大模型玩家的淘汰加速赛。

价格战的目的是抢夺用户,但模型能力才是用户留存的主要因素——钱花了、降低了用户使用成本、噱头有了、吸引了新用户同时也维护住了老用户,但最终的目标,「用户留存」依然不会有多少,反倒因小失大。

立即进入豆包AI人工智官网入口”;

立即学习豆包AI人工智能在线问答入口”;

在过去的商业长河中,价格战并不少见,当一项技术走向成熟,随着大量玩家入局,竞争加剧,「价格战」往往是殊途同归。

但对比过去的技术浪潮,大模型的价格战似乎开始得早了些。

大模型领域的星辰大海是 AGI,在看到最后的曙光之前,各大模型公司最重要的事情是积累更多筹码、努力留在牌桌上:将大部分资源放在模型能力突破这条主线上,一边努力探索稳定的商业模式,趁早拥有造血能力。

价格战的背后

5 月,智谱将入门级产品 GLM-3-turbo 价格从 5 元每百万 tokens 降至 1 元,降幅达到了80%。

此时每百万 tokens 价格还没下「元」的范围,直到大厂进入。

字节率先点火,宣布将豆包主力模型(豆包通用模型pro-32k)定价为 0.0008 / 千 tokens(即0.8元/百万tokens),做到了「从分到厘」的极致低价,震惊整个行业。

随即,阿里云不甘示弱,将通义千问 GPT-4 级主力模型 Qwen-Long 的输入价格从 0.02 元/千 tokens 降至 0.0005 元/千 tokens,直降 97%,意味很明显,就是要比字节更低。

在行业还没从这突然起飞的价格战中反应过来,百度直接击穿底价,宣布文心大模型两大主力模型全面「免费」,整场价格战被推向高潮。随后科大讯飞、腾讯也加入战局、宣布全面下调大模型价格。

纵观此次价格战,由于大厂的加入,不失疯狂,但仍然保持理智——在百度直接用「免费」击穿底价后,大模型初创公司并没有跟进,此次价格战最终就止步于大厂,参战的几方也都没有恋战,一轮之后便熄火。

用户增长不确定,盲目价格战使得大模型厂商的风险敞口不断扩大,由此带来打价格战的最坏情况:本就不大的盈利空间被不断压缩。

其实,整个大模型行业,包括国外OpenAI、谷歌都在降价,主要原因:

(1)模型能力正在趋同,自 GPT-4发布以来,大家都在朝 GPT-4 看齐,但谁都没有突出优势。能力趋同之下,不得不放弃收费,靠降价/免费来争夺用户,保住底盘,甚至 OpenAI 将 5 月发布的GPT-4o 免费。

(2)大模型的边际收益或许正在持续走低。有研究称,从 GPT-2 到 GPT-4 甚至 GPT-4 Turbo 的性能变化,已经出现了性能递减的迹象。在收益递减的背景下,意味着处理同样的任务,开发者的实际成本是上升的。为了保住用户,大模型厂商不得不推出有吸引力的对策,包括提供更小的蒸馏模型,以及直接降价。

回到国内大模型厂商,模型能力如果达不到 OpenAI 的水平,一味拼价格并不是一个好的策略,甚至会被困住。

一位大模型创业者称,陷入价格战会让那些技术不够领先、商业模式不清晰、融资能力跟不上的公司迅速被淘汰。

因此,在这种情况下,要实现最终的 AGI,中国大模型厂商必须保存实力,探索健康的发展模式:努力实现模型技术突破、探索稳定的商业模式才是破局之道。

而放眼整个国内,唯有智谱在这两个维度都发展得比较平衡。

AI 国家队的筹码

粗暴点说,当下大模型公司遇到的大多数问题,包括模型表现不好、找不到超级应用、落地场景少、用户留存差、商业模式不清晰等都可以归结到模型技术还有待更多突破。

因此,技术上追赶 OpenAI ,依然是中国大模型当下最迫切的任务。

今年 1 月,智谱推出第四代基座大模型 GLM-4,性能逼近 GPT-4,智谱取得的这一进展比国内其他大模型厂商都早,可以说一直以来,国内大模型的技术突破主要看智谱。同时,过去一年里智谱以平均每 3 个月迭代一次的速度更新模型能力,领先于其他厂商。

各大模型公司参与价格战的目的是抢占用户,基础模型之外,开源生态也是大多数厂商不敢轻易放弃的一块。

过去一年里,智谱的ChatGLM-6B 开源模型受到了广泛关注和认可。今天召开的智谱小型品牌活动OpenDay上,智谱又推出了第四代 GLM 系列开源模型:GLM-4-9B,包括:基础版本 GLM-4-9B(8K)、对话版本 GLM-4-9B-Chat(128K)、超长上下文版本 GLM-4-9B-Chat-1M(1M)和多模态版本 GLM-4V-9B-Chat(8K)。

OmniAudio
OmniAudio

OmniAudio 是一款通过 AI 支持将网页、Word 文档、Gmail 内容、文本片段、视频音频文件都转换为音频播客,并生成可在常见 Podcast ap

下载

和之前发布的开源模型ChatGLM-6B相比,GLM-4-9B参数略多,预训练计算量增加了 5 倍,但仍然能在大多数用户的显存上运行。

经过技术升级后,GLM-4-9B 模型具备了更强大的推理性能、更长的上下文处理能力、多语言、多模态和All Tools等突出能力。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

价格战之后,智谱来到商业化的下一站

基于强大的预训练基座,GLM-4-9B 的模型中英文综合性能相比 ChatGLM3-6B 提升了 40%,尤其是在中文对齐能力 AlignBench,指令遵从 IFeval,工程代码 Natural Code Bench 方面都取得了非常显著的提升。

GLM-4-9B对比训练量更多的 Llama 3 8B 模型丝毫没有逊色,英文方面有小幅领先,中文学科方面更是有着高达 50% 的提升。

价格战之后,智谱来到商业化的下一站

GLM-4-9B 模型的上下文从 128K 扩展到了 1M tokens,这意味着模型能同时处理 200 万字的输入,大概相当于 2 本红楼梦或者 125 篇论文的长度。GLM-4-9B-Chat-1M 模型在 1M 的上下文长度下进行了“大海捞针”实验,展现出了出色的无损处理能力。

价格战之后,智谱来到商业化的下一站

同时,GLM-4-9B 支持包括汉语、英语、俄语、西班牙语、德语、法语等多达 26 种语言。

过去智谱通过开源积累了一批用户,其开源模型累计下载量高达 1600 万次,成为全球大模型开源生态中一股不可忽视的中国力量,第四代GLM-4-9B 开源模型的推出,进一步巩固了智谱在开源侧的影响力。

在当前大模型发展阶段,持续训练出好的基座模型+持续开源才是吸引用户、创建生态最稳健的策略,从而进一步实现用户留存。

放眼国内,智谱不仅在模型能力上不断取得突破,持续推出更先进的基座模型,在 B 端商业化探索上也至少领先行业半年:智谱从去年 3 月开始探索 B 端商业化(MaaS 模式),根据智谱此前官方消息,过去一年,智谱已经有2000+生态合作伙伴、1000+大模型规模化应用、与200多家企业进行了深度共创。

目前,智谱 MaaS 开放平台已经拥有 30 万企业客户和开发者、400 亿 Tokens 日均调用量 、过去6个月API每日消费量增长了50倍以上。

在此次价格战中,智谱并没有盲目跟进,而是迅速基于 MaaS(模型即服务)商业策略,并往后走到下一站——卷用户体验。

智谱GLM大模型首次推出一键微调,包括LoRA微调和全参微调。用户只需要三步,准备训练数据、创建微调任务、部署微调模型就能拥有自己的私有模型。

价格战之后,智谱来到商业化的下一站

使得用户可以用更低的成本访问和门槛使用大模型,也促进了优秀的 AI 应用爆发。OpenDay 上,小米小爱总经理、AiPPT创始人等到场,讲述了基于GLM大模型做企业应用及创业项目的经历。

对于价格战,智谱CEO张鹏的态度是:打价格战,我们不怕,我们不仅打得起,而且不亏钱。这种底气是基于智谱基于自身强大的 GLM 模型能力,以及逐步完善的商业体系、团队的商业策略。

近期针对MaaS 平台智谱做出一系列价格下调。

价格战之后,智谱来到商业化的下一站

张鹏表述,此次价格调整依然是智谱基于技术突破、效率提升和成本控制的综合结果,是符合自身商业化策略,合理的价格调整。

后记

当价格战最猛的时候,有人感叹“大模型这么不值钱吗”“大模型卖出了白菜价”,盲目价格战其实是对大模型行业的一种损伤——压缩了大模型厂商的盈利空间,打乱了大模型行业健康发展的节奏,更严重的是,一旦整个行业被拉进价格战的漩涡,中国大模型将会偏离主要目标,离 AGI 越来越远;同时价格战也加重了外界对大模型的质疑,怎么花费如此昂贵成本训练出来的大模型,突然就这么便宜了呢?这些厂商是不是闹着玩呢?对大模型的价值产生怀疑。

好的模型应该物有所值,一个行业健康发展的前提是,既能让大多人都能用得起大模型,实现技术普惠,也能让大模型厂商有盈利的空间。

价格战往往只是拍拍脑袋就能做的决策,而对于当下中国大模型来说,探索多样化的发展路径,并且沿着这些路径坚持下去,才是中国大模型破局之道。

而对于当前的大模型玩家来说,如何在有限的资源、时间里,积累更多的筹码:融资、领先的技术、稳定的商业模式,才能继续留在牌桌上,拥有更多机率实现共同的 AGI 星辰大海。

价格战之后,智谱来到商业化的下一站

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

89

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

276

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

59

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

99

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

105

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

230

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

619

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

173

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
550W粉丝大佬手把手从零学JavaScript
550W粉丝大佬手把手从零学JavaScript

共1课时 | 0.4万人学习

极客学院Android开发视频教程
极客学院Android开发视频教程

共345课时 | 96.4万人学习

Dart Flutter2入门实战视频教程
Dart Flutter2入门实战视频教程

共47课时 | 6.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号