0

0

豆包大模型日均Tokens使用量破5000亿,模型家族再升级

WBOY

WBOY

发布时间:2024-08-14 09:45:03

|

1164人浏览过

|

来源于机器之心

转载

7月25日,火山引擎2024“ai创新巡展”首站成都站透露了字节豆包大模型的最新进展:截至7月,豆包大模型日均tokens使用量已突破5000亿,平均每家企业客户日均tokens使用量较5月15日模型发布时期增长22倍。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

豆包大模型日均tokens使用量破5000亿,模型家族再升级

1. 豆包大模型由字节跳动自研,原名“云雀”,是国内首批通过算法备案的大模型之一,目前通过字节跳动旗下云服务平台火山引擎面向企业提供服务。
  1. 自发布之初,豆包大模型便主打使用量大、应用场景丰富。
  2. 据火山引擎副总裁张鑫介绍,在字节内部,有超过50多个业务在使用豆包大模型,覆盖了协同办公、数据分析、文案创作、辅助编程、内容审核、客服、游戏NPC、角色对话、教育等各种场景,基于豆包大模型打造的新技术引擎正在加速业务创新;此外,豆包大模型的外部客户已覆盖手机、汽车、金融、消费、互娱等30多个行业,并联合OPPO、vivo、荣耀、小米、三星、华硕等知名终端厂商和吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽车等20余家汽车厂商分别成立了智能终端大模型联盟和汽车大模型生态联盟。

    豆包大模型日均Tokens使用量破5000亿,模型家族再升级

    BiLin AI
    BiLin AI

    免费的多语言AI搜索引擎

    下载
    图说:火山引擎副总裁张鑫在2024“AI创新巡展”活动现场
    本次活动中,作为豆包大模型西南区域的企业客户典型,蓝领招聘平台鱼泡科技和智能客服企业晓多科技也各自分享了接入豆包大模型实现业务增长的案例经验。其中,鱼泡科技的豆包大模型日均调用量已超1亿Tokens,应用场景覆盖了岗位要求识别、工种识别、求职意向识别、推荐系统相似度识别等。
    火山引擎大模型服务算法架构师孙帆指出,企业在使用大模型时,面临的关键挑战就是“模型效果”、“使用成本”和“落地难度”三个方面。豆包大模型和火山引擎正是从“更强模型”“更低价格”“更易落地”出发,帮企业解决难题。
    据悉,豆包模型家族在5月正式发布时,提供的就是一个有多模态能力的模型家族,主要包括通用模型pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等九款模型。主力模型豆包通用模型pro自5月发布以来,在多个公开评测集以及专业的第三方评测中表现出众,是得分最高的国产大模型。
    本次,豆包模型家族升级了文生图模型和语音模型。升级后的豆包·文生图模型具备更精准的中英文长文本理解能力,能够生成图文一致的高美感图片;豆包·语音合成模型在升级后实现了智能识别文本情绪并对语速、语调动态调整,使之情绪更加饱满;声音复刻模型仅需5秒就能高保真复刻人声,并支持多种小语种。
    值得一提的是,豆包模型家族此次官宣了一位新成员——豆包·图生图模型。基于文生图模型打造,豆包·图生图模型能实现高度还原人物特征,50多种风格场景自由转换,并提供多种富有创意的延展编辑。该模型能力已经在抖音、剪映、豆包、星绘等字节系App中落地,并通过火山引擎服务了三星、努比亚等企业客户,目前日均图生图数量达到数千万张。
    在模型定价方面,公开报道显示,豆包主力模型的推理输入价格只有0.0008元/千Tokens,比行业便宜99.3%。火山引擎总裁谭待此前接受采访时曾对此表示,大模型的超低定价,来自对技术的信心,火山引擎能通过技术手段实现大模型推理成本的优化。
    “一个人现在创业,如果要花1万块钱调用大模型,可能会觉得有点贵。我们把价格降到1%都不到,100块钱就能用起来,他的想法也就更容易尝试。”谭待表示,企业的AI转型充满不确定性,试错成本要尽量低,才能更快更多地实现大模型的应用落地,从而让整个行业受益。”
    除了效果好,价格便宜,豆包大模型还给出了最高可达同梯队模型数倍的每分钟处理Tokens限额,让模型服务具备更强的承载力。
    据孙帆介绍,豆包通用模型pro为客户提供了业内最高标准的初始TPM(每分钟Tokens)和RPM(每分钟请求数),有助于企业的业务在高并发场景中落地。
    目前,字节跳动还在持续加大对大模型技术研究的投入,近期在视觉、语音等方向有多项亮眼成果产出,其中,已有部分能力应用于豆包大模型相关产品中。
    “我们希望用扎实的技术实力给客户更好的选择,帮助企业解除成本包袱,让客户更积极更大胆的尝试、迭代,让大模型应用大踏步向前。”孙帆说。
    火山引擎还升级了头条、抖音同款插件服务,新增网页解析、计算器等插件,进一步扩宽模型能力的边界,支持企业多样的应用需求,同时带来了扣子专业版、HiAgent平台等多款产品和云基础设施的最新进展。
    张鑫表示,火山引擎在高速自我迭代,走向更加智能化、行业化和区域化。他说:“通过针对性的行业方案、产品和优化服务,相信在未来,会有更多西南区域的企业借助豆包大模型和火山引擎的力量,实现业务创新,从而为经济发展注入新的活力。”

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

500

2023.08.14

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

88

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

273

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

59

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

99

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

105

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

230

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

618

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
微信小程序开发就这么简单
微信小程序开发就这么简单

共64课时 | 11.7万人学习

第十一期_综合实战
第十一期_综合实战

共115课时 | 21.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号