腾讯开源歌曲生成模型 SongBloom

霞舞

发布时间：2025-10-11 15:49:33

957人浏览过

来源于php中文网

原创

腾讯 ai lab 联合香港中文大学（深圳）、南京大学共同推出了一款全新的开源歌曲生成模型 songbloom，其研究成果已成功入选全球顶尖人工智能会议 neurips 2025。

据介绍，SongBloom 是一款专注于高质量歌曲创作的创新性生成模型。仅需提供一段 10 秒的音频参考样本和对应歌词文本，即可自动生成时长为 2 分 30 秒、双通道/48kHz 的完整音乐作品。在主客观综合评估中，该模型不仅显著优于现有开源方案，还在音质还原度与歌词对齐精度两大关键指标上表现出色；同时，在旋律性与音乐表现力方面也接近当前领域最先进水平（SOTA）。

腾讯开源歌曲生成模型 SongBloom

SongBloom 实现了两项核心技术突破：

首次将自回归扩散机制应用于长序列歌曲生成任务。通过引入离散的 sketch token 作为“链式思维”式的中间表示，并结合 VAE latent 空间进行最终音频合成，该架构有效融合了自回归模型在结构连贯性和音素同步上的优势，以及扩散模型在连续声学特征建模中提升音质的能力，实现了“结构稳定、细节丰富、情感表达强”的高质量输出。

腾讯开源歌曲生成模型 SongBloom

研发团队提出一种全新的交替生成范式（interleaved generation），能够在“语义理解”与“声学生成”两种上下文模式之间动态切换。这一机制既保障了整首歌曲的逻辑结构完整性，又提升了局部声音质感的精细程度，为音乐生成 AI 提供了一条前所未有的技术路径。

据腾讯方面披露，在多项客观评测中，SongBloom 的美学得分不仅大幅领先主流开源基准模型，甚至媲美乃至超越部分领先的商业闭源系统；此外，模型展现出极强的歌词遵循能力，显著缓解了传统生成模型中存在的“幻觉问题”（即生成内容偏离歌词本意），并将音素错误率（PER）降至新低，推动歌词准确率迈上新台阶。

Napkin AI

Napkin AI 可以将您的文本转换为图表、流程图、信息图、思维导图视觉效果，以便快速有效地分享您的想法。

下载

腾讯开源歌曲生成模型 SongBloom

在主观听感测试中，SongBloom 同样表现抢眼。得益于 VAE latent 所保留的高保真声学信息，其生成的人声细腻度已超越目前业内领先的闭源模型 Suno-v4.5；而在整体音乐性方面，亦达到可与多个商用模型相抗衡甚至更优的水准，使 AI 创作的音乐更加贴近专业级制作质感。

腾讯开源歌曲生成模型 SongBloom

目前，项目全部代码及预训练权重均已开放。未来，团队还将陆续发布支持长达 240 秒的完整版模型，以及增强文本控制能力的新版本。

源码地址：点击下载

广告业大地震！Luma AI仅花2天、预算万分之1 完成千万级全球广告

Google搜寻大升级！新功能Canvas让AI帮你写程式、做笔记

工研院筹组学界、法人联合舰队！投入中长程技术发展

黄仁勋：投资OpenAI「可能是最后一次」 IPO前资金布局逐步收尾

AI时代下的挑战应用材料：能效是决胜关键

相关标签:

人工智能腾讯 ai 音乐 2025 架构 Token

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：苹果CarPlay Ultra遭多家车企抛弃仅阿斯顿&middot;马丁独撑下一篇：40Gbps！铁威马D1 SSD Plus化身存储神器

作者最新文章

关公大战外星人！武侠×外星异种破界对决！《卜算子》3月6日Steam正式上线

2026-03-06 15:00

央视频在哪能开启弹幕

2026-03-06 15:05

Thymeleaf 邮件模板中阻止表单提交重定向并异步调用 REST API

2026-03-06 15:06

Python spidev.xfer2() 数据交换原理与正确用法详解

2026-03-06 15:10

Svelte 中数组赋值失效的根源与正确更新方式

2026-03-06 15:14

在 Spring WebFlux 中实现响应后异步执行后台任务的正确姿势

2026-03-06 15:19

《Machine Mind》现已在Steam正式发售首发折扣中

2026-03-06 15:23

如何在 Go 中精准提取字符串中引号内的子串

2026-03-06 15:28

如何实现图片轮播滑块的逐图平滑移动

2026-03-06 15:33

Python 中 k != int 恒为 True 的原因与类型检查的正确写法

2026-03-06 15:36

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6559

2023.09.14

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

840

2023.09.14

token怎么获取

获取token值的方法：1、小程序调用“wx.login()”获取临时登录凭证code，并回传到开发者服务器；2、开发者服务器以code换取，用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容，可以阅读本专题下面的文章。

1089

2023.12.21

token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易，用来购买或出售特定的虚拟货币，也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1872

2024.03.01

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开，深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例，分析内存安全保障原理与零成本抽象优势，并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学，掌握在高性能与安全性并重场景中的工程实践能力。

2026.03.05

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

164

2026.03.04