0

0

Meta发布音频AI模型,仅需2秒片段模拟真人语音

WBOY

WBOY

发布时间:2023-06-21 15:20:17

|

1782人浏览过

|

来源于搜狐

转载

近日,meta发布了voicebox ai模型,它在音频模拟方面有着显著优势。

据悉,Voicebox只需要一段2秒钟的音频样本,即可准确辨别出音频细节、音色,并基于文字结果转换为语音输出。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Meta发布音频AI模型,仅需2秒片段模拟真人语音

Voicebox 是一种生成式 AI 模型,可以帮助进行音频编辑、采样和造型。

这种技术在未来可以用来帮助创作者轻松编辑音轨,同时,它也能够为声带受损的人群提供协助,帮助TA们重新“发声”。使视障人士能够通过声音听到他们朋友的书面信息,同时使人们能够用自己的声音说任何外语。

同时,它还可以基于语音片段的前后内容,自动补齐中间缺失的内容。

根据Meta的介绍,Voicebox能够为AI助手,或是未来元宇宙的NPC提供自然且真实的语音效果,大大提升用户使用时的沉浸感。

Voicebox 的多功能性支持各种任务,包括:

上下文文本到语音合成:使用短至两秒的音频样本,Voicebox 可以匹配音频风格并将其用于文本到语音生成。

语音编辑和降噪:Voicebox 可以重新创建被噪音打断的部分语音或替换说错的词,而无需重新录制整个语音。例如,您可以识别被狗叫声打断的一段语音,将其裁剪,然后指示 Voicebox 重新生成该段——就像用于音频编辑的橡皮擦一样。

跨语言转换:当给定某人演讲样本和一段英语、法语、德语、西班牙语、波兰语或葡萄牙语的文本时,Voicebox 可以生成任何这些语言的文本阅读,即使样本语音和文本是不同的语言。将来,即使人们不懂这些语言,他们也可以使用此功能以一种更为自然、真实的方式进行交流。

LongCat AI
LongCat AI

美团推出的AI对话问答工具

下载

流匹配是 Voicebox 使用的一种方法,已被证明可以提高扩散模型的性能。Voicebox 在可懂度(5.9% 对 1.9% 的单词错误率)和音频相似性(0.580 对 0.681)方面优于当前最先进的英语模型 VALL-E,同时快 20 倍。对于跨语言风格迁移,Voicebox 优于 YourTTS,将平均单词错误率从 10.9% 降低到 5.2%,并将音频相似度从 0.335 提高到 0.481。

Meta发布音频AI模型,仅需2秒片段模拟真人语音

Voicebox 取得了新的最先进的结果,在单词错误率方面优于 Vall-E 和 YourTTS。

Meta发布音频AI模型,仅需2秒片段模拟真人语音

Voicebox 还分别在英语和多语言基准测试中的音频风格相似性指标上取得了最新的最新成果。

值得一提的是,Meta目前已经意识到了Voicebox被应用在造假领域时,存在的潜在危害,因此他们正在寻找一种区分真实语音和Voicebox生成语音的方法。

在找到解决方法前,Meta将不会向公众公开Voicebox AI模型,以避免不必要的危害。

编辑点评:AI如今已经被应用在各个领域,作为第一个成功执行任务泛化的多功能、高效模型,相信 Voicebox 可以开创语音生成 AI 的新时代。如果Meta无法有效应对音频造假问题,那么Voicebox技术可能会被禁用。

相关专题

更多
云朵浏览器入口合集
云朵浏览器入口合集

本专题整合了云朵浏览器入口合集,阅读专题下面的文章了解更多详细地址。

0

2026.01.20

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

20

2026.01.20

PS使用蒙版相关教程
PS使用蒙版相关教程

本专题整合了ps使用蒙版相关教程,阅读专题下面的文章了解更多详细内容。

62

2026.01.19

java用途介绍
java用途介绍

本专题整合了java用途功能相关介绍,阅读专题下面的文章了解更多详细内容。

87

2026.01.19

java输出数组相关教程
java输出数组相关教程

本专题整合了java输出数组相关教程,阅读专题下面的文章了解更多详细内容。

39

2026.01.19

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

10

2026.01.19

xml格式相关教程
xml格式相关教程

本专题整合了xml格式相关教程汇总,阅读专题下面的文章了解更多详细内容。

13

2026.01.19

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

19

2026.01.19

微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

160

2026.01.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
webrtc/swoole实战音视频直播项目
webrtc/swoole实战音视频直播项目

共22课时 | 1.6万人学习

10分钟--Midjourney创作自己的漫画
10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号