AI语音生成提速40%！苹果公布PCG技术

冷炫風刃

发布时间：2026-02-04 13:49:01

450人浏览过

来源于php中文网

原创

今日，据外媒9to5mac消息，苹果公司携手特拉维夫大学共同推出一项名为「原则性粗粒度」（pcg）的新型语音合成技术，目标直指ai文本转语音（tts）领域长期存在的推理速度瓶颈。

传统TTS系统普遍采用自回归建模方式，逐帧预测声学token，且严格要求与预设序列完全一致。这种“零容差”机制虽保障了理论精度，却极大拖慢生成节奏——即便预测结果在听觉层面几无差别，仅因微小偏差也会被判定为失败。

为突破该限制，研究团队创新性地依据人类听觉感知特性，将语义等价或听感相近的声学token聚类整合，构建出多个「声学相似组」。验证逻辑由此发生根本转变：不再苛求token精准落点，而是判断其是否归属目标相似组内，即由“单点匹配”升级为“区间接纳”，大幅增强系统鲁棒性。

AI语音生成提速40%！苹果公布PCG技术

在工程实现上，PCG引入「投机解码」双模型协同范式：前端由轻量级小模型高速产出候选token序列，后端则交由大模型进行相似组归属判别。该设计既延续了小模型的低延迟优势，又依托大模型确保输出符合听觉保真标准。

实测数据显示，该方案可将端到端语音生成速率提升约40%，主观自然度评分为4.09（满分为5分）。

Veggie AI

Veggie AI 是一款利用AI技术生成可控视频的在线工具

下载

AI语音生成提速40%！苹果公布PCG技术

在极端扰动测试中，当高达91.4%的原始token被随机替换为同组内其他成员时，词错误率仅上升0.007，说话人身份相似度下降0.027，人耳几乎无法分辨变化。

AI语音生成提速40%！苹果公布PCG技术

值得注意的是，PCG属于纯推理层优化方案，无需对已有TTS模型进行任何重训练；仅需额外加载约37MB的相似组索引数据，即可完成部署，兼具高兼容性与极低落地门槛。

REDMI K90累计销量近100万台累计销量破130万台

M5 Pro与M5 Max版MacBook Pro即将发布经销商库存告急

春运首日国产大飞机C919首飞“上海—珠海”航线

苹果将为Apple Support带来更多AI功能功能升级界面焕新

高德2026春运报告：携宠返乡成新趋势，古城年味、海岛避寒受热捧

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

下载

相关标签:

前端苹果后端 mac ai 大模型苹果公司 Token 语音生成文本转语音

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：小米17 Ultra开售五周销量曝光首周销量达5.8万台下一篇：iPhone 18传闻全解析：2nm芯+12GB运存 2027年初见

作者最新文章

小米云服务关闭方法有哪些？小米设置小米账号云服务逐项关闭同步及查找功能详解

2026-02-01 10:06

格力空调故障代码表格力空调常见故障一览说明

2026-02-01 11:18

小米云服务同步是什么意思？小米云服务同步功能原理讲解

2026-02-01 12:14

高德淘金app苹果怎么下高德淘金ios下载地址

2026-02-01 13:16

扫描全能王电脑版下载官网_扫描全能王电脑网页版官方入口地址

2026-02-01 17:17

小米云服务关闭相册同步会删除吗？小米云服务照片删除机制讲解

2026-02-01 18:32

豆包反推生成提示词从成品内容反推提示词方法

2026-02-01 21:28

苹果手机id账号怎么退出

2026-02-02 02:11

苹果手机强制重启方法详解_苹果手机不同机型强制重启按键组合

2026-02-02 08:11

电脑如何查看照片大小

2026-02-02 09:05

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6272

2023.09.14

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

825

2023.09.14

token怎么获取

获取token值的方法：1、小程序调用“wx.login()”获取临时登录凭证code，并回传到开发者服务器；2、开发者服务器以code换取，用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容，可以阅读本专题下面的文章。

1073

2023.12.21

token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易，用来购买或出售特定的虚拟货币，也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1431

2024.03.01

抖音网页版入口与视频观看指南抖音官网视频在线访问

本专题汇总了抖音网页版的入口链接、官方登录页面以及视频观看入口，帮助用户快速访问抖音网页版，提供免登录访问方式和直接进入视频播放页面的方法，确保顺利浏览和观看抖音视频。

2026.02.04

学习通网页版入口与在线学习指南学习通官网登录与使用方法

本专题详细汇总了学习通网页版入口与登录方法，提供学习通官方网页端入口、学生登录平台、网页版使用指南等内容，帮助用户快速稳定地登录学习通官网，顺利进入学习平台，提升学习效率和体验。

2026.02.04

Python Web 框架 Django 深度开发

本专题系统讲解 Python Django 框架的核心功能与进阶开发技巧，包括 Django 项目结构、数据库模型与迁移、视图与模板渲染、表单与认证管理、RESTful API 开发、Django 中间件与缓存优化、部署与性能调优。通过实战案例，帮助学习者掌握使用 Django 快速构建功能全面的 Web 应用与全栈开发能力。

2026.02.04

Java 流式处理与 Apache Kafka 实战

本专题专注讲解 Java 在流式数据处理与消息队列系统中的应用，系统讲解 Apache Kafka 的基础概念、生产者与消费者模型、Kafka Streams 与 KSQL 流式处理框架、实时数据分析与监控，结合实际业务场景，帮助开发者构建高吞吐量、低延迟的实时数据流管道，实现高效的数据流转与处理。

2026.02.04

Golang 容器化与 Docker 实战

本专题深入讲解 Golang 应用的容器化与 Docker 部署，涵盖 Docker 基础概念、容器构建与镜像管理、Go 应用的 Dockerfile 编写、跨平台容器部署与优化、Docker Compose 和 Kubernetes 部署工具。通过实际案例，帮助学习者掌握如何将 Golang 应用容器化并实现高效部署与管理，提升系统的可扩展性与运维效率。

2026.02.04

热门下载

网站特效

网站源码

网站素材

前端模板