答案:JavaScript通过Web Speech API实现语音识别与合成。使用SpeechRecognition将语音转文本,需HTTPS及浏览器支持,推荐Chrome;通过SpeechSynthesis将文本转语音,可调节语速、音调、音量,适用于朗读与辅助功能。二者结合可用于语音记事本、无障碍工具等场景,注意权限、兼容性与用户体验。

要构建一个语音识别或语音合成应用,JavaScript 提供了浏览器原生支持的 API,分别是 Web Speech API 中的 SpeechRecognition(语音识别)和 SpeechSynthesis(语音合成)。这两个接口让开发者可以轻松实现听写、语音控制、朗读文本等功能。
语音识别:使用 SpeechRecognition
SpeechRecognition 接口允许你将用户的语音转换为文本。虽然目前在部分浏览器中仍需加前缀,但 Chrome 支持较好。
示例代码:开启语音识别并获取结果:
// 检查浏览器是否支持
const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;
if (!SpeechRecognition) {
console.log("当前浏览器不支持语音识别");
}
const recognition = new SpeechRecognition();
recognition.lang = 'zh-CN'; // 设置语言
recognition.interimResults = false; // 是否返回中间结果
recognition.maxAlternatives = 1;
// 开始识别
document.getElementById('start-btn').onclick = () => {
recognition.start();
};
// 获取结果
recognition.onresult = (event) => {
const transcript = event.results[0][0].transcript;
document.getElementById('output').textContent = transcript;
console.log('识别结果:', transcript);
};
// 错误处理
recognition.onerror = (event) => {
console.error('识别出错:', event.error);
};
说明与建议:
立即学习“Java免费学习笔记(深入)”;
- 用户首次使用时会弹出麦克风权限请求,需确保页面在 HTTPS 环境下运行。
- interimResults 设为 true 可实时显示未完成的识别内容。
- 注意兼容性:Safari 和 Firefox 基本不支持,推荐用于 Chrome 或基于 Chromium 的浏览器。
语音合成:使用 SpeechSynthesis
SpeechSynthesis 接口可以将文本“朗读”出来,适合做语音提示、辅助阅读等场景。
建站之星网站建设系统是一种全新的互联网应用模式,它一改过去传统的企业建站方式,不需企业编写任何程序或网页,无需学习任何相关语言,也不需第三方代写或管理网站,只需应用系统所提供的各种强大丰富的功能模块,即可轻松生成企业个性化的精美网站。 SiteStar v2.3本地软件体验包说明:为方便客户能够第一时间体验智能建站软件的强大功能,我们特别提供了本地软件体验包,您只需下载下来并安装在您的计算机上(和
让浏览器朗读输入框中的文字:
const synth = window.speechSynthesis;
document.getElementById('speak-btn').onclick = () => {
const text = document.getElementById('text-input').value;
if (!text || synth.speaking) return; // 避免重复播放
const utterance = new SpeechSynthesisUtterance(text);
utterance.lang = 'zh-CN';
utterance.rate = 1; // 语速,0.1 到 10
utterance.pitch = 1; // 音调,0 到 2
utterance.volume = 1; // 音量,0 到 1
synth.speak(utterance);
};
// 停止朗读
document.getElementById('stop-btn').onclick = () => {
synth.cancel();
};
进阶技巧:
- 可通过 speechSynthesis.getVoices() 获取可用语音列表,支持不同性别或语言的发音人。
- 绑定 utterance.onend 事件可在朗读后执行回调。
- 部分系统/浏览器对中文语音支持有限,可测试不同设备效果。
实际应用场景建议
结合两个功能,你可以构建如下应用:
- 语音记事本:用户说话 → 转文字保存;点击按钮 → 文字朗读出来。
- 无障碍工具:自动朗读网页内容,或通过语音命令导航。
- 语言学习助手:用户朗读句子 → 识别后比对正确文本;错误时用语音反馈。
开发时注意用户体验:
- 添加状态提示(如“正在聆听…”、“朗读中”)。
- 提供手动输入备用方案,避免语音失败导致功能不可用。
- 控制连续识别频率,防止触发过多请求。









