如何利用 JavaScript 实现一个简单的语音识别或合成应用？

狼影

发布时间：2025-10-06 09:24:02

921人浏览过

来源于php中文网

原创

答案：使用Web Speech API可实现语音识别与合成。首先检查浏览器支持情况，SpeechRecognition用于将语音转文本，需配置语言及参数并监听结果；SpeechSynthesis则将文本转语音，通过设置utterance属性并调用speak()播放。结合二者可构建简单语音助手，注意需在HTTPS或localhost运行，获取麦克风权限，并在voicesloaded后使用语音列表。

如何利用 javascript 实现一个简单的语音识别或合成应用？

要实现一个简单的语音识别或语音合成功能，JavaScript 提供了浏览器原生的 Web Speech API，包含 SpeechRecognition（语音识别）和 SpeechSynthesis（语音合成）两个核心接口。下面分别介绍如何使用它们创建基础应用。

语音识别：听懂用户说的话

SpeechRecognition 接口可以将用户的语音转换为文本。目前主要在 Chrome 和基于 Chromium 的浏览器中支持较好。

使用步骤：

检查浏览器是否支持 SpeechRecognition
创建识别实例并配置参数
监听结果事件并处理输出

示例代码：

if ('webkitSpeechRecognition' in window || 'SpeechRecognition' in window) {
  const Recognition = window.SpeechRecognition || window.webkitSpeechRecognition;
  const recognition = new Recognition();
  recognition.lang = 'zh-CN'; // 设置语言
  recognition.interimResults = false; // 是否返回中间结果

  recognition.onresult = (event) => {
    const transcript = event.results[0][0].transcript;
    console.log('识别结果:', transcript);
    document.getElementById('output').textContent = transcript;
  };

  recognition.onerror = (event) => {
    console.error('识别出错:', event.error);
  };

  // 开始识别
  document.getElementById('start-btn').onclick = () => {
    recognition.start();
  };
} else {
  alert('当前浏览器不支持语音识别');
}

语音合成：让网页“说话”

SpeechSynthesis 是 Web Speech API 中用于文本转语音的部分，兼容性较好，几乎所有现代浏览器都支持。

立即学习“Java免费学习笔记（深入）”；

BiLin AI

免费的多语言AI搜索引擎

下载

使用方法：

获取 speechSynthesis 对象
创建 SpeechSynthesisUtterance 实例
设置语速、音调、语言等参数
调用 speak() 播放语音

示例代码：

function speak(text) {
  if ('speechSynthesis' in window) {
    const utterance = new SpeechSynthesisUtterance(text);
    utterance.lang = 'zh-CN'; // 中文发音
    utterance.rate = 1; // 语速（0.1 ~ 10）
    utterance.pitch = 1; // 音调（0 ~ 2）

    // 可选：选择声音
    const voices = window.speechSynthesis.getVoices();
    const femaleVoice = voices.find(voice => voice.name.includes('Google 普通话'));
    if (femaleVoice) {
      utterance.voice = femaleVoice;
    }

    window.speechSynthesis.speak(utterance);
  } else {
    alert('当前浏览器不支持语音合成');
  }
}

// 触发朗读
document.getElementById('speak-btn').onclick = () => {
  const text = document.getElementById('input-text').value;
  speak(text);
};

完整小应用结构建议

你可以结合两者做一个交互式语音助手雏形：

用户点击按钮开始说话 → 语音识别转文字
系统根据关键词回复一段文字
调用语音合成把回复“念”出来

注意点：

语音识别需要 HTTPS 或本地开发环境（如 localhost）
首次使用可能需要用户授权麦克风权限
SpeechSynthesis 需等待 voicesloaded 事件以确保声音可用（可调用 speechSynthesis.getVoices() 前先监听 onvoiceschanged）

基本上就这些，不复杂但容易忽略细节。

JavaScript中String-raw方法在处理原始字符串作用

JavaScript中!操作符对原始数据进行布尔强制转换

JavaScript内联式与外联式代码引入的优缺点对比

JavaScript数组字面量与Array构造函数的初始化差异

JavaScript数值范围检测在不同浏览器引擎中一致性

相关标签:

javascript java go 浏览器 win google 开发环境 speak chrome 接口对象事件 https

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：解决Django模态窗口内容溢出问题：结构与布局指南下一篇：使用 D3.js 根据节点数量动态调整文本字体大小

作者最新文章

肉类年货批发进货渠道肉类年货在哪里批发

2026-03-07 04:05

小黑盒官网唯一地址_小黑盒游戏平台官网直达

2026-03-08 10:28

键盘快捷键失效怎么办_键盘快捷键设置恢复

2026-03-08 12:36

冬季空调温度多少度最适合老人小孩_冬天敏感人群空调温度设置

2026-03-10 00:27

小遛共享城市入口_小遛电单车已开通服务城市列表查询

2026-03-10 04:27

海鲜冻货年货批发市场海鲜类年货在哪批发

2026-03-10 10:33

什么样的走路姿势最省力每天走多少步最合适

2026-03-11 09:36

2026春节放假安排最新通知 2026年春节放假调休时间表

2026-03-12 08:29

B站如何查看历史记录_B站观看历史查找方式

2026-03-12 11:02

春运抢票新变化_2026年12306便民功能与服务升级

2026-03-13 10:27

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

chrome什么意思

chrome是浏览器的意思，由Google开发的网络浏览器，它在2008年首次发布，并迅速成为全球最受欢迎的浏览器之一。本专题为大家提供chrome相关的文章、下载、课程内容，供大家免费下载体验。

1071

2023.08.11

chrome无法加载插件怎么办

chrome无法加载插件可以通过检查插件是否已正确安装、禁用和启用插件、清除插件缓存、更新浏览器和插件、检查网络连接和尝试在隐身模式下加载插件方法解决。更多关于chrome相关问题，详情请看本专题下面的文章。php中文网欢迎大家前来学习。

848

2023.11.06

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

1973

2023.10.19

PHP接口编写教程

本专题整合了PHP接口编写教程，阅读专题下面的文章了解更多详细内容。

659

2025.10.17

php8.4实现接口限流的教程

PHP8.4本身不内置限流功能，需借助Redis（令牌桶）或Swoole（漏桶）实现；文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

2406

2025.12.29

java接口相关教程

本专题整合了java接口相关内容，阅读专题下面的文章了解更多详细内容。

2026.01.19

http与https有哪些区别

http与https的区别：1、协议安全性；2、连接方式；3、证书管理；4、连接状态；5、端口号；6、资源消耗；7、兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

2927

2024.08.16

TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开，深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析，帮助开发者构建类型安全、结构清晰、易维护的前端工程体系，提高团队协作效率与代码质量。

2026.03.13

Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开，深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例，帮助开发者掌握 Python 在高并发场景中的高效开发方法，并提升系统资源利用率与整体运行性能。

2026.03.12

热门下载

网站特效

网站源码

网站素材

前端模板