0

0

JavaScript如何实现语音识别_Web Speech API如何工作?

紅蓮之龍

紅蓮之龍

发布时间:2025-12-27 19:43:03

|

839人浏览过

|

来源于php中文网

原创

JavaScript语音识别主要依靠Web Speech API的SpeechRecognition接口,需检查浏览器支持、创建实例、设置属性、绑定事件并调用start()启动;存在HTTPS依赖、移动端兼容性差及无法自定义模型等问题。

javascript如何实现语音识别_web speech api如何工作?

JavaScript 实现语音识别主要依靠浏览器原生支持的 Web Speech API,其中核心接口是 SpeechRecognition(目前在 Chrome、Edge 等基于 Chromium 的浏览器中稳定可用,Firefox 有部分支持但需手动启用)。它不是调用第三方服务,而是直接利用系统麦克风和本地/云端语音引擎完成识别,响应快、隐私性较好(语音数据可不离开设备)。

Web Speech API 语音识别的基本流程

整个过程是事件驱动的:开启识别 → 用户说话 → 浏览器处理音频 → 返回文本结果。关键步骤包括:

  • 检查浏览器是否支持 window.SpeechRecognition 或其带前缀版本(如 webkitSpeechRecognition
  • 创建识别实例,设置属性(如 continuous: true 支持连续识别,interimResults: true 允许返回中间结果)
  • 绑定事件:onstart(开始收音)、onresult(拿到识别文本)、onend(识别结束或中断)
  • 调用 recognition.start() 启动,用户授权麦克风后自动开始监听

一个最小可用的语音识别示例

以下代码可直接在支持的浏览器中运行(建议用 HTTPS 环境,HTTP 下部分浏览器会禁用麦克风):

const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;
if (!SpeechRecognition) {
  console.error('当前浏览器不支持 Web Speech API');
} else {
  const recognition = new SpeechRecognition();
  recognition.continuous = false;    // 识别一次后停止
  recognition.interimResults = true;  // 返回实时中间结果
  recognition.lang = 'zh-CN';         // 设为中文

  recognition.onresult = (event) => {
    const result = event.results[0][0].transcript;
    const isFinal = event.results[0].isFinal;
    console.log(isFinal ? '最终结果:' + result : '暂定结果:' + result);
  };

  recognition.onstart = () => console.log('开始监听...');
  recognition.onend = () => console.log('识别已结束');

  // 点击按钮触发识别
  document.getElementById('start-btn').onclick = () => recognition.start();
}

常见问题与注意事项

实际使用中容易遇到几个典型问题:

Programming Helper
Programming Helper

AI代码自动生成器,在AI的帮助下更快地编程

下载

立即学习Java免费学习笔记(深入)”;

  • 权限被拒绝或未触发授权弹窗:确保页面通过 HTTPS 提供;首次调用 start() 才会触发麦克风请求,不能提前预检权限
  • 识别不准或无响应:确认系统麦克风正常、环境安静;lang 必须准确(如 'zh-CN' 不是 'zh');部分浏览器对 interimResults 支持不稳定
  • 移动端兼容性差:iOS Safari 完全不支持该 API;Android Chrome 支持较好,但部分定制 ROM 可能禁用
  • 无法控制语音模型或自定义词库:Web Speech API 是黑盒,不开放模型训练或热词优化能力;如需更高精度,需对接科大讯飞、百度语音等第三方 SDK

替代方案与增强思路

当 Web Speech API 不满足需求时,可以考虑:

  • MediaRecorder 录制音频流,上传至云语音服务(如阿里云智能语音交互、腾讯云语音识别)做识别,获得更准结果和更多配置项
  • 结合 Web Audio API前端语音活动检测(VAD),避免静音段误触发识别
  • SpeechSynthesis 实现语音反馈,构成“听-说”闭环,提升交互体验

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
chrome什么意思
chrome什么意思

chrome是浏览器的意思,由Google开发的网络浏览器,它在2008年首次发布,并迅速成为全球最受欢迎的浏览器之一。本专题为大家提供chrome相关的文章、下载、课程内容,供大家免费下载体验。

1058

2023.08.11

chrome无法加载插件怎么办
chrome无法加载插件怎么办

chrome无法加载插件可以通过检查插件是否已正确安装、禁用和启用插件、清除插件缓存、更新浏览器和插件、检查网络连接和尝试在隐身模式下加载插件方法解决。更多关于chrome相关问题,详情请看本专题下面的文章。php中文网欢迎大家前来学习。

840

2023.11.06

edge是什么浏览器
edge是什么浏览器

Edge是一款由Microsoft开发的网页浏览器,是Windows 10操作系统中默认的浏览器,其目标是提供更快、更安全、更现代化的浏览器体验。本专题为大家提供edge浏览器相关的文章、下载、课程内容,供大家免费下载体验。

1733

2023.08.21

IE浏览器自动跳转EDGE如何恢复
IE浏览器自动跳转EDGE如何恢复

ie浏览器自动跳转edge的解决办法:1、更改默认浏览器设置;2、阻止edge浏览器的自动跳转;3、更改超链接的默认打开方式;4、禁用“快速网页查看器”;5、卸载edge浏览器;6、检查第三方插件或应用程序等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

397

2024.03.05

如何解决Edge打开但没有标题的问题
如何解决Edge打开但没有标题的问题

若 Microsoft Edge 浏览器打开后无标题(窗口空白或标题栏缺失),可尝试以下方法解决: 重启 Edge:关闭所有窗口,重新启动浏览器。 重置窗口布局:右击任务栏 Edge 图标 → 选择「最大化」或「还原」。 禁用扩展:进入 edge://extensions 临时关闭插件测试。 重置浏览器设置:前往 edge://settings/reset 恢复默认配置。 更新或重装 Edge:检查最新版本,或通过控制面板修复

1038

2025.04.24

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1926

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

656

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2395

2025.12.29

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 6万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 3.4万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号