0

0

javascript如何实现语音识别_Web Speech API有哪些功能

幻影之瞳

幻影之瞳

发布时间:2025-12-16 07:45:11

|

566人浏览过

|

来源于php中文网

原创

JavaScript语音识别依赖Web Speech API的SpeechRecognition接口,仅Chrome/Edge等Blink内核浏览器支持,需HTTPS环境、用户手势触发,可实现本地实时语音转文字,但存在兼容性、精度和移动端限制。

javascript如何实现语音识别_web speech api有哪些功能

JavaScript 实现语音识别主要依靠浏览器原生支持的 Web Speech API,其中核心接口是 SpeechRecognition(部分浏览器仍需前缀,如 webkitSpeechRecognition)。它无需后端服务即可在兼容浏览器中完成实时语音转文字,但目前仅在 Chrome、Edge(基于 Chromium)等 Blink 内核浏览器中稳定可用,Firefox 和 Safari 尚未支持语音识别功能。

语音识别基本实现步骤

要让网页“听懂”用户说话,关键在于创建并配置识别实例、监听事件、启动识别:

  • 检测浏览器是否支持:typeof window.SpeechRecognition !== 'undefined' || typeof window.webkitSpeechRecognition !== 'undefined'
  • 获取识别构造函数(优先用标准名,降级到 webkit 前缀)
  • 创建实例后设置属性:如 recognition.continuous = false(单次识别)、recognition.interimResults = true(返回中间结果)
  • 监听关键事件:onresult(获取识别文本)、onstart(开始收音)、onend(自动停止后触发,可在此处重新 start 实现连续识别)
  • 调用 recognition.start() 启动,需用户手势(如点击按钮)触发,不能自动启动

Web Speech API 的两大核心功能模块

Web Speech API 实际包含两个独立但常配合使用的接口:

  • SpeechRecognition:负责语音识别(speech-to-text),将麦克风输入实时转为文本。支持语言设定(recognition.lang = 'zh-CN')、结果置信度(event.results[i][0].confidence)、以及是否返回中间结果
  • SpeechSynthesis:负责语音合成(text-to-speech),把文字“读出来”。通过 window.speechSynthesis 调用,可选择发音引擎(voice)、调节语速(rate)、音高(pitch)、音量(volume)等

二者互不依赖,可单独使用。例如:只用 SpeechSynthesis 做朗读提示;或只用 SpeechRecognition 做语音指令控制。

立即学习Java免费学习笔记(深入)”;

图星人
图星人

好用的AI生图工具,百万免费商用图库

下载

常见限制与注意事项

Web Speech API 虽方便,但有明确的运行约束和兼容性现实:

  • 必须在 HTTPS 或 localhost 环境下运行,HTTP 页面会被浏览器直接禁用麦克风权限
  • 首次使用会弹出浏览器权限请求,用户拒绝后需手动在地址栏点击锁形图标开启
  • Chrome 对长时间识别有限制(约数秒无语音会自动结束),需监听 onend 并主动调用 start() 维持(注意避免无限循环)
  • 中文识别效果尚可,但对口音、背景噪音、专业术语敏感,准确率不如云端 ASR 服务(如百度语音、阿里云智能语音)
  • 移动端支持较弱,iOS Safari 完全不支持 SpeechRecognition,Android Chrome 支持但体验不稳定

一个最小可用示例(含错误处理)

以下代码片段可直接嵌入 HTML 测试(记得加按钮触发):

const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;
if (!SpeechRecognition) {
  console.error('当前浏览器不支持语音识别');
} else {
  const recognition = new SpeechRecognition();
  recognition.lang = 'zh-CN';
  recognition.interimResults = true;

  recognition.onresult = (event) => {
    const transcript = Array.from(event.results)
      .map(result => result[0].transcript)
      .join('');
    console.log('识别结果:', transcript);
  };

  recognition.onerror = (event) => {
    console.warn('识别出错:', event.error);
  };

  recognition.onend = () => {
    console.log('识别已结束');
    // 如需连续识别,此处可加 recognition.start();
  };

  // 用户点击后启动
  document.getElementById('start-btn').onclick = () => recognition.start();
}

基本上就这些。Web Speech API 提供了轻量、免部署的语音交互入口,适合做演示、教育工具或简单语音指令场景。真要上生产、求稳定、要多语言/高精度,还是得对接专业语音云服务。但作为前端原生能力,它确实让“开口即用”变得更近了一步。

相关专题

更多
js获取数组长度的方法
js获取数组长度的方法

在js中,可以利用array对象的length属性来获取数组长度,该属性可设置或返回数组中元素的数目,只需要使用“array.length”语句即可返回表示数组对象的元素个数的数值,也就是长度值。php中文网还提供JavaScript数组的相关下载、相关课程等内容,供大家免费下载使用。

558

2023.06.20

js刷新当前页面
js刷新当前页面

js刷新当前页面的方法:1、reload方法,该方法强迫浏览器刷新当前页面,语法为“location.reload([bForceGet]) ”;2、replace方法,该方法通过指定URL替换当前缓存在历史里(客户端)的项目,因此当使用replace方法之后,不能通过“前进”和“后退”来访问已经被替换的URL,语法为“location.replace(URL) ”。php中文网为大家带来了js刷新当前页面的相关知识、以及相关文章等内容

416

2023.07.04

js四舍五入
js四舍五入

js四舍五入的方法:1、tofixed方法,可把 Number 四舍五入为指定小数位数的数字;2、round() 方法,可把一个数字舍入为最接近的整数。php中文网为大家带来了js四舍五入的相关知识、以及相关文章等内容

756

2023.07.04

js删除节点的方法
js删除节点的方法

js删除节点的方法有:1、removeChild()方法,用于从父节点中移除指定的子节点,它需要两个参数,第一个参数是要删除的子节点,第二个参数是父节点;2、parentNode.removeChild()方法,可以直接通过父节点调用来删除子节点;3、remove()方法,可以直接删除节点,而无需指定父节点;4、innerHTML属性,用于删除节点的内容。

479

2023.09.01

JavaScript转义字符
JavaScript转义字符

JavaScript中的转义字符是反斜杠和引号,可以在字符串中表示特殊字符或改变字符的含义。本专题为大家提供转义字符相关的文章、下载、课程内容,供大家免费下载体验。

514

2023.09.04

js生成随机数的方法
js生成随机数的方法

js生成随机数的方法有:1、使用random函数生成0-1之间的随机数;2、使用random函数和特定范围来生成随机整数;3、使用random函数和round函数生成0-99之间的随机整数;4、使用random函数和其他函数生成更复杂的随机数;5、使用random函数和其他函数生成范围内的随机小数;6、使用random函数和其他函数生成范围内的随机整数或小数。

1091

2023.09.04

如何启用JavaScript
如何启用JavaScript

JavaScript启用方法有内联脚本、内部脚本、外部脚本和异步加载。详细介绍:1、内联脚本是将JavaScript代码直接嵌入到HTML标签中;2、内部脚本是将JavaScript代码放置在HTML文件的`<script>`标签中;3、外部脚本是将JavaScript代码放置在一个独立的文件;4、外部脚本是将JavaScript代码放置在一个独立的文件。

659

2023.09.12

Js中Symbol类详解
Js中Symbol类详解

javascript中的Symbol数据类型是一种基本数据类型,用于表示独一无二的值。Symbol的特点:1、独一无二,每个Symbol值都是唯一的,不会与其他任何值相等;2、不可变性,Symbol值一旦创建,就不能修改或者重新赋值;3、隐藏性,Symbol值不会被隐式转换为其他类型;4、无法枚举,Symbol值作为对象的属性名时,默认是不可枚举的。

554

2023.09.20

c++ 根号
c++ 根号

本专题整合了c++根号相关教程,阅读专题下面的文章了解更多详细内容。

25

2026.01.23

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 4.1万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 2.4万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号