如何实现PHP调用语音识别API接口_PHP语音识别API(如百度/Google Speech)调用教程

看不見的法師

发布时间：2025-11-07 09:13:07

405人浏览过

来源于php中文网

原创

首先通过HTTP请求调用百度或Google语音识别API，需处理音频格式、鉴权及JSON解析。以百度为例，先用API Key和Secret Key获取Access Token，再将PCM格式音频Base64编码后发送至其接口；Google则需配置服务账户密钥，使用SDK或REST调用，支持流式识别。注意音频格式、大小限制与网络超时，建议封装成类复用。

如何实现php调用语音识别api接口_php语音识别api(如百度/google speech)调用教程

在PHP中调用语音识别API（如百度、Google Speech）主要通过HTTP请求将音频文件或实时音频数据发送到云端服务，再接收返回的文本结果。整个过程涉及音频格式处理、接口鉴权、网络请求和JSON解析。下面以百度语音识别和Google Speech-to-Text为例，介绍具体实现方式。

百度语音识别API调用方法

百度AI开放平台提供中文语音识别服务，支持多种采样率和音频格式。调用前需注册账号并创建语音识别应用，获取API Key和Secret Key。

步骤如下：

使用API Key和Secret Key获取Access Token
准备符合要求的音频文件（WAV/PCM，16bit位深，单声道）
将音频数据Base64编码后发送POST请求至识别接口

获取Access Token示例代码：

function getBaiduToken($apiKey, $secretKey) {
    $url = "https://aip.baidubce.com/oauth/2.0/token";
    $post_data = [
        'grant_type' => 'client_credentials',
        'client_id' => $apiKey,
        'client_secret' => $secretKey
    ];
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_POST, 1);
    curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($post_data));
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    $response = curl_exec($ch);
    curl_close($ch);
    $result = json_decode($response, true);
    return $result['access_token'];
}

调用语音识别接口：

立即学习“PHP免费学习笔记（深入）”；

function baiduSpeechRecognize($audioPath, $token) {
    $audioData = file_get_contents($audioPath);
    $base64Audio = base64_encode($audioData);
    $length = filesize($audioPath);
    $data = [
        "format" => "pcm",
        "rate" => 16000,
        "channel" => 1,
        "cuid" => "your_device_id",
        "token" => $token,
        "len" => $length,
        "speech" => $base64Audio
    ];
    $jsonData = json_encode($data);
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, "https://vop.baidu.com/pro_api");
    curl_setopt($ch, CURLOPT_POST, 1);
    curl_setopt($ch, CURLOPT_POSTFIELDS, $jsonData);
    curl_setopt($ch, CURLOPT_HTTPHEADER, [
        'Content-Type: application/json',
        'Content-Length: ' . strlen($jsonData)
    ]);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    $response = curl_exec($ch);
    curl_close($ch);
    return json_decode($response, true);
}

Google Speech-to-Text API调用方法

Google Cloud Speech-to-Text支持多语言识别，功能强大。使用前需开通Google Cloud项目，启用Speech API，并配置服务账户密钥文件。

Imagine By Magic Studio

AI图片生成器，用文字制作图片

下载

实现要点：

下载服务账户JSON密钥文件
安装Google Cloud PHP SDK（推荐使用Composer）
设置环境变量GOOGLE_APPLICATION_CREDENTIALS指向密钥文件

使用SDK进行识别：

require 'vendor/autoload.php';

use Google\Cloud\Speech\V1\SpeechClient;
use Google\Cloud\Speech\V1\RecognitionConfig\AudioEncoding;
use Google\Cloud\Speech\V1\RecognitionConfig;
use Google\Cloud\Speech\V1\RecognitionAudio;

$client = new SpeechClient();

$config = new RecognitionConfig([
    'encoding' => AudioEncoding::LINEAR16,
    'sample_rate_hertz' => 16000,
    'language_code' => 'zh-CN'
]);

$audio = new RecognitionAudio();
$audio->setContent(file_get_contents('audio.wav'));

$response = $client->recognize($config, $audio);
$results = $response->getResults();

foreach ($results as $result) {
    $alternatives = $result->getAlternatives();
    $mostLikely = $alternatives[0];
    echo $mostLikely->getTranscript();
}

$client->close();

若不使用SDK，也可直接调用REST接口，需手动处理OAuth 2.0令牌和JSON请求体。

注意事项与常见问题

实际开发中需注意以下几点：

音频格式必须符合API要求，否则返回错误或识别失败
百度接口对单个音频大小有限制（通常不超过10MB）
Google API支持流式识别，适合长音频或实时场景
网络请求需处理超时和重试机制
生产环境应缓存Access Token避免频繁获取

对于非标准格式音频，可用FFmpeg转换：

ffmpeg -i input.mp3 -ar 16000 -ac 1 -f s16le output.pcm 基本上就这些。只要准备好认证信息、规范音频格式、正确构造请求，PHP调用语音识别并不复杂，但细节容易出错，建议封装成类便于复用。

PHP 调用 API 下载 Blob 图像（如 QR Code）的完整实践指南

PHP执行PY隐藏超时限制怎么破_延长执行时间的技巧【技巧】

PHP文件上传后怎么在线预览_PHP上传文件在线预览功能制作【教程】

如何在不加载整个文件的情况下替换大型 CSV 文件的表头

如何在不加载整个大文件到内存的情况下替换 CSV 文件的头部行

PHP速学教程(入门到精通)

PHP怎么学习？PHP怎么入门？PHP在哪学？PHP怎么学才快？不用担心，这里为大家提供了PHP速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关专题

composer是什么插件

Composer是一个PHP的依赖管理工具，它可以帮助开发者在PHP项目中管理和安装依赖的库文件。Composer通过一个中央化的存储库来管理所有的依赖库文件，这个存储库包含了各种可用的依赖库的信息和版本信息。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

161

2023.12.25

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

457

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

547

2023.08.23

jquery怎么操作json

操作的方法有：1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”；3、“$.each(obj, callback)”；4、“$.ajax()”。更多jquery怎么操作json的详细内容，可以访问本专题下面的文章。

335

2023.10.13

go语言处理json数据方法

本专题整合了go语言中处理json数据方法，阅读专题下面的文章了解更多详细内容。

2025.09.10

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6609

2023.09.14

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

842

2023.09.14

token怎么获取

获取token值的方法：1、小程序调用“wx.login()”获取临时登录凭证code，并回传到开发者服务器；2、开发者服务器以code换取，用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容，可以阅读本专题下面的文章。

1092

2023.12.21

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板