需通过部署MiGPT-Server桥接小爱音箱与豆包AI:一、Docker部署服务并配置API密钥;二、获取小米账号passToken;三、抓包获取音箱did并填入配置;四、在小米AI平台注册自定义技能并指向本地服务;五、逐层验证语音链路与响应。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您希望将豆包AI能力赋予智能音箱,使其具备更强大的语音交互与内容生成能力,则需通过第三方开源服务桥接小米生态与豆包大模型接口。以下是实现该目标的具体步骤:
一、部署MiGPT-Server服务
MiGPT-Server是连接小爱音箱与豆包AI的核心中间件,它负责接收音箱语音指令、调用豆包API并返回合成语音响应。需在具备Docker环境的设备(如飞牛NAS、群晖NAS或Linux服务器)上部署。
1、从GitHub克隆项目:执行 git clone https://github.com/idootop/mi-gpt.git 获取最新源码。
2、重命名配置文件:将项目根目录下的 .env.example 改为 .env,并将 .migpt.example.js 改为 .migpt.js。
立即进入“豆包AI人工智官网入口”;
立即学习“豆包AI人工智能在线问答入口”;
3、编辑.env文件:填入火山引擎提供的 DOUBAO_API_KEY 与 DOUBAO_MODEL_ID,确保模型ID对应豆包Pro或豆包Lite等可用版本。
4、启动容器:在项目目录下运行命令 docker run -d --env-file $(pwd)/.env -v $(pwd)/.migpt.js:/app/.migpt.js idootop/mi-gpt:latest。
二、获取并配置小米账号凭证
小爱音箱需通过小米账号体系完成设备识别与指令路由,MiGPT必须持有合法登录态才能向云端发送请求。此过程需绕过常规登录限制,获取长期有效的passToken。
1、使用Chrome浏览器访问 https://account.xiaomi.com/pass/serviceLogin,输入小米账号密码完成登录。
2、按F12打开开发者工具,切换至Network标签页,刷新页面后筛选XHR请求,找到包含 /serviceLoginAuth2 的响应项。
3、在该响应的Headers → Response部分查找 Set-Cookie 字段,提取其中的 passToken=xxx 值。
4、将提取的passToken填入 .migpt.js 文件中的 speaker.passToken 字段。
三、绑定小爱音箱设备信息
MiGPT需明确识别目标音箱的唯一标识,以便正确投递语音响应。设备ID(did)不可直接在APP中查看,须通过抓包或API查询方式获取。
1、在手机端打开“小爱同学”App,进入“我的”→“设置”→“关于小爱同学”,记录设备型号(如XiaoAiSpeakerPro)。
2、保持同一Wi-Fi网络,使用Wireshark或Packet Capture对App后台通信进行抓包,过滤关键词 deviceList 或 getDeviceList。
3、在捕获到的JSON响应中定位 did 字段值,通常为32位十六进制字符串,例如 1234567890abcdef1234567890abcdef。
4、将该did填入 .migpt.js 中 speaker.did 对应位置,并同步确认 speaker.userId 与小米账号UID一致。
四、启用自定义技能并指向服务地址
小爱音箱默认仅响应内置技能,需在小米AI开放平台注册技能,将语音请求转发至本地部署的MiGPT-Server服务,从而触发豆包AI处理流程。
1、访问 https://openai.mi.com,使用已登录的小米账号进入控制台。
2、点击“创建技能”,选择“自定义技能”,填写技能名称(如“豆包问答”)、描述及唤醒词(如“问问豆包”)。
3、在“服务配置”中,将后端URL设为 http://[NAS局域网IP]:3000/api/xiaoai,其中端口3000为MiGPT默认HTTP监听端口。
4、保存并提交审核;审核通过后,在小爱同学App中进入“技能中心”,搜索并启用该技能。
五、验证语音链路与豆包响应
完成全部配置后,需逐层验证语音输入识别、指令转发、豆包API调用及音频播放是否连通,避免单点故障导致无响应。
1、在小爱音箱前说出已配置的唤醒词(如“小爱同学,问问豆包今天天气如何”),观察音箱麦克风灯是否亮起。
2、检查MiGPT容器日志:执行 docker logs -f [container_id],确认出现 Received xiaoai request 与 Calling Doubao API... 日志行。
3、若日志中出现 Doubao response status: 200,说明API调用成功;若为401或403,需核对API Key权限与模型ID有效性。
4、音箱播放语音回复后,可进一步测试连续对话能力:在未关闭会话状态下追加提问,验证上下文维持是否正常。











