WebRTC是实现点对点实时音视频通信的成熟方案,通过getUserMedia获取本地流,RTCPeerConnection建立连接并添加音视频轨道,结合STUN/TURN服务器进行NAT穿透,利用信令通道交换SDP和ICE候选完成协商,最终实现媒体流直连传输。

要实现点对点的实时音视频通信,WebRTC 是目前最成熟且无需插件的浏览器原生方案。它允许两个用户在不经过服务器中转媒体流的情况下直接传输音频和视频数据。整个过程依赖信令机制、网络穿透技术和安全协议协同完成。
获取本地音视频流
通信的第一步是获取用户的摄像头和麦克风权限,并采集音视频流。
使用 getUserMedia() API 可以请求访问设备媒体:
- 调用 navigator.mediaDevices.getUserMedia() 并传入音频和视频约束
- 成功后返回一个 MediaStream 对象,可绑定到页面的 video 元素进行预览
- 注意处理用户拒绝权限的情况,提供友好的提示
const constraints = { audio: true, video: true };
navigator.mediaDevices.getUserMedia(constraints)
.then(stream => {
localVideo.srcObject = stream;
// 将流添加到 RTCPeerConnection
})
.catch(err => console.error('无法获取媒体流:', err));
建立RTCPeerConnection连接
核心通信由 RTCPeerConnection 实现,负责加密传输音视频流并处理 NAT 穿透。
- 创建 RTCPeerConnection 实例,可配置 STUN/TURN 服务器帮助发现公网地址
- 将上一步获取的本地流中的 Track 添加到连接中:addTrack()
- 监听远程流事件 ontrack,当对方发送流时自动接收并播放
const config = {
iceServers: [
{ urls: 'stun:stun.l.google.com:19302' }, // STUN 服务器
{ urls: 'turn:your-turn-server.com', username: 'user', credential: 'pass' } // 可选 TURN
]
};
const pc = new RTCPeerConnection(config);
pc.addTrack(localStream.getTracks()[0], localStream); // 添加音视频轨道
pc.ontrack = event => remoteVideo.srcObject = event.streams[0];
交换信令与连接协商
WebRTC 本身不定义信令传输方式,需借助外部通道(如 WebSocket)交换连接信息。
- 创建 Offer 方调用 createOffer() 生成 SDP 描述,并通过 setLocalDescription 设置为本地描述
- 将 Offer 发送给对方,接收方将其作为远程描述 setRemoteDescription
- 接收方调用 createAnswer() 生成 Answer,返回给发起方
- 双方通过 onicecandidate 监听 ICE 候选地址,收集完成后发送给对方
只有完整交换了 Offer、Answer 和 ICE 候选,连接才能建立。
处理网络环境与异常
真实网络中存在防火墙、NAT 等限制,需合理配置 ICE 框架。
- 仅使用 STUN 服务器可解决多数情况下的 NAT 映射
- 在对称型 NAT 或企业网络中,必须部署 TURN 服务器作为中继备份
- 监听 connectionStateChange 和 iceConnectionStateChange 事件,及时反馈连接状态
- 连接中断时尝试重新协商或提示用户重连
基本上就这些。WebRTC 的强大在于其自动化处理编解码、抖动缓冲、带宽自适应等复杂问题,开发者只需关注信令流程和连接管理。只要两端能完成 SDP 协商并打通 ICE 路径,就能实现高效低延迟的点对点通信。










