处理deepseek api流式响应需按sse格式解析:一、浏览器用fetch+readablestream逐块解码;二、python用requests.iter_lines过滤data:行;三、node.js用http模块监听data事件;四、curl+awk调试提取content;五、asyncio+aiohttp异步迭代解析。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您调用DeepSeek API并启用了流式响应(stream=true),服务器将返回一个持续传输的SSE(Server-Sent Events)格式数据流,而非单次完整JSON响应。以下是处理和解析该流式响应的具体方法:
一、使用Fetch API配合ReadableStream逐块读取
浏览器环境可通过fetch发起请求,利用Response.body.getReader()获取可读流,按chunk边界解析事件数据。该方式避免等待整个响应结束,实现低延迟实时处理。
1、设置请求头Accept为text/event-stream,并在init对象中指定mode为cors、cache为no-cache。
2、调用response.body.getReader()获取流读取器。
3、使用read()循环读取Uint8Array数据块,通过TextDecoder逐块解码为字符串。
4、按行分割解码后字符串,过滤以data:开头的行,去除前缀后对JSON内容执行JSON.parse()。
5、遇到event: done或流结束时终止循环。
二、使用Python requests库配合iter_lines解析SSE
requests响应对象支持iter_lines()方法,可按换行符切分原始响应体,适用于服务端同步脚本。该方式无需额外依赖异步框架,兼容性高。
1、构造POST请求,headers中包含Authorization和Content-Type,json payload中设置stream=True。
2、接收响应后,调用response.iter_lines(decode_unicode=True)获取生成器。
3、遍历每一行,跳过空行及以event:、id:、retry:开头的控制行。
4、对匹配data:开头的行,提取冒号后内容并去除首尾空白,执行json.loads()解析为字典。
5、当解析出delta字段且content不为空时,拼接至累积文本变量中。
三、使用Node.js原生http模块手动处理响应流
Node.js中可直接监听http.IncomingMessage的data事件,以Buffer形式接收分块数据,适用于无第三方HTTP客户端的轻量场景。该方式对内存占用可控,适合嵌入式或资源受限环境。
1、调用https.request(),options中设置method为POST,headers包含Authorization及Accept: text/event-stream。
2、监听response事件,在回调中监听data事件,将每个chunk Buffer传入Buffer.concat()暂存。
3、在end事件触发前,对暂存Buffer执行toString(),按 分割后筛选含data:的行。
4、对每条data行执行line.slice(6).trim()截取JSON字符串,再用JSON.parse()还原对象。
5、检查parsed对象中是否存在choices数组及delta字段,提取content值进行流式输出。
四、使用curl命令结合awk实时提取content字段
在Linux/macOS终端调试阶段,可借助curl流式输出能力配合文本工具链快速验证API行为。该方式无需编程,适合快速排查字段结构与分块逻辑。
1、执行curl -N -X POST -H "Authorization: Bearer YOUR_KEY" -H "Content-Type: application/json" -d '{"model":"deepseek-chat","messages":[{"role":"user","content":"Hello"}],"stream":true}' https://api.deepseek.com/v1/chat/completions。
2、将输出管道传给awk,设定RS=" "使记录分隔符为双换行,匹配/^data:/行。
3、对匹配行执行sub(/^data: /,"")移除前缀,再用gsub(/\n/,"")清除内部转义换行。
4、调用match($0,/"content":"([^"]*)"/,arr)提取content值,打印arr[1]。
5、当输出出现[Done]或流中断时,命令自然退出。
五、使用asyncio + aiohttp实现高并发异步流处理
在Python异步服务中,aiohttp.ClientSession支持流式响应,配合async for可非阻塞地迭代chunks。该方式适用于需同时处理多个流式请求的网关或代理服务。
1、创建aiohttp.TCPConnector配置limit_per_host限制并发连接数。
2、使用session.post()发起请求,确保headers中包含Accept: text/event-stream。
3、调用response.content.iter_any()获取异步迭代器,每次yield一个bytes块。
4、将块累加至bytearray,按b" "切分,识别以b"data:"开头的片段。
5、对有效data片段调用json.loads(chunk.decode().strip()[6:])解析JSON对象。
6、从解析结果中提取choices[0].delta.content字段,作为异步生成器产出项。











