0

0

DeepSeek如何写Nginx负载均衡_DeepSeek服务器分流配置【必看】

冰火之心

冰火之心

发布时间:2026-02-20 17:27:35

|

934人浏览过

|

来源于php中文网

原创

nginx upstream 不能直接配置 deepseek 官方 api 地址,因其仅提供网关入口(如 https://api.deepseek.com),需用反向代理透传 host、authorization 等头,并关闭缓冲、调长超时以支持流式响应。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

deepseek如何写nginx负载均衡_deepseek服务器分流配置【必看】

nginx upstream 配置里不能直接写 DeepSeek 的 API 地址

DeepSeek 官方不提供可直连的公网后端服务地址,所有请求必须走其官方网关(如 https://api.deepseek.com),你没法把它的服务器 IP 加进 upstream 块做传统负载均衡。硬加会 502 或连接拒绝。

真正能做的,是用 Nginx 反向代理 + 请求级分流,比如按 Authorization 头、路径前缀或客户端 IP 做路由决策。

  • 别在 upstream 里填 api.deepseek.com —— Nginx 不支持 HTTPS upstream 直连(除非编译时加 --with-http_ssl_module 且配 proxy_ssl_* 参数)
  • 若真要多实例分担自身服务压力(比如你起了多个本地 DeepSeek 推理服务),才需要 upstream;但 DeepSeek 官方 API 本身不开放自托管模型节点
  • 常见错误:upstream server api.deepseek.com:443; → 直接报 invalid port while resolving upstream

proxy_pass 必须带协议和完整路径,否则 Host 头错乱

DeepSeek API 对 HostAuthorization 头敏感,Nginx 默认转发时可能丢掉原始 Host,或把路径拼错,导致 400 Bad Request401 Unauthorized

MedPeer
MedPeer

AI驱动的一站式科研服务平台

下载
  • 正确写法:proxy_pass https://api.deepseek.com/;(结尾斜杠不能少)
  • 错误写法:proxy_pass https://api.deepseek.com;(缺末尾 /,Nginx 会把 location 路径硬拼上去,比如 /v1/chat/completions 变成 /v1/chat/completions/v1/chat/completions
  • 必须显式透传头:proxy_set_header Host api.deepseek.com;,否则对方网关无法识别来源
  • 别漏掉 proxy_set_header Authorization $http_authorization;,Bearer Token 否则传不过去

跨域(CORS)问题不是加 add_header 就能解决的

浏览器前端直连 DeepSeek API 会触发预检(OPTIONS),而 DeepSeek 网关不响应 OPTIONS 请求,所以你在 Nginx 层加 add_header Access-Control-Allow-Origin "*" 没用——预检失败,后续请求根本发不出。

  • 真实可行方案:只在 Nginx 上处理非浏览器场景(如后端服务调用),或用中间层(如 Next.js API Route)中转,避开浏览器 CORS
  • 如果坚持用 Nginx 模拟响应 OPTIONS:if ($request_method = 'OPTIONS') { add_header Access-Control-Allow-Origin "*"; add_header Access-Control-Allow-Methods "GET, POST, OPTIONS"; add_header Access-Control-Allow-Headers "DNT,User-Agent,X-Auth-Token,Content-Type,Authorization,Accept,Origin"; add_header Access-Control-Max-Age 1728000; add_header Content-Type 'text/plain; charset=utf-8'; add_header Content-Length 0; return 204; }
  • 但注意:DeepSeek 的实际响应头(如 X-RateLimit-Limit)不会被浏览器读取,因为预检没过,add_header 只影响 Nginx 自己返回的内容

超时和缓冲区不调大会卡死长响应

DeepSeek 的 /v1/chat/completions 流式响应(stream=true)可能持续几十秒,Nginx 默认超时只有 60 秒,且默认关闭流式支持,容易截断响应或返回空内容。

  • 关键配置三件套:proxy_read_timeout 300;(匹配 DeepSeek 最大响应时间)、proxy_buffering off;(必须关,否则流式数据全缓存完才吐给客户端)、proxy_http_version 1.1;(启用 keepalive,避免流中断)
  • 别碰 proxy_buffer_sizeproxy_buffers —— 流式响应下缓冲区大小反而影响实时性,设太小会频繁 flush,太大延迟高
  • 错误现象:curl -N 看到响应卡在中途不动,或者返回 {"error": {"message": "Connection closed", ...}},基本就是 proxy_buffering on 或超时太短

DeepSeek 的响应体结构依赖完整流,Nginx 层任何缓冲、重写或 header 干预都可能破坏 SSE 格式。最稳的做法是尽量少动原始响应,只做路由和透传。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

705

2026.02.13

微博网页版主页入口与登录指南_官方网页端快速访问方法
微博网页版主页入口与登录指南_官方网页端快速访问方法

本专题系统整理微博网页版官方入口及网页端登录方式,涵盖首页直达地址、账号登录流程与常见访问问题说明,帮助用户快速找到微博官网主页,实现便捷、安全的网页端登录与内容浏览体验。

233

2026.02.13

Flutter跨平台开发与状态管理实战
Flutter跨平台开发与状态管理实战

本专题围绕Flutter框架展开,系统讲解跨平台UI构建原理与状态管理方案。内容涵盖Widget生命周期、路由管理、Provider与Bloc状态管理模式、网络请求封装及性能优化技巧。通过实战项目演示,帮助开发者构建流畅、可维护的跨平台移动应用。

117

2026.02.13

TypeScript工程化开发与Vite构建优化实践
TypeScript工程化开发与Vite构建优化实践

本专题面向前端开发者,深入讲解 TypeScript 类型系统与大型项目结构设计方法,并结合 Vite 构建工具优化前端工程化流程。内容包括模块化设计、类型声明管理、代码分割、热更新原理以及构建性能调优。通过完整项目示例,帮助开发者提升代码可维护性与开发效率。

22

2026.02.13

Redis高可用架构与分布式缓存实战
Redis高可用架构与分布式缓存实战

本专题围绕 Redis 在高并发系统中的应用展开,系统讲解主从复制、哨兵机制、Cluster 集群模式及数据分片原理。内容涵盖缓存穿透与雪崩解决方案、分布式锁实现、热点数据优化及持久化策略。通过真实业务场景演示,帮助开发者构建高可用、可扩展的分布式缓存系统。

61

2026.02.13

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

30

2026.02.12

雨课堂网页版登录入口与使用指南_官方在线教学平台访问方法
雨课堂网页版登录入口与使用指南_官方在线教学平台访问方法

本专题系统整理雨课堂网页版官方入口及在线登录方式,涵盖账号登录流程、官方直连入口及平台访问方法说明,帮助师生用户快速进入雨课堂在线教学平台,实现便捷、高效的课程学习与教学管理体验。

15

2026.02.12

豆包AI网页版入口与智能创作指南_官方在线写作与图片生成使用方法
豆包AI网页版入口与智能创作指南_官方在线写作与图片生成使用方法

本专题汇总豆包AI官方网页版入口及在线使用方式,涵盖智能写作工具、图片生成体验入口和官网登录方法,帮助用户快速直达豆包AI平台,高效完成文本创作与AI生图任务,实现便捷智能创作体验。

669

2026.02.12

PostgreSQL性能优化与索引调优实战
PostgreSQL性能优化与索引调优实战

本专题面向后端开发与数据库工程师,深入讲解 PostgreSQL 查询优化原理与索引机制。内容包括执行计划分析、常见索引类型对比、慢查询优化策略、事务隔离级别以及高并发场景下的性能调优技巧。通过实战案例解析,帮助开发者提升数据库响应速度与系统稳定性。

58

2026.02.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
进程与SOCKET
进程与SOCKET

共6课时 | 0.4万人学习

nginx浅谈
nginx浅谈

共15课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号