0

0

DeepSeek怎么离线部署到本地_DeepSeek私有化部署安装详细流程【技术】

裘德小鎮的故事

裘德小鎮的故事

发布时间:2026-02-24 14:11:02

|

955人浏览过

|

来源于php中文网

原创

需完成环境隔离、依赖预下载、模型本地化加载及服务启动四步离线部署:一、联网机导出依赖并下载wheel包与模型压缩包;二、离线机安装miniconda并仅从本地wheel安装;三、解压模型至固定路径并设hf_hub_offline=1;四、使用gradio离线静态资源构建web ui;五、启用sqlite本地存储与内网绑定。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

deepseek怎么离线部署到本地_deepseek私有化部署安装详细流程【技术】

如果您希望在无网络环境下运行DeepSeek模型,则需完成完整的离线部署流程。该过程涉及环境隔离、依赖预下载、模型文件本地化加载及服务启动等关键环节。以下是实现DeepSeek私有化离线部署的具体操作步骤:

一、准备离线依赖与模型文件

离线部署的前提是所有必要组件(Python包、CUDA工具、模型权重)均需提前在有网环境中下载并转移至目标机器。避免在离线环境中执行任何联网安装或远程拉取操作。

1、在联网机器上创建专用conda环境并导出依赖清单:
conda create -n deepseek_offline python=3.10
conda activate deepseek_offline
pip install torch==2.1.0+cu121 transformers==4.35.0 faiss-cpu chromadb==0.4.12 accelerate==0.27.2
pip freeze > requirements_offline.txt

2、使用pip download命令批量下载wheel包:
pip download -r requirements_offline.txt --no-deps --platform manylinux2014_x86_64 --python-version 310 --only-binary=:all: -d ./offline_wheels

3、从Hugging Face镜像站或官方GitHub Release页面下载指定模型压缩包(如DeepSeek-R1-Distill-Qwen-7B),保存为deepseek-r1-qwen7b-offline.tar.gz,并校验SHA256哈希值。

4、将offline_wheels/目录与模型压缩包整体拷贝至目标离线主机的/opt/deepseek/offline/路径下。

二、配置离线Python环境

在目标主机上重建完全隔离的运行时环境,确保不调用系统级Python或全局pip源,所有依赖均来自本地wheel文件。

1、安装Miniconda3(离线安装包需提前下载):
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b -p $HOME/miniconda3

2、初始化conda并创建离线专用环境:
$HOME/miniconda3/bin/conda init bash
source ~/.bashrc
conda create -n deepseek_local python=3.10

3、激活环境后强制仅从本地wheel安装依赖:
conda activate deepseek_local
pip install --find-links ./offline_wheels --no-index --trusted-host None ./offline_wheels/*.whl

4、验证核心库可导入:
python -c "import torch; print(torch.__version__)"
python -c "from transformers import AutoTokenizer; print('OK')"

三、解压并注册本地模型路径

模型文件不得通过AutoModel.from_pretrained()远程加载,必须显式指向本地解压后的目录结构,以绕过Hugging Face Hub访问。

1、解压模型压缩包至固定路径:
tar -xzf deepseek-r1-qwen7b-offline.tar.gz -C /opt/deepseek/models/

Play.ht
Play.ht

根据文本生成多种逼真的语音

下载

2、确认模型目录包含以下关键文件:
config.json、pytorch_model.bin、tokenizer.json、tokenizer_config.json

3、修改启动脚本中的模型加载逻辑,替换为绝对路径引用:
model = AutoModelForCausalLM.from_pretrained("/opt/deepseek/models/DeepSeek-R1-Distill-Qwen-7B", torch_dtype="auto", device_map="auto")

4、设置环境变量禁用远程检查:
export HF_HUB_OFFLINE=1
export TRANSFORMERS_OFFLINE=1

四、构建离线Web UI服务

采用Gradio或FastAPI封装模型推理接口,并打包为单体可执行服务,不依赖外部CDN资源或在线字体/JS库。

1、下载Gradio离线静态资源包(v4.38.0):
wget https://github.com/gradio-app/gradio/releases/download/v4.38.0/gradio-offline-static.zip

2、解压至./gradio_static/,并在Gradio启动时指定静态路径:
gr.Interface(...).launch(server_name="0.0.0.0", server_port=7860, static_assets="./gradio_static/")

3、禁用Gradio自动更新检查:
export GRADIO_ANALYTICS_ENABLED=false

4、启动服务前预编译前端资源:
cd ./gradio_static && npm ci --no-save && npm run build

五、启用本地SQLite持久化与权限控制

所有元数据、会话记录、用户配置均存储于本地SQLite数据库,不连接任何外部数据库服务,同时限制HTTP服务仅绑定内网地址。

1、初始化嵌入式数据库:
deepseek init-db --db-path /opt/deepseek/data/db.sqlite3

2、编辑配置文件config.yaml,设置:
database: sqlite:///opt/deepseek/data/db.sqlite3
webui_host: 127.0.0.1
webui_port: 7860

3、关闭所有外部日志上报与遥测功能:
export DEEPSEEK_TELEMETRY_ENABLED=false
export LOG_LEVEL=WARNING

4、以非root用户启动服务:
sudo -u deepseek-user deepseek start --config /opt/deepseek/config.yaml

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
苹果官网入口与在线访问指南_中国站点快速直达与iPhone查看方法
苹果官网入口与在线访问指南_中国站点快速直达与iPhone查看方法

本专题汇总苹果官网最新可用入口及中国站点访问方式,涵盖官网直达链接、iPhone官方页面查看方法与常见访问说明,帮助用户快速进入苹果官方网站,便捷了解产品信息与官方服务。

4

2026.02.24

Asianfanfics官网入口与访问指南_AFF官方平台最新登录地址
Asianfanfics官网入口与访问指南_AFF官方平台最新登录地址

本专题系统整理Asianfanfics(AFF)官方网站最新可用入口,涵盖官方平台最新直达地址、官网登录方式及中文访问指引,帮助用户快速、安全地进入AFF平台浏览与使用相关内容。

9

2026.02.24

Go分布式服务治理与链路追踪实践
Go分布式服务治理与链路追踪实践

本专题围绕 Go 语言在分布式系统中的服务治理实践展开,系统讲解服务注册与发现、配置中心、限流熔断、灰度发布以及分布式链路追踪方案。通过完整项目示例,帮助开发者构建可观测性完善、稳定性高、易扩展的 Go 微服务架构体系,提升线上系统问题定位与运维效率。

1

2026.02.24

Python自动化测试与持续集成实战
Python自动化测试与持续集成实战

本专题聚焦 Python 在自动化测试与持续集成中的工程化实践,系统讲解测试框架选型、测试用例设计、接口自动化、测试数据管理及测试报告生成。结合 CI/CD 流水线场景,讲解如何将自动化测试融入持续集成流程,实现代码提交即自动测试,提升项目交付质量与团队协作效率。

0

2026.02.24

Java高并发系统设计与性能调优
Java高并发系统设计与性能调优

本专题围绕 Java 在高并发业务场景下的系统设计与性能调优展开,系统讲解线程模型、并发容器、锁机制、异步编程及 JVM 性能调优思路。结合真实高并发业务场景,深入分析接口限流、线程池配置、热点资源优化与系统稳定性保障方案,帮助开发者构建高性能、高可用的 Java 后端系统。

5

2026.02.24

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1257

2026.02.13

微博网页版主页入口与登录指南_官方网页端快速访问方法
微博网页版主页入口与登录指南_官方网页端快速访问方法

本专题系统整理微博网页版官方入口及网页端登录方式,涵盖首页直达地址、账号登录流程与常见访问问题说明,帮助用户快速找到微博官网主页,实现便捷、安全的网页端登录与内容浏览体验。

402

2026.02.13

Flutter跨平台开发与状态管理实战
Flutter跨平台开发与状态管理实战

本专题围绕Flutter框架展开,系统讲解跨平台UI构建原理与状态管理方案。内容涵盖Widget生命周期、路由管理、Provider与Bloc状态管理模式、网络请求封装及性能优化技巧。通过实战项目演示,帮助开发者构建流畅、可维护的跨平台移动应用。

252

2026.02.13

TypeScript工程化开发与Vite构建优化实践
TypeScript工程化开发与Vite构建优化实践

本专题面向前端开发者,深入讲解 TypeScript 类型系统与大型项目结构设计方法,并结合 Vite 构建工具优化前端工程化流程。内容包括模块化设计、类型声明管理、代码分割、热更新原理以及构建性能调优。通过完整项目示例,帮助开发者提升代码可维护性与开发效率。

39

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号