0

0

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

星夢妙者

星夢妙者

发布时间:2025-04-22 15:04:00

|

855人浏览过

|

来源于php中文网

原创

在人工智能的浪潮中,越来越多的开发者和企业开始尝试将大规模语言模型(llms)部署到本地环境中,以降低成本、提高数据安全性并提升应用性能。高性能应用服务hai 和 ollama 作为一种新兴的工具,为开发者提供了一个轻松的本地部署与调用接口,支持多种大模型的使用与管理。

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

本文将深入探讨 高性能应用服务HAI 结合 Ollama API 的基础设施、主要功能及其在实际项目中的应用,带你走在前沿的人工智能技术应用之路。

Ollama:本地大模型部署的新选择

在过去几年中,云端大模型的部署逐渐成为了主流,但随着模型体积的逐步增大,云端服务的成本也在水涨船高。而对于一些特定的行业或应用场景,安全性、响应速度以及对个性化定制需求的提升,也让本地部署成为一种理想的选择。Ollama 的出现为开发者提供了高效的解决方案,它不仅支持本地模型的管理,还允许开发者在无需高配置硬件的前提下,使用诸如 混元、LLaMA、deepseek 等多种大模型。

Ollama 提供的 API 使得开发者能够通过简单的接口与本地大模型进行交互,从而有效降低了使用 AI 技术的门槛。

Ollama API:功能解析

Ollama 的核心优势在于其 API 的多功能性与灵活性。通过这些 API,用户可以完成文本生成、对话管理、模型管理等多项任务。我们将从基础功能到进阶功能逐一讲解。本文将介绍如何使用 Ollama API 进行文本生成,重点使用 deepseek-r1:7b 进行交互。

安装与启动 Ollama

PHP中文网高性能应用服务 HAI 已经为我们预先安装好了 Ollama,开发者可以直接使用。只需打开 HAI 服务器,通过 JupyterLab 的 SSH 连接服务器,查看端口号后即可启动 Ollama。

启动 Ollama 的命令如下:

代码语言:bash复制
ollama serve

执行此命令后,Ollama 即可在本地运行。

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南
发送 API 请求

Ollama 提供了 RESTful API,主要使用 POST /api/generate 接口进行文本生成。以下是具体的请求方式与参数说明。

API 请求示例

可以使用 curl 发送请求,示例如下:

代码语言:bash复制
curl http://localhost:6399/api/generate -d '{  "model": "deepseek-r1:7b",  "prompt": "请解释量子纠缠的概念。",  "stream": false}'
请求参数说明

参数

必填

说明

model

模型名称(如 deepseek-r1:7b

prompt

输入提示,模型根据此生成响应

stream

Text-To-Song
Text-To-Song

免费的实时语音转换器和调制器

下载

是否流式返回(默认 true

format

返回格式(如 json

响应示例
使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南
进阶使用开启流式输出

如果希望逐步接收模型的响应,可以将 stream 设置为 true,示例如下:

代码语言:bash复制
curl http://localhost:6399/api/generate -d '{  "model": "deepseek-r1:7b",  "prompt": "请讲述一个科幻故事",  "stream": true}'

返回

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南
使用 JSON 格式化响应代码语言:bash复制
curl http://localhost:6399/api/generate -d '{  "model": "deepseek-r1:7b",  "prompt": "介绍黑洞的形成过程。",  "format": "json",  "stream": false}'
使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南
多轮对话(对话补全)

Ollama 还支持多轮对话,适用于构建聊天机器人、智能客服等应用。通过 messages 参数,你可以定义多轮对话的上下文,模型将依据历史对话内容进行回答。

例如,发送多轮对话请求:

代码语言:bash复制
curl http://localhost:6399/api/chat -d '{  "model": "deepseek-r1:7b",  "messages": [    {"role": "user", "content": "你好"},    {"role": "assistant", "content": "你好!有什么可以帮助你的吗?"},    {"role": "user", "content": "人工智能的发展趋势是什么?"}  ]}'
使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南
主要参数说明model: (必需)模型名称prompt: 要生成响应的提示suffix: 模型响应后的文本images: (可选)一个base64编码的图像列表(用于多模态模型,如 llava

高级参数(可选):

format: 返回响应的格式。目前唯一接受的值是 jsonoptions: 其他模型参数,如 temperatureseedsystem: 系统消息template: 要使用的提示模板context: 从先前对 /generate 的请求中返回的上下文参数,可以用于保持简短的对话记忆stream: 如果设置为 false ,响应将作为单个响应对象返回,而不是一系列对象流raw: 如果设置为 true ,将不会对提示进行任何格式化。如果您在请求API时指定了完整的模板提示,可以选择使用 raw 参数keep_alive: 控制模型在请求后保留在内存中的时间(默认:5m)开放 API

为了使外部应用能够访问本地的 Ollama 服务,我们需要开放 API 接口。首先,可以查看公网 IP 地址,确保外网可以访问。

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

点击添加规则按钮

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

接下来,在服务器中设置防火墙规则,开放所需的端口(例如 6399 或其他指定端口)。完成后,在防火墙规则中将显示已添加的记录。

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

完成开放后,列表中会增加一条记录。

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

然后,我们可以使用 Postman 等工具,向开放的 API 接口发送请求进行测试:

代码语言:bash复制
http://你的外网IP:11434/api/generate

通过此方法,开发者可以轻松搭建自己的本地 AI 服务,并通过开放的 API 接口与外部进行交互。

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

最后不要忘记关机哦!

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南
结语

Ollama API 为开发者提供了灵活且高效的本地大模型管理与交互方式。本文详细介绍了如何使用 deepseek-r1:7b 进行文本生成,并展示了高性能应用服务HAI 结合 API 的基本请求方式及进阶用法。无论是自动化内容生成,还是构建智能对话系统,Ollama 都能为你提供强有力的支持。

如果你对本地大模型推理及应用感兴趣,高性能应用服务HAI 是一个值得尝试的强大工具,它能够帮助你快速搭建属于自己的 AI 助手或服务,推动你在人工智能领域的进一步探索。

相关专题

更多
PHP API接口开发与RESTful实践
PHP API接口开发与RESTful实践

本专题聚焦 PHP在API接口开发中的应用,系统讲解 RESTful 架构设计原则、路由处理、请求参数解析、JSON数据返回、身份验证(Token/JWT)、跨域处理以及接口调试与异常处理。通过实战案例(如用户管理系统、商品信息接口服务),帮助开发者掌握 PHP构建高效、可维护的RESTful API服务能力。

146

2025.11.26

json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

412

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

533

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

309

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

74

2025.09.10

软件测试常用工具
软件测试常用工具

软件测试常用工具有Selenium、JUnit、Appium、JMeter、LoadRunner、Postman、TestNG、LoadUI、SoapUI、Cucumber和Robot Framework等等。测试人员可以根据具体的测试需求和技术栈选择适合的工具,提高测试效率和准确性 。

436

2023.10.13

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

618

2023.07.31

python中的format是什么意思
python中的format是什么意思

python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

430

2024.06.27

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

27

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 12.1万人学习

Webpack4.x---十天技能课堂
Webpack4.x---十天技能课堂

共20课时 | 1.4万人学习

Bootstrap4.x---十天精品课堂
Bootstrap4.x---十天精品课堂

共22课时 | 1.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号