0

0

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

星夢妙者

星夢妙者

发布时间:2025-04-22 15:04:00

|

855人浏览过

|

来源于php中文网

原创

在人工智能的浪潮中,越来越多的开发者和企业开始尝试将大规模语言模型(llms)部署到本地环境中,以降低成本、提高数据安全性并提升应用性能。高性能应用服务hai 和 ollama 作为一种新兴的工具,为开发者提供了一个轻松的本地部署与调用接口,支持多种大模型的使用与管理。

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

本文将深入探讨 高性能应用服务HAI 结合 Ollama API 的基础设施、主要功能及其在实际项目中的应用,带你走在前沿的人工智能技术应用之路。

Ollama:本地大模型部署的新选择

在过去几年中,云端大模型的部署逐渐成为了主流,但随着模型体积的逐步增大,云端服务的成本也在水涨船高。而对于一些特定的行业或应用场景,安全性、响应速度以及对个性化定制需求的提升,也让本地部署成为一种理想的选择。Ollama 的出现为开发者提供了高效的解决方案,它不仅支持本地模型的管理,还允许开发者在无需高配置硬件的前提下,使用诸如 混元、LLaMA、deepseek 等多种大模型。

Ollama 提供的 API 使得开发者能够通过简单的接口与本地大模型进行交互,从而有效降低了使用 AI 技术的门槛。

Ollama API:功能解析

Ollama 的核心优势在于其 API 的多功能性与灵活性。通过这些 API,用户可以完成文本生成、对话管理、模型管理等多项任务。我们将从基础功能到进阶功能逐一讲解。本文将介绍如何使用 Ollama API 进行文本生成,重点使用 deepseek-r1:7b 进行交互。

安装与启动 Ollama

PHP中文网高性能应用服务 HAI 已经为我们预先安装好了 Ollama,开发者可以直接使用。只需打开 HAI 服务器,通过 JupyterLab 的 SSH 连接服务器,查看端口号后即可启动 Ollama。

启动 Ollama 的命令如下:

代码语言:bash复制
<code class="bash">ollama serve</code>

执行此命令后,Ollama 即可在本地运行。

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南
发送 API 请求

Ollama 提供了 RESTful API,主要使用 POST /api/generate 接口进行文本生成。以下是具体的请求方式与参数说明。

API 请求示例

可以使用 curl 发送请求,示例如下:

代码语言:bash复制
<code class="bash">curl http://localhost:6399/api/generate -d '{  "model": "deepseek-r1:7b",  "prompt": "请解释量子纠缠的概念。",  "stream": false}'</code>
请求参数说明

参数

必填

说明

model

模型名称(如 deepseek-r1:7b

prompt

输入提示,模型根据此生成响应

stream

免费语音克隆
免费语音克隆

这是一个提供免费语音克隆服务的平台,用户只需上传或录制一段 5 秒以上的清晰语音样本,平台即可生成与用户声音高度一致的 AI 语音克隆。

下载

是否流式返回(默认 true

format

返回格式(如 json

响应示例
使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南
进阶使用开启流式输出

如果希望逐步接收模型的响应,可以将 stream 设置为 true,示例如下:

代码语言:bash复制
<code class="bash">curl http://localhost:6399/api/generate -d '{  "model": "deepseek-r1:7b",  "prompt": "请讲述一个科幻故事",  "stream": true}'</code>

返回

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南
使用 JSON 格式化响应代码语言:bash复制
<code class="bash">curl http://localhost:6399/api/generate -d '{  "model": "deepseek-r1:7b",  "prompt": "介绍黑洞的形成过程。",  "format": "json",  "stream": false}'</code>
使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南
多轮对话(对话补全)

Ollama 还支持多轮对话,适用于构建聊天机器人、智能客服等应用。通过 messages 参数,你可以定义多轮对话的上下文,模型将依据历史对话内容进行回答。

例如,发送多轮对话请求:

代码语言:bash复制
<code class="bash">curl http://localhost:6399/api/chat -d '{  "model": "deepseek-r1:7b",  "messages": [    {"role": "user", "content": "你好"},    {"role": "assistant", "content": "你好!有什么可以帮助你的吗?"},    {"role": "user", "content": "人工智能的发展趋势是什么?"}  ]}'</code>
使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南
主要参数说明model: (必需)模型名称prompt: 要生成响应的提示suffix: 模型响应后的文本images: (可选)一个base64编码的图像列表(用于多模态模型,如 llava

高级参数(可选):

format: 返回响应的格式。目前唯一接受的值是 jsonoptions: 其他模型参数,如 temperatureseedsystem: 系统消息template: 要使用的提示模板context: 从先前对 /generate 的请求中返回的上下文参数,可以用于保持简短的对话记忆stream: 如果设置为 false ,响应将作为单个响应对象返回,而不是一系列对象流raw: 如果设置为 true ,将不会对提示进行任何格式化。如果您在请求API时指定了完整的模板提示,可以选择使用 raw 参数keep_alive: 控制模型在请求后保留在内存中的时间(默认:5m)开放 API

为了使外部应用能够访问本地的 Ollama 服务,我们需要开放 API 接口。首先,可以查看公网 IP 地址,确保外网可以访问。

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

点击添加规则按钮

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

接下来,在服务器中设置防火墙规则,开放所需的端口(例如 6399 或其他指定端口)。完成后,在防火墙规则中将显示已添加的记录。

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

完成开放后,列表中会增加一条记录。

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

然后,我们可以使用 Postman 等工具,向开放的 API 接口发送请求进行测试:

代码语言:bash复制
<code class="bash">http://你的外网IP:11434/api/generate</code>

通过此方法,开发者可以轻松搭建自己的本地 AI 服务,并通过开放的 API 接口与外部进行交互。

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南

最后不要忘记关机哦!

使用 HAI 结合 Ollama API 打造高效文本生成系统:deepseek-r1:7b 实践指南
结语

Ollama API 为开发者提供了灵活且高效的本地大模型管理与交互方式。本文详细介绍了如何使用 deepseek-r1:7b 进行文本生成,并展示了高性能应用服务HAI 结合 API 的基本请求方式及进阶用法。无论是自动化内容生成,还是构建智能对话系统,Ollama 都能为你提供强有力的支持。

如果你对本地大模型推理及应用感兴趣,高性能应用服务HAI 是一个值得尝试的强大工具,它能够帮助你快速搭建属于自己的 AI 助手或服务,推动你在人工智能领域的进一步探索。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
PHP API接口开发与RESTful实践
PHP API接口开发与RESTful实践

本专题聚焦 PHP在API接口开发中的应用,系统讲解 RESTful 架构设计原则、路由处理、请求参数解析、JSON数据返回、身份验证(Token/JWT)、跨域处理以及接口调试与异常处理。通过实战案例(如用户管理系统、商品信息接口服务),帮助开发者掌握 PHP构建高效、可维护的RESTful API服务能力。

179

2025.11.26

json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

455

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

546

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

334

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

82

2025.09.10

软件测试常用工具
软件测试常用工具

软件测试常用工具有Selenium、JUnit、Appium、JMeter、LoadRunner、Postman、TestNG、LoadUI、SoapUI、Cucumber和Robot Framework等等。测试人员可以根据具体的测试需求和技术栈选择适合的工具,提高测试效率和准确性 。

463

2023.10.13

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

887

2023.07.31

python中的format是什么意思
python中的format是什么意思

python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

461

2024.06.27

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 21万人学习

Webpack4.x---十天技能课堂
Webpack4.x---十天技能课堂

共20课时 | 1.5万人学习

Bootstrap4.x---十天精品课堂
Bootstrap4.x---十天精品课堂

共22课时 | 1.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号