人工智能如何使用智谱GLM-4_人工智能调用ChatGLM进行对话开发

絕刀狂花

发布时间：2026-02-24 15:26:03

838人浏览过

来源于php中文网

原创

需明确模型部署方式、接口协议与请求结构：一、调用智谱ai官方api；二、本地部署chatglm-4-9b；三、用fastchat托管；四、基于langchain集成对话链。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

人工智能如何使用智谱glm-4_人工智能调用chatglm进行对话开发

如果您希望在应用程序中集成人工智能对话能力，使用智谱AI推出的GLM-4模型或其开源变体ChatGLM系列进行本地或API调用，则需明确模型部署方式、接口协议与请求结构。以下是实现该目标的具体路径：

一、通过智谱AI官方API调用GLM-4

智谱AI提供托管式GLM-4服务，开发者无需自行部署模型，只需申请API密钥并构造符合规范的HTTP请求即可获得高质量文本响应。该方式适用于无GPU资源、追求快速上线及稳定服务的场景。

1、访问智谱AI开放平台注册账号并创建应用，获取API Key与Secret Key。

2、使用OAuth 2.0流程换取access_token，请求地址为https://www.php.cn/link/4002628957f70084918b0d02535b3bcaapi/paas/v4/oauth/token，以client_id和client_secret作为认证凭据。

3、向对话接口https://www.php.cn/link/4002628957f70084918b0d02535b3bcaapi/paas/v4/chat/completions发送POST请求，请求体中包含model字段设为glm-4，messages为标准对话数组，如[{"role": "user", "content": "你好"}]。

4、在请求头中设置Authorization: Bearer {access_token}，并确保Content-Type为application/json。

二、本地部署ChatGLM-4-9B并调用

ChatGLM-4-9B是智谱AI发布的开源轻量级版本，支持在消费级显卡（如RTX 3090/4090）上以量化方式运行。本地部署可保障数据不出域，并允许深度定制推理逻辑与系统提示词。

1、从GitHub仓库https://github.com/THUDM/ChatGLM-4克隆代码，确认环境满足Python ≥ 3.10、PyTorch ≥ 2.1.0及CUDA 12.x要求。

2、执行pip install -r requirements.txt安装依赖，特别注意需安装transformers==4.40.0与accelerate==0.27.2以兼容模型架构。

3、下载已发布的chatglm4-9b-int4量化权重（约5.2GB），存放于./models/chatglm4-9b-int4目录下。

4、运行python cli_demo.py启动命令行交互界面，或修改web_demo.py启用Gradio Web UI，此时服务默认监听http://127.0.0.1:7860。

奇布塔

基于AI生成技术的一站式有声绘本创作平台

下载

三、使用FastChat框架托管ChatGLM模型

FastChat提供统一模型服务层，支持多模型并发、负载均衡与OpenAI兼容API。将ChatGLM-4-9B接入FastChat后，前端可复用标准OpenAI SDK，降低迁移成本。

1、安装FastChat：pip install "fschat[model_worker,webui]"，确保bitsandbytes与flash-attn已正确编译。

2、启动控制器：python -m fastchat.controller --host 127.0.0.1 --port 21001。

3、启动模型工作节点：python -m fastchat.model.worker --controller http://127.0.0.1:21001 --model-path ./models/chatglm4-9b-int4 --model-name chatglm4-9b --no-graceful-exit。

4、启动Web UI：python -m fastchat.webui --controller http://127.0.0.1:21001，或调用兼容OpenAI格式的API端点http://127.0.0.1:8000/v1/chat/completions，其中model参数设为chatglm4-9b。

四、基于LangChain集成ChatGLM对话链

LangChain提供抽象化提示工程、记忆管理与工具调用能力，适配ChatGLM后可构建具备上下文感知、外部知识检索与函数调用能力的智能体。

1、安装langchain与对应扩展：pip install langchain langchain-community transformers accelerate bitsandbytes。

2、定义HuggingFacePipeline实例，加载chatglm4-9b-int4模型并配置pipeline_kwargs={"max_new_tokens": 512, "do_sample": True, "temperature": 0.8}。

3、构造ConversationBufferMemory实例，将历史消息以human/ai角色对形式存入memory_key为history的缓冲区。

4、组合LLMChain，使用预置CONVERSATION_PROMPT模板，其中系统提示部分须明确指定你是一个基于ChatGLM-4-9B的中文对话助手，以激活模型的指令遵循能力。

美图WinkStudio怎么AI绘画_WinkStudio设计室功能详解

lovemo官网网页版入口 lovemo官方免费入口

通义万相怎么生成电商模特_通义万相人台转真人教程

一键生成PPT怎么添加动画效果_AI生成PPT页面切换动画设置

猫箱网页版直接玩猫箱官网在线版入口

相关标签:

人工智能 Agent智能体 AI编程开发 AI提示词智能编程开放平台应用开发 AI大模型

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：AI写作怎么生成导游词解说_写景点介绍的AI提示词怎么写下一篇：AI提示词怎么写格式限定类_要求AI按特定结构输出的写法

作者最新文章

2026新春依旧守初心！美的空调公开在售全系用全铜管

2026-02-24 14:28

豆包AI怎么生成动漫头像定制图_豆包AI绘制二次元个人头像流程

2026-02-24 14:39

一键生成PPT怎么调整文字大小_AI生成PPT字体格式修改方法

2026-02-24 15:00

学信网成绩学位认证系统_学信网2026最新官网登录入口

2026-02-24 15:04

电脑麦克风没声音怎么办_麦克风无声排查修复操作【说明】

2026-02-24 15:13

58同城招聘如何筛选AI宠物健康监测岗_58同城招聘智能养宠新兴职位

2026-02-24 15:25

AI写作怎么生成导游词解说_写景点介绍的AI提示词怎么写

2026-02-24 15:26

人工智能如何使用智谱GLM-4_人工智能调用ChatGLM进行对话开发

2026-02-24 15:26

AI提示词怎么写格式限定类_要求AI按特定结构输出的写法

2026-02-24 15:27

原神月之五版本什么时候更新版本上线时间一览

2026-02-24 15:38

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Golang 疑难杂症解决指南：常见问题排查与优化

《Golang 疑难杂症解决指南》聚焦开发过程中常见却棘手的问题，从并发模型、内存管理、性能瓶颈到工程化实践逐步拆解。通过真实案例与调试思路，帮助开发者定位问题根因，建立系统化排查方法。不只给出答案，更强调分析路径与工具使用，让你在复杂 Go 项目中具备持续解决问题的能力。

2026.02.24

Golang 入门学习路线：从零基础到上手开发

Golang 入门路线涵盖从零到上手的核心路径：首先打牢基础语法与切片等底层机制；随后攻克 Go 的灵魂——接口设计与 Goroutine 并发模型；接着通过 Gin 框架与 GORM 深入 Web 开发实战；最后在微服务与云原生工具开发中进阶，旨在培养具备高性能并发处理能力的后端工程师。

2026.02.24

中国研究生招生信息网官方网站入口研招网网页版在线入口

中国研究生招生信息网入口（https://yz.chsi.com.cn）此网站是研究生报名入口的唯一官方网站

2026.02.24

苹果官网入口与在线访问指南_中国站点快速直达与iPhone查看方法

本专题汇总苹果官网最新可用入口及中国站点访问方式，涵盖官网直达链接、iPhone官方页面查看方法与常见访问说明，帮助用户快速进入苹果官方网站，便捷了解产品信息与官方服务。

2026.02.24

Asianfanfics官网入口与访问指南_AFF官方平台最新登录地址

本专题系统整理Asianfanfics（AFF）官方网站最新可用入口，涵盖官方平台最新直达地址、官网登录方式及中文访问指引，帮助用户快速、安全地进入AFF平台浏览与使用相关内容。

2026.02.24

Go分布式服务治理与链路追踪实践

本专题围绕 Go 语言在分布式系统中的服务治理实践展开，系统讲解服务注册与发现、配置中心、限流熔断、灰度发布以及分布式链路追踪方案。通过完整项目示例，帮助开发者构建可观测性完善、稳定性高、易扩展的 Go 微服务架构体系，提升线上系统问题定位与运维效率。

2026.02.24

Python自动化测试与持续集成实战

本专题聚焦 Python 在自动化测试与持续集成中的工程化实践，系统讲解测试框架选型、测试用例设计、接口自动化、测试数据管理及测试报告生成。结合 CI/CD 流水线场景，讲解如何将自动化测试融入持续集成流程，实现代码提交即自动测试，提升项目交付质量与团队协作效率。

2026.02.24

Java高并发系统设计与性能调优

本专题围绕 Java 在高并发业务场景下的系统设计与性能调优展开，系统讲解线程模型、并发容器、锁机制、异步编程及 JVM 性能调优思路。结合真实高并发业务场景，深入分析接口限流、线程池配置、热点资源优化与系统稳定性保障方案，帮助开发者构建高性能、高可用的 Java 后端系统。

2026.02.24

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式，涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明，帮助用户高效找到pixiv官方网站，实现便捷、安全的网页端浏览与账号登录体验。

1269

2026.02.13

热门下载

网站特效

网站源码

网站素材

前端模板