0

0

人工智能如何使用智谱GLM-4_人工智能调用ChatGLM进行对话开发

絕刀狂花

絕刀狂花

发布时间:2026-02-24 15:26:03

|

838人浏览过

|

来源于php中文网

原创

需明确模型部署方式、接口协议与请求结构:一、调用智谱ai官方api;二、本地部署chatglm-4-9b;三、用fastchat托管;四、基于langchain集成对话链。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

人工智能如何使用智谱glm-4_人工智能调用chatglm进行对话开发

如果您希望在应用程序中集成人工智能对话能力,使用智谱AI推出的GLM-4模型或其开源变体ChatGLM系列进行本地或API调用,则需明确模型部署方式、接口协议与请求结构。以下是实现该目标的具体路径:

一、通过智谱AI官方API调用GLM-4

智谱AI提供托管式GLM-4服务,开发者无需自行部署模型,只需申请API密钥并构造符合规范的HTTP请求即可获得高质量文本响应。该方式适用于无GPU资源、追求快速上线及稳定服务的场景。

1、访问智谱AI开放平台注册账号并创建应用,获取API KeySecret Key

2、使用OAuth 2.0流程换取access_token,请求地址为https://www.php.cn/link/4002628957f70084918b0d02535b3bcaapi/paas/v4/oauth/token,以client_idclient_secret作为认证凭据。

3、向对话接口https://www.php.cn/link/4002628957f70084918b0d02535b3bcaapi/paas/v4/chat/completions发送POST请求,请求体中包含model字段设为glm-4messages为标准对话数组,如[{"role": "user", "content": "你好"}]

4、在请求头中设置Authorization: Bearer {access_token},并确保Content-Typeapplication/json

二、本地部署ChatGLM-4-9B并调用

ChatGLM-4-9B是智谱AI发布的开源轻量级版本,支持在消费级显卡(如RTX 3090/4090)上以量化方式运行。本地部署可保障数据不出域,并允许深度定制推理逻辑与系统提示词。

1、从GitHub仓库https://github.com/THUDM/ChatGLM-4克隆代码,确认环境满足Python ≥ 3.10、PyTorch ≥ 2.1.0及CUDA 12.x要求。

2、执行pip install -r requirements.txt安装依赖,特别注意需安装transformers==4.40.0accelerate==0.27.2以兼容模型架构。

3、下载已发布的chatglm4-9b-int4量化权重(约5.2GB),存放于./models/chatglm4-9b-int4目录下。

4、运行python cli_demo.py启动命令行交互界面,或修改web_demo.py启用Gradio Web UI,此时服务默认监听http://127.0.0.1:7860

奇布塔
奇布塔

基于AI生成技术的一站式有声绘本创作平台

下载

三、使用FastChat框架托管ChatGLM模型

FastChat提供统一模型服务层,支持多模型并发、负载均衡与OpenAI兼容API。将ChatGLM-4-9B接入FastChat后,前端可复用标准OpenAI SDK,降低迁移成本。

1、安装FastChat:pip install "fschat[model_worker,webui]",确保bitsandbytesflash-attn已正确编译。

2、启动控制器:python -m fastchat.controller --host 127.0.0.1 --port 21001

3、启动模型工作节点:python -m fastchat.model.worker --controller http://127.0.0.1:21001 --model-path ./models/chatglm4-9b-int4 --model-name chatglm4-9b --no-graceful-exit

4、启动Web UI:python -m fastchat.webui --controller http://127.0.0.1:21001,或调用兼容OpenAI格式的API端点http://127.0.0.1:8000/v1/chat/completions,其中model参数设为chatglm4-9b

四、基于LangChain集成ChatGLM对话链

LangChain提供抽象化提示工程、记忆管理与工具调用能力,适配ChatGLM后可构建具备上下文感知、外部知识检索与函数调用能力的智能体。

1、安装langchain与对应扩展:pip install langchain langchain-community transformers accelerate bitsandbytes

2、定义HuggingFacePipeline实例,加载chatglm4-9b-int4模型并配置pipeline_kwargs={"max_new_tokens": 512, "do_sample": True, "temperature": 0.8}

3、构造ConversationBufferMemory实例,将历史消息以human/ai角色对形式存入memory_keyhistory的缓冲区。

4、组合LLMChain,使用预置CONVERSATION_PROMPT模板,其中系统提示部分须明确指定你是一个基于ChatGLM-4-9B的中文对话助手,以激活模型的指令遵循能力。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Golang 疑难杂症解决指南:常见问题排查与优化
Golang 疑难杂症解决指南:常见问题排查与优化

《Golang 疑难杂症解决指南》聚焦开发过程中常见却棘手的问题,从并发模型、内存管理、性能瓶颈到工程化实践逐步拆解。通过真实案例与调试思路,帮助开发者定位问题根因,建立系统化排查方法。不只给出答案,更强调分析路径与工具使用,让你在复杂 Go 项目中具备持续解决问题的能力。

0

2026.02.24

Golang 入门学习路线:从零基础到上手开发
Golang 入门学习路线:从零基础到上手开发

Golang 入门路线涵盖从零到上手的核心路径:首先打牢基础语法与切片等底层机制;随后攻克 Go 的灵魂——接口设计与 Goroutine 并发模型;接着通过 Gin 框架与 GORM 深入 Web 开发实战;最后在微服务与云原生工具开发中进阶,旨在培养具备高性能并发处理能力的后端工程师。

0

2026.02.24

中国研究生招生信息网官方网站入口 研招网网页版在线入口
中国研究生招生信息网官方网站入口 研招网网页版在线入口

中国研究生招生信息网入口(https://yz.chsi.com.cn) 此网站是研究生报名入口的唯一官方网站

54

2026.02.24

苹果官网入口与在线访问指南_中国站点快速直达与iPhone查看方法
苹果官网入口与在线访问指南_中国站点快速直达与iPhone查看方法

本专题汇总苹果官网最新可用入口及中国站点访问方式,涵盖官网直达链接、iPhone官方页面查看方法与常见访问说明,帮助用户快速进入苹果官方网站,便捷了解产品信息与官方服务。

11

2026.02.24

Asianfanfics官网入口与访问指南_AFF官方平台最新登录地址
Asianfanfics官网入口与访问指南_AFF官方平台最新登录地址

本专题系统整理Asianfanfics(AFF)官方网站最新可用入口,涵盖官方平台最新直达地址、官网登录方式及中文访问指引,帮助用户快速、安全地进入AFF平台浏览与使用相关内容。

13

2026.02.24

Go分布式服务治理与链路追踪实践
Go分布式服务治理与链路追踪实践

本专题围绕 Go 语言在分布式系统中的服务治理实践展开,系统讲解服务注册与发现、配置中心、限流熔断、灰度发布以及分布式链路追踪方案。通过完整项目示例,帮助开发者构建可观测性完善、稳定性高、易扩展的 Go 微服务架构体系,提升线上系统问题定位与运维效率。

1

2026.02.24

Python自动化测试与持续集成实战
Python自动化测试与持续集成实战

本专题聚焦 Python 在自动化测试与持续集成中的工程化实践,系统讲解测试框架选型、测试用例设计、接口自动化、测试数据管理及测试报告生成。结合 CI/CD 流水线场景,讲解如何将自动化测试融入持续集成流程,实现代码提交即自动测试,提升项目交付质量与团队协作效率。

3

2026.02.24

Java高并发系统设计与性能调优
Java高并发系统设计与性能调优

本专题围绕 Java 在高并发业务场景下的系统设计与性能调优展开,系统讲解线程模型、并发容器、锁机制、异步编程及 JVM 性能调优思路。结合真实高并发业务场景,深入分析接口限流、线程池配置、热点资源优化与系统稳定性保障方案,帮助开发者构建高性能、高可用的 Java 后端系统。

5

2026.02.24

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1269

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
麻省理工大佬Python课程
麻省理工大佬Python课程

共34课时 | 5.4万人学习

国外Web开发全栈课程全集
国外Web开发全栈课程全集

共12课时 | 1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号