0

0

DeepSeek如何进行大规模文本的情感倾向标注_编写Python脚本调用API进行自动化分类

P粉602998670

P粉602998670

发布时间:2026-02-05 19:31:02

|

425人浏览过

|

来源于php中文网

原创

可通过DeepSeek API实现大规模文本情感倾向标注:先注册获取API密钥,再配置Python环境与请求参数,设计结构化提示词模板,编写批量处理逻辑,最后解析响应并导出CSV结果。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

deepseek如何进行大规模文本的情感倾向标注_编写python脚本调用api进行自动化分类

如果您希望利用DeepSeek模型对大规模文本进行情感倾向标注,但缺乏本地部署能力或需要快速集成到现有工作流中,则可以通过其提供的API接口实现自动化分类。以下是完成该任务的具体步骤:

一、注册并获取API密钥

要调用DeepSeek的文本情感分析服务,必须先在官方平台完成开发者账号注册,并创建应用以获取合法的API访问凭证。该密钥用于身份验证,确保请求来源可信且具备对应权限。

1、访问DeepSeek开放平台官网,点击“立即注册”完成邮箱验证与基础信息填写。

2、登录后进入“控制台→应用管理”,点击“创建新应用”,填写应用名称与用途描述。

立即学习Python免费学习笔记(深入)”;

3、在应用详情页中复制API Key字段值,该字符串需严格保密,不可硬编码于公开代码中。

二、安装依赖并配置请求环境

Python脚本需借助requests库发起HTTP请求,并通过JSON格式构造符合API规范的输入数据体。同时应设置合理的超时与重试机制,以应对网络波动导致的临时失败。

1、在终端执行命令:pip install requests python-dotenv,安装核心依赖。

2、新建文件.env,在其中写入:DEEPSEEK_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx(替换为实际密钥)。

3、在Python脚本开头添加加载逻辑:from dotenv import load_dotenv; load_dotenv(),确保环境变量生效。

三、构造情感分类提示词模板

DeepSeek模型本身不内置专用情感分析指令,需通过精心设计的system prompt引导其输出结构化情感标签。不同情感粒度(如三分类/五分类)需对应不同提示语,且必须明确要求返回纯JSON格式,避免冗余解释。

1、定义prompt变量,内容为:“你是一个专业的情感分析引擎。请对以下文本进行情感倾向判断,仅输出JSON格式结果,包含字段:sentiment(取值为'正面'、'中性'或'负面'),confidence(0.0–1.0之间的浮点数)。不要输出任何其他文字。”

达芬奇
达芬奇

达芬奇——你的AI创作大师

下载

2、将待分析文本拼接至prompt末尾,构成完整的user消息内容。

3、确保整个messages列表形如:[{"role": "system", "content": prompt}, {"role": "user", "content": text}]。

四、编写批量处理主逻辑

针对大规模文本,需避免单次请求过多内容造成截断或超时,应按固定长度切分原始数据集,并采用同步轮询方式逐条提交。每条响应需捕获异常并记录失败样本,便于后续重试。

1、读取CSV文件,使用pandas加载列名为"text"的数据帧,调用df['text'].tolist()转为文本列表。

2、遍历列表,每次循环构造payload字典,包含model(如"deepseek-chat")、messages、temperature(设为0.0以增强确定性)等键。

3、发送POST请求至API地址,设置headers为{"Authorization": f"Bearer {api_key}", "Content-Type": "application/json"},并检查响应状态码是否为200。

五、解析响应并保存结构化结果

API返回的JSON中嵌套在choices[0]["message"]["content"]内,需用json.loads()二次解析其内部字符串。若解析失败或字段缺失,应跳过该条目并记录原始响应内容供人工核查。

1、提取response_json["choices"][0]["message"]["content"],赋值给raw_output变量。

2、执行json.loads(raw_output.strip()),捕获JSONDecodeError异常。

3、将成功解析的sentiment与confidence连同原文存入字典,追加至results列表,最终用pandas.DataFrame(results).to_csv("labeled_output.csv", index=False)导出。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java连接字符串方法汇总
java连接字符串方法汇总

本专题整合了java连接字符串教程合集,阅读专题下面的文章了解更多详细操作。

7

2026.02.05

java中fail含义
java中fail含义

本专题整合了java中fail的含义、作用相关内容,阅读专题下面的文章了解更多详细内容。

8

2026.02.05

控制反转和依赖注入区别
控制反转和依赖注入区别

本专题整合了控制反转和依赖注入区别、解释、实现方法相关内容。阅读专题下面的文章了解更多详细教程。

11

2026.02.05

钉钉脑图插图教程合集
钉钉脑图插图教程合集

本专题整合了钉钉脑图怎么插入图片、钉钉脑图怎么用相关教程,阅读专题下面的文章了解更多详细内容。

24

2026.02.05

python截取字符串方法汇总
python截取字符串方法汇总

本专题整合了python截取字符串方法相关合集,阅读专题下面的文章了解更多详细内容。

2

2026.02.05

Java截取字符串方法合集
Java截取字符串方法合集

本专题整合了Java截取字符串方法汇总,阅读专题下面的文章了解更多详细操作教程。

1

2026.02.05

java 抽象方法
java 抽象方法

本专题整合了java抽象方法定义、作用教程等内容,阅读专题下面的文章了解更多详细内容。

2

2026.02.05

Eclipse创建jsp文件教程合集
Eclipse创建jsp文件教程合集

本专题整合了Eclipse创建jsp文件、创建jsp项目等等内容,阅读专题下面的文章了解更多详细教程。

26

2026.02.05

java 字符串转数字
java 字符串转数字

本专题整合了java如何字符串转数字相关内容,阅读专题下面的文章了解更多详细教程。

4

2026.02.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.4万人学习

Django 教程
Django 教程

共28课时 | 3.9万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号