可通过DeepSeek API实现大规模文本情感倾向标注:先注册获取API密钥,再配置Python环境与请求参数,设计结构化提示词模板,编写批量处理逻辑,最后解析响应并导出CSV结果。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您希望利用DeepSeek模型对大规模文本进行情感倾向标注,但缺乏本地部署能力或需要快速集成到现有工作流中,则可以通过其提供的API接口实现自动化分类。以下是完成该任务的具体步骤:
一、注册并获取API密钥
要调用DeepSeek的文本情感分析服务,必须先在官方平台完成开发者账号注册,并创建应用以获取合法的API访问凭证。该密钥用于身份验证,确保请求来源可信且具备对应权限。
1、访问DeepSeek开放平台官网,点击“立即注册”完成邮箱验证与基础信息填写。
2、登录后进入“控制台→应用管理”,点击“创建新应用”,填写应用名称与用途描述。
立即学习“Python免费学习笔记(深入)”;
3、在应用详情页中复制API Key字段值,该字符串需严格保密,不可硬编码于公开代码中。
二、安装依赖并配置请求环境
Python脚本需借助requests库发起HTTP请求,并通过JSON格式构造符合API规范的输入数据体。同时应设置合理的超时与重试机制,以应对网络波动导致的临时失败。
1、在终端执行命令:pip install requests python-dotenv,安装核心依赖。
2、新建文件.env,在其中写入:DEEPSEEK_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx(替换为实际密钥)。
3、在Python脚本开头添加加载逻辑:from dotenv import load_dotenv; load_dotenv(),确保环境变量生效。
三、构造情感分类提示词模板
DeepSeek模型本身不内置专用情感分析指令,需通过精心设计的system prompt引导其输出结构化情感标签。不同情感粒度(如三分类/五分类)需对应不同提示语,且必须明确要求返回纯JSON格式,避免冗余解释。
1、定义prompt变量,内容为:“你是一个专业的情感分析引擎。请对以下文本进行情感倾向判断,仅输出JSON格式结果,包含字段:sentiment(取值为'正面'、'中性'或'负面'),confidence(0.0–1.0之间的浮点数)。不要输出任何其他文字。”
2、将待分析文本拼接至prompt末尾,构成完整的user消息内容。
3、确保整个messages列表形如:[{"role": "system", "content": prompt}, {"role": "user", "content": text}]。
四、编写批量处理主逻辑
针对大规模文本,需避免单次请求过多内容造成截断或超时,应按固定长度切分原始数据集,并采用同步轮询方式逐条提交。每条响应需捕获异常并记录失败样本,便于后续重试。
1、读取CSV文件,使用pandas加载列名为"text"的数据帧,调用df['text'].tolist()转为文本列表。
2、遍历列表,每次循环构造payload字典,包含model(如"deepseek-chat")、messages、temperature(设为0.0以增强确定性)等键。
3、发送POST请求至API地址,设置headers为{"Authorization": f"Bearer {api_key}", "Content-Type": "application/json"},并检查响应状态码是否为200。
五、解析响应并保存结构化结果
API返回的JSON中嵌套在choices[0]["message"]["content"]内,需用json.loads()二次解析其内部字符串。若解析失败或字段缺失,应跳过该条目并记录原始响应内容供人工核查。
1、提取response_json["choices"][0]["message"]["content"],赋值给raw_output变量。
2、执行json.loads(raw_output.strip()),捕获JSONDecodeError异常。
3、将成功解析的sentiment与confidence连同原文存入字典,追加至results列表,最终用pandas.DataFrame(results).to_csv("labeled_output.csv", index=False)导出。










