可借助kimi智能体平台对问卷开放性回答进行自动化情感分析与语义聚类:一、清洗文本为utf-8纯文本格式;二、用指令工程批量标注情感极性;三、多轮指令生成语义主题关键词簇;四、导出结构化excel表实现二维映射;五、人工抽样验证聚类准确性。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您收集了大量调研问卷的开放性回答,手动阅读与归类耗时费力,则可借助Kimi智能体平台对文本进行自动化情感分析与语义聚类。以下是具体实施步骤:
一、准备结构化文本输入
Kimi不支持直接上传Excel或Word文件中的原始问卷数据,需先将开放性回答清洗为纯文本格式,并按条目分行排列,确保每条回答独立成行且无编号、无前缀干扰信息。该步骤旨在提升模型对语义边界的识别准确率。
1、打开问卷原始数据表(如Excel),仅保留“开放性回答”一列。
2、删除该列中所有空行、重复行及明显无效内容(如“无”“不知道”“略”)。
3、将剩余回答逐条复制粘贴至纯文本编辑器(如记事本),每条回答独占一行,不加序号、不加引号、不换行分段。
4、保存为UTF-8编码的.txt文件,文件名不含中文标点或空格。
二、调用Kimi进行批量情感极性标注
Kimi支持在单次对话中对数百条短文本进行统一情感判断,输出结果包含正向、中性、负向三类标签及简要依据,无需逐条提交。此操作依赖清晰的指令工程与格式约束。
1、登录Kimi官网,进入长文本对话界面,清空历史记录。
2、输入系统级提示词:你是一名专业调研分析师,请对以下每一条用户开放性回答独立判断其情感倾向:仅输出【正向】、【中性】或【负向】三类标签,每条回答对应一个标签,严格按原顺序逐行输出,不添加任何解释、序号、空行或额外字符。
3、在提示词后另起一行,粘贴已准备好的.txt文件全部内容。
4、点击发送,等待Kimi完成响应;若返回结果错乱,检查是否混入表格符号或超长句式,重新截断为单次≤300条提交。
三、使用Kimi生成语义聚类关键词组
在获得情感标签基础上,需进一步挖掘高频语义主题。Kimi可通过多轮指令引导,从原始回答中自动提取具有区分度的关键词簇,替代人工编码中的初始范畴构建环节。
1、新建对话窗口,输入指令:请基于以下开放性回答文本,归纳出5–8个最具代表性的语义主题类别,每个类别用不超过6个汉字命名,并列举3条最能体现该主题的原始回答原文(需字面完全一致)。
2、在指令下方粘贴同一份清洗后的文本内容。
3、接收响应后,若某类别下例句重复率高或覆盖不均,追加指令:请将上一轮未被归入任何类别的剩余回答,重新聚类为3个新主题,命名规则相同。
4、合并两轮输出的主题名称,形成初步类目体系,用于后续交叉验证或人工校验。
四、导出带标签的结构化结果表
Kimi本身不提供表格导出功能,但可通过标准化文本格式还原为Excel可识别结构,实现情感标签与聚类归属的二维映射。该方式避免截图识别误差,保障数据可追溯性。
1、在Kimi首轮情感分析结果页,全选并复制全部输出内容(应为纯标签列,如【正向】【中性】【负向】垂直排列)。
2、打开Excel,在A列粘贴原始回答,在B列粘贴对应情感标签,确保行数严格对齐。
3、新建C列,手工填入第三步所得主题名称(如“服务响应慢”“价格接受度高”),按每条回答最匹配的主题填写,允许一条回答对应多个主题时以顿号分隔。
4、选中A:C三列,使用Excel「数据」→「筛选」功能,即可按情感类型或主题类别动态查看子集。
五、人工抽样验证关键聚类边界
模型聚类存在语境误判风险,尤其在反讽、隐喻或专业术语密集的回答中。必须选取不少于总样本5%的条目进行回溯比对,确认主题命名与原始语义的一致性。
1、在Excel中使用「随机排序」功能(如=RAND()辅助列+升序排列),随机抽取20–50条回答。
2、对照Kimi生成的聚类结果,逐条核查:该回答是否确实属于所分配主题?是否存在更贴切的其他主题?
3、对存疑条目,在Excel D列标注【待复核】,并在E列填写人工判定的主题名称。
4、统计D列中标注比例,若超过15%,则需返回第三步,调整聚类指令中的示例密度或增加否定约束条件(如“避免将含‘贵’字的回答一律归为价格类”)。










