kimi处理长篇小说人物关系需结构化指令与多阶段校验:分块嵌入关系指令、构建别名映射表、双阶段显性/共现校验、人工锚点引导推理、api协同nlp工具,确保关系抽取准确可控。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您使用Kimi处理长篇小说文本,但无法自动识别并结构化人物交互逻辑,则可能是由于模型未接收到明确的关系抽取指令或文本缺乏上下文锚点。以下是解决此问题的步骤:
一、启用Kimi长文本分块+关系指令嵌入法
该方法利用Kimi支持10万字以上上下文的特性,将小说按逻辑段落切分后逐块注入结构化提示,强制模型在局部语境中识别显性关系动词与角色绑定,避免跨章节指代模糊。
1、将小说全文按章/节/自然段落切分为不超过8000字符的文本块,保存为编号文件(如chapter_01.txt、chapter_02.txt)。
2、打开Kimi网页端或App,进入“新建对话”,粘贴以下固定指令模板作为首条消息:
“你是一名文学逻辑分析师。请严格按JSON格式输出本段中所有明确出现的人物关系三元组。要求:①仅提取原文中直接陈述的关系(如‘是师徒’‘结拜为兄弟’‘暗中监视’);②人物名必须与原文完全一致;③每个三元组含字段:person_a、person_b、relation、chapter_number、quote_context(引号内原句);④无关系则返回空数组[]。”
3、依次上传每个文本块,在每块上传后单独发送一次该指令,不合并多块。
4、收集全部JSON响应,用Python脚本合并去重,过滤quote_context为空或relation含“可能”“似乎”“疑似”等推测性词汇的条目。
二、构建人物别名映射表后联合提示法
该方法针对小说中同一人物存在多重称谓(如“贾宝玉”“宝二爷”“绛洞花主”)、代词指代(“他”“此人”“那公子”)导致关系断裂的问题,通过预置标准化映射表提升Kimi实体对齐精度。
1、人工整理小说人物别名表,格式为CSV:第一列为标准名,第二列为所有变体,用英文竖线分隔(例:贾宝玉|宝二爷|绛洞花主|怡红公子)。
2、将CSV内容转为纯文本描述,插入Kimi提示词开头:“已知人物标准名与别名对应关系如下:贾宝玉(别名:宝二爷、绛洞花主、怡红公子);林黛玉(别名:颦儿、潇湘妃子、黛玉妹妹)……请在后续分析中将所有别名统一映射至标准名后再提取关系。”
3、将小说全文(未分块)连同上述提示一并提交给Kimi,启用“深度思考”模式(如可用)。
4、检查输出结果中person_a与person_b字段是否均为标准名;若出现别名,手动替换并标记该条目为低置信度。
三、双阶段校验:Kimi初筛+规则引擎后处理法
该方法规避Kimi对隐性关系(如“递过茶盏时指尖微颤”暗示紧张)的误判风险,先由Kimi提取显性关系,再用正则与共现规则进行二次验证与补全,确保关系边具有文本依据支撑。
1、向Kimi提交精简指令:“列出本小说中所有含关系动词的完整句子,动词包括但不限于:是、为、属、任、拜、娶、嫁、结、认、收、救、杀、害、助、护、欺、瞒、恋、慕、恨、妒、敬、畏、斥、赞、荐、贬、劾、劾、通、私、密、谋、反、降、附、归、投、叛、离、弃、逐、赦、赐、封、削、夺、授、领、统、辖、督、察、审、断、判、执、押、囚、斩、戮、诛、焚、沉、溺、缢、鸩、毒、刺、射、劈、砍、击、撞、推、搡、挽、扶、携、抱、挽、挽、抚、握、牵、拉、扯、拽、撕、咬、吻、拥、偎、倚、靠、伏、跪、叩、拜、揖、拱、稽、颔、瞥、盯、视、望、窥、瞄、瞅、瞪、乜、眯、眨、凝、注、扫、掠、瞟、睃、瞠、睁、闭、眯、笑、哭、泣、嚎、吼、喊、叫、嚷、骂、啐、呸、哼、嗯、哦、啊、哇、哎、哟、呃、呣、唔、呗、啦、吗、呢、吧、呀、呵、嘿、嘻、唉、噢、嗯、呃、呣、唔、呗、啦、吗、呢、吧、呀、呵、嘿、嘻、唉、噢。”
2、将Kimi返回的所有句子保存为txt,用正则提取主语、宾语、关系动词三要素,生成初步关系表。
3、加载人物标准名列表,对主语宾语做字符串匹配(支持模糊匹配Levenshtein距离≤1);对未匹配项,执行段落级共现校验:若两人名在同一自然段内共现≥2次且间隔≤50字符,则添加“同场景出现”辅助关系边。
4、导出最终关系边列表,字段包含:source、target、relation_type(显性/共现)、evidence_sentence、paragraph_id。
四、人工锚点引导+Kimi增量推理法
该方法适用于关系高度隐晦、需依赖背景知识推断的小说(如《繁花》《白鹿原》),通过用户提供高置信度种子关系,激活Kimi的类比推理能力,定向扩展相似结构关系链。
1、选取小说开篇章节,人工标注3–5组确凿关系(如“王琦瑶是程先生倾慕对象”“老克腊与王琦瑶存在代际情感张力”),写成标准三元组格式并注明原文页码或段落编号。
2、在Kimi对话中先输入:“以下为已验证关系锚点:{‘person_a’: ‘王琦瑶’, ‘person_b’: ‘程先生’, ‘relation’: ‘被倾慕’, ‘evidence’: ‘第3页:程先生目光始终追随着她’};{‘person_a’: ‘老克腊’, ‘person_b’: ‘王琦瑶’, ‘relation’: ‘代际情感张力’, ‘evidence’: ‘第17页:他看她的眼神像在抚摸一件旧瓷器’}。请基于上述锚点中‘被倾慕’‘代际情感张力’的关系语义特征,扫描全文,找出其他符合同类语义模式的人物对。”
3、接收Kimi输出后,仅保留relation字段与锚点语义标签(如“被倾慕”)完全一致的条目,剔除新增语义标签(如“单相思”“怀旧投射”)。
4、将保留条目与锚点合并,形成增强关系集,导入Gephi或NetworkX生成初始图谱。
五、API调用+外部NLP工具协同法
该方法突破Kimi纯文本接口限制,将Kimi作为高层逻辑调度器,调用本地轻量NLP模块完成底层实体识别与依存解析,再由Kimi整合语义关系,兼顾精度与可控性。
1、本地部署LTP或LTP-Cloud轻量版,对小说全文执行:①命名实体识别(NER)获取所有人名位置;②依存句法分析(DP)提取“主谓宾”“定中”“状中”等结构中的关系路径。
2、提取所有含人名的依存三元组(如“[李逵]–(主谓)→[杀]→[李鬼]”),清洗后存为edge_candidate.csv。
3、将edge_candidate.csv中前50条样本连同指令发送至Kimi:“以下是从文本中抽取出的原始依存关系候选,请判断每条是否构成有效人物社会关系(排除动作行为、临时事件、非持续性互动),并修正relation字段为抽象社会关系类型(如‘杀’→‘敌对’,‘拜为师父’→‘师徒’,‘结拜’→‘结义’)。只输出修正后的JSON数组。”
4、用Kimi返回的映射规则批量处理剩余候选边,生成最终关系边集,字段为source、target、relation_abstract、dependency_path、confidence_score。











