长文本需按语义切片分批提问:一、依句末标点切分并控制长度;二、滑动窗口重叠切分防信息丢失;三、依文档结构层级划分;四、用语义聚类提升主题一致性。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您向DeepSeek模型提交的提示词过长,超出其上下文窗口(Context Window)限制,则会导致输入被截断或报错。以下是针对长文本进行语义切片并分批次提问的操作方法:
一、基于句子边界与语义连贯性切分
该方法利用自然语言中的标点符号(如句号、问号、感叹号)识别完整语义单元,确保每个切片包含独立、可理解的语义片段,避免跨句割裂关键逻辑关系。
1、将原始长文本按中文句末标点(。!?)进行分割,保留标点符号不丢失。
2、遍历分割后的句子列表,累计字符数(含空格与标点),当累计长度接近模型最大上下文长度(例如32768 tokens对应约6.5万汉字)的70%时,停止添加新句子。
3、将当前累计的句子组合为一个切片,并从原文中移除已切分部分。
4、对剩余文本重复步骤1–3,直至全部处理完毕。
5、对每个切片末尾添加统一指令前缀:请仅基于本段内容回答问题,不参考其他段落。
二、使用滑动窗口重叠切分
该方法在相邻切片间保留一定比例的重叠内容,防止因关键上下文位于切片边界而造成信息丢失,适用于含复杂指代或长程依赖的文本。
1、设定基础切片长度为模型上下文上限的60%,重叠长度为其20%(例如基础长度19660字符,重叠3932字符)。
2、从文本开头截取第一个切片,记录其起始与结束字节位置。
3、将窗口向后移动(基础长度 – 重叠长度)字节,截取第二个切片,确保与前一切片末尾存在指定重叠区。
4、为每个切片附加唯一编号标识:【段落#1】、【段落#2】等,便于后续结果归并。
5、所有切片统一追加提问模板:请根据【段落#X】内容,提取其中涉及的所有实体名称及对应属性。
三、依据文档结构层级切分
该方法优先尊重原文逻辑结构(如标题、小节、列表项),在语义块层面进行划分,适用于技术文档、论文、合同等具有显式层级的长文本。
1、使用正则表达式匹配中文标题格式(如“一、”“1.”“●”“◆”及带括号编号如“(1)”)并记录其位置。
2、将文本按标题节点划分为若干语义块,每个块包含标题及其下属全部段落直至下一标题前。
3、对单个语义块内部再执行字符长度校验:若超过阈值,则在其内部按句子边界进一步细分。
4、为每个最终切片标注结构路径:[一级标题:系统架构][二级标题:数据流设计]。
5、每批次提问中嵌入结构提示:请严格依据标注的结构路径作答,不得跨路径推断。
四、调用轻量级语义聚类辅助切分
该方法借助小型本地化模型(如bge-m3、text2vec-large-chinese)对句子向量做余弦相似度计算,将语义相近句聚合为切片,提升主题一致性。
1、将长文本按句分割后,使用本地部署的embedding模型生成每句向量。
2、以动态阈值(初始设为0.65)对相邻句向量计算余弦相似度,若连续三组相似度均高于阈值,则合并为同一语义单元。
3、当单元内总token数达模型上限85%时,强制终止合并并输出当前单元为一个切片。
4、每个切片头部插入语义摘要标签:【主题:用户权限管理策略】。
5、提问时绑定该标签:围绕【主题:用户权限管理策略】,列出所有角色定义及对应操作范围。











