需启用知识库模块、批量导入文档、配置分类规则集、设置元数据映射、验证并修正分类效果;每步依托WorkBuddy内置解析引擎与标签推荐机制实现自动化文档分类。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您希望借助WorkBuddy快速构建企业内部知识库,并实现文档的自动分类,需依托其内置的文档解析引擎与标签推荐机制。以下是具体实操步骤:
一、启用知识库模块并创建知识空间
WorkBuddy默认未激活知识库功能,需在管理后台手动开启并初始化专属知识空间,为后续文档上传与模型训练提供独立存储与权限隔离环境。
1、登录WorkBuddy管理员账号,进入【系统设置】→【应用管理】。
2、在应用列表中找到“知识库”模块,点击右侧【启用】按钮。
3、跳转至知识库管理页后,点击【新建知识空间】,输入名称如“研发文档中心”,选择可见范围为“部门:技术研发部”。
4、勾选【启用自动分类】选项,保存后系统将自动生成对应NLP处理队列。
二、批量导入文档并触发智能解析
WorkBuddy支持多格式文档(PDF/DOCX/MD/XLSX)直传,上传后立即调用OCR与语义理解模型进行内容提取与结构化处理,为分类提供原始文本特征。
1、进入已创建的知识空间,点击【上传文档】按钮。
2、拖入本地文件夹(建议单次不超过50个,总大小≤200MB),或点击【从钉钉/企业微信同步】拉取已授权的共享文档库。
3、上传完成后,页面显示“正在解析中”,状态栏实时更新进度条;此时无需人工干预,系统自动完成文本抽取、段落切分与关键实体识别。
4、解析完成提示出现后,点击【查看解析结果】可核验标题识别准确率与章节结构还原度。
三、配置分类规则集并绑定文档类型
WorkBuddy提供两种分类驱动方式:基于预置行业模板的快速匹配,以及基于本知识空间历史文档训练的自适应模型,二者可叠加使用提升覆盖率。
1、在知识空间内点击【分类管理】→【新建规则集】。
2、选择【使用模板】,下拉选择“IT技术文档”,系统自动加载“故障排查”“API接口说明”“部署手册”等12个标准类目。
3、切换至【自定义训练】页签,点击【从已解析文档中采样】,勾选近7天内上传且人工标注过类别的50份文档,点击【启动模型微调】。
4、微调任务提交后约8分钟生成v1.2-beta分类模型,新上传文档将优先经此模型打标。
四、设置文档元数据映射与标签自动挂载
通过将文档属性(如文件名前缀、创建人部门、附件关键词)映射为结构化字段,可强制约束分类边界,避免语义模糊导致的误判。
1、进入【元数据配置】页,点击【新增字段】,字段名称填“业务线”,类型选“单选”,选项录入“支付”“风控”“营销”。
2、在【自动映射规则】中添加条件:“若文件名包含‘pay_’,则业务线=支付”;“若创建人所属部门为‘风控中心’,则业务线=风控”。
3、返回文档列表,勾选任意3份含“pay_”前缀的PDF,点击【批量补全元数据】,系统即时填充对应业务线值。
4、所有后续上传的‘pay_’开头文档将自动跳过语义分析环节,直接归入‘支付’业务线下,并同步应用该业务线关联的分类规则。
五、验证分类效果并修正误标样本
WorkBuddy提供实时分类看板与误标反馈通道,允许运营人员对低置信度结果进行人工校准,校准数据将自动加入再训练样本池。
1、进入【分类看板】,筛选“最近24小时”,观察“未分类”“低置信度”两列数值。
2、点击“低置信度”数字,进入详情页,查看每份文档的Top3预测类目及概率值(如:API文档 62%、故障排查 28%、部署手册 10%)。
3、对概率差<15%的文档,点击右侧【人工指定类目】,从下拉菜单选择正确类别并提交。
4、每次提交即刻触发增量学习,10分钟后新模型版本上线,原误标问题重复出现率下降约73%。










