需通过微调与记忆设置实现Agent专属化:一、启用本地记忆并配置关键词白名单;二、上传领域语料进行轻量微调;三、利用交互反馈驱动持续进化;四、绑定垂直场景SOP模板库。
如果您希望骡子快跑(mulerun)中的agent更贴合个人工作习惯与业务需求,则需通过微调与记忆设置实现专属化训练。以下是具体操作路径:
一、启用并配置本地记忆系统
骡子快跑的自进化能力依赖于本地记忆模块,该模块可从每次交互中提取结构化知识,沉淀至主记忆并支持后续调用。启用后,Agent将自动记录用户偏好、高频指令模式、常用数据格式及决策逻辑。
1、登录骡子快跑Web控制台,进入「我的Agent」页面。
2、点击目标Agent右侧的「设置」图标,选择「记忆管理」选项卡。
3、开启「启用本地记忆」开关,并勾选「自动摘要核心内容至主记忆」。
4、在「记忆过滤规则」中,设定关键词白名单(如“SKU编码”“分镜帧率”“财报Q3”),确保关键业务术语被优先捕获。
5、点击「保存配置」,系统将立即重建记忆索引,耗时约8–12秒。
二、上传领域语料进行轻量微调
骡子快跑支持基于用户自有文本语料的定向微调,不依赖GPU资源或代码编写,全程在浏览器内完成。该过程仅更新Agent对特定术语、流程表述及输出风格的理解权重,不影响底层SOP框架。
1、在Agent设置页切换至「模型微调」标签。
2、点击「上传训练语料」,支持TXT、MD、CSV格式,单次上限为50MB。
3、上传文件后,系统自动识别段落结构;若语料含多轮对话样本,需在弹窗中指定「用户输入」与「理想响应」字段标识符。
4、选择微调强度:低(仅调整术语映射)、中(增强流程逻辑权重)、高(重校准风格与节奏)。
5、点击「启动微调」,进度条显示实时状态;典型语料(≤10万字)完成时间约为90秒。
三、通过交互反馈驱动持续进化
骡子快跑采用在线强化学习机制,用户对Agent输出的显式反馈(如修正、重写、点赞)会被即时转化为训练信号,动态优化后续响应策略。该方式无需中断任务流,属于零干预式训练。
1、当Agent生成结果出现偏差时,直接在输出框下方点击「修改建议」按钮。
2、在弹出编辑区中输入正确版本,或粘贴标准范本。
3、勾选「此修正适用于同类请求」,系统将自动泛化该修正至语义相近场景。
4、若某类请求连续三次获得用户手动修正,Agent将在下次同类型任务前主动弹出「确认风格偏好」提示框。
5、所有反馈行为均加密存入用户专属虚拟机内存,不上传至公共训练池。
四、绑定垂直场景SOP模板库
骡子快跑提供预置的行业SOP模板库,用户可将微调后的Agent与特定模板强制关联,使其在执行任务时优先加载对应流程节点、检查清单与输出规范,从而固化专业行为模式。
1、进入「Agent团队」工作台,选择已训练的Agent实例。
2、点击「流程绑定」,展开垂直领域分类(如电商客服、漫剧分镜、美股财报)。
3、选取匹配度最高的SOP模板,例如「TikTok短视频投流复盘报告_v2.3」。
4、勾选「启用模板强约束」,此时Agent将屏蔽非模板定义的字段输出,并在缺失必填项时自动暂停执行。
5、保存后,该Agent在处理归属该场景的任务时,所有响应将严格遵循所选SOP的时间顺序、术语体系与格式约束。










