OpenClaw具备五大原子能力:一、本地系统操作(读写/编辑/补丁/搜索/查找/列表/执行/进程管理);二、网络与浏览器自动化(语义搜索、正文提取、无头浏览、JS注入);三、本地记忆管理(向量检索、文件读取、人格配置);四、跨平台协同(通讯/办公/Git/邮箱自动化);五、技能扩展兼容(多模型接入、753+预置技能、YAML自定义)。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您希望了解OpenClaw能执行哪些基础任务,而非仅停留在对话层面,则需聚焦其可操作、可验证、可审计的原子能力。以下是OpenClaw核心功能的结构化说明:
一、本地系统操作能力
该模块提供对操作系统底层资源的安全可控访问,所有指令均在隔离沙箱中执行,确保每一步操作可追溯、无副作用。系统默认不联网、不上传、不越权,全部行为受Gateway统一门控。
1、使用read命令读取任意路径下的文本文件,自动识别UTF-8、GBK、ISO-8859-1等编码格式。
2、通过write命令创建新文件或覆盖已有文件,支持变量插值(如{{today}}、{{user_home}})与Jinja2风格模板渲染。
3、调用edit命令对文件进行行级修改,支持正则匹配替换、上下文锚点(如“在‘## 配置项’之后插入三行”)及多段落批量更新。
4、执行apply_patch命令应用Git-style unified diff补丁,可跨多个文件同步变更,保留原始权限与时间戳。
5、运行grep命令在单个或通配路径下搜索正则模式,匹配行高亮显示,支持-i(忽略大小写)、-n(显示行号)、-A/B(上下文行)参数。
6、使用find命令按glob模式查找文件,支持--maxdepth限制递归深度、-type指定类型(f/d/l)、-mtime按修改时间筛选。
7、调用ls命令列出目录内容,附加--tree参数生成缩进树状视图,--long显示权限、用户、大小、修改时间等完整元信息。
8、通过exec命令运行任意shell指令,启用伪终端(PTY)以兼容vim、htop、ssh等交互式程序。
9、使用process命令管理长期运行任务,支持start/stop/status/log子命令,日志流实时捕获并按会话隔离。
二、网络与浏览器自动化能力
该模块不依赖外部浏览器进程,内置轻量级HTML解析与DOM操作引擎,可完成语义化网页理解、结构化数据提取与可控交互动作。
1、调用web_search命令发起Brave API语义检索,返回带摘要、来源、时间戳的结构化结果列表,不加载广告与跟踪脚本。
2、使用web_fetch命令获取目标URL原始HTML,自动剥离导航栏、侧边栏、评论区等干扰区块,仅保留正文语义段落与标题层级。
3、执行browser命令启动无头浏览器会话,支持navigate(跳转)、screenshot(截图)、save_pdf(保存PDF)、dump_dom(导出DOM快照)等子操作。
4、在browser会话中注入JavaScript片段,实现动态表单填充、按钮点击、滚动加载更多内容、等待元素出现后执行后续动作等精细控制逻辑。
三、记忆与上下文管理能力
该模块采用全本地优先策略,所有记忆数据默认存储于用户工作区的MEMORY.md及memory/子目录中,不触发任何网络请求,不依赖远程向量数据库。
1、使用memory_search命令对主记忆文件及所有子记忆文件执行语义向量检索,支持关键词加权(如“项目A^2.0”)、时间范围过滤(如“2026-02-01..2026-02-28”)。
2、调用memory_get命令直接读取指定记忆文件的原始内容,适用于复用结构化配置、历史参数、API凭证等确定性信息场景。
3、通过SOUL.md人格系统定义AI沟通风格与行为边界,支持设置语气倾向(如“简洁/详尽”)、响应节奏(如“延迟0.8秒后回复”)、禁忌词过滤列表。
四、跨平台协同与自动化能力
该模块打通通讯、办公、开发等多类工具链,将自然语言指令转化为跨应用的实际动作,无需人工切换界面或复制粘贴。
1、在微信、钉钉、飞书、Telegram等10+通讯平台中发送指令,如“把刚才的会议录音转文字并摘要发到研发群”,系统自动调用语音识别技能与消息发送技能串联执行。
2、关联WPS或Office套件,接收指令后自动打开指定文档、定位至某节标题、插入表格、填写数据、另存为PDF并上传至企业云盘指定路径。
3、对接Git仓库,执行“拉取main分支最新代码→运行单元测试→生成覆盖率报告→若失败则通知我”等复合流程,每步状态可查、失败可中断、日志可追溯。
4、连接邮箱客户端,实现“扫描收件箱中含‘发票’字样的邮件→提取附件PDF→OCR识别金额与开票方→写入记账Excel模板→高亮标红异常数值”全流程闭环。
五、技能扩展与模型兼容能力
该模块解耦智能体“思考”与“做事”两层职责,允许用户自由组合模型推理能力与工具执行能力,避免厂商锁定与隐私泄露。
1、支持Claude、GPT-4o、Kimi、GLM-4、Qwen2、Llama3等云模型API,亦可通过Ollama本地加载7B/14B开源模型,所有API Key由用户自主配置并本地加密存储。
2、内置53个官方核心Skills,覆盖文件处理、日志分析、Excel计算、HTTP调试等高频场景;社区已发布700+ Skills,含飞书审批、Notion同步、Home Assistant设备控制等垂直能力。
3、用户可编写YAML格式Skill定义文件,声明输入参数、执行命令、输出Schema与错误重试策略,系统自动校验语法、注册路由、纳入Gateway安全策略管控。










