OpenClaw 101|00|Reading Guide
OpenClaw 101 的阅读指南:用 Personal Agent OS 的视角,把 Gateway、Agent Loop、Session、Context、能力系统、记忆、自动化、节点、扩展和 QA 串成一条学习路径。
OpenClaw 101 不是安装教程,也不是按文件顺序展开的实现笔记。它是一组面向 Agent Engineering 的系统文章:用 OpenClaw 作为一个完整样本,理解一个长期运行、跨渠道、有工具、有记忆、有插件、有移动节点的个人 Agent 系统应该怎样被工程化。
这组文章解决什么问题
很多 Agent demo 可以用一句话概括:模型收到消息,选择工具,返回结果。但真实个人 Agent 会遇到更多问题:
- 用户从多个渠道同时发消息,谁拥有上下文?
- Agent 一边流式输出,一边调用工具,一边又收到新消息,谁来排队?
- 工具能读文件、跑命令、发消息,权限和审计在哪里?
- 长对话超过上下文窗口之后,哪些东西应该留下?
- 手机、桌面、headless node、cron、webhook 都接进来之后,系统如何保持可观察、可恢复、可扩展?
OpenClaw 101 的主张是:这些问题不能只靠 prompt 解决,它们需要一个 Personal Agent OS 层。
推荐阅读路径
| 阶段 | 文章 | 你会建立的模型 |
|---|---|---|
| 总览 | 01 Personal Agent OS | 为什么 OpenClaw 不是聊天壳,而是个人 Agent 操作层 |
| 主路径 | 02 Gateway / 03 Agent Loop / 04 Sessions | 一条任务如何被接收、排队、执行和落盘 |
| 模型输入与行动 | 05 Context / 06 Tools Skills Plugins / 07 Channels and Messages | 模型看见什么、能做什么、如何通过真实渠道交互 |
| 长期运行 | 08 Memory / 09 Compaction and Pruning | 长期事实如何留下,长会话如何续命 |
| 扩展到真实世界 | 10 Multi-Agent and Delegation / 11 Automation / 12 Nodes and Apps | 复杂任务、无人值守任务和设备能力如何进入系统 |
| 治理与质量 | 13 Security and Operations / 14 Building Extensions / 15 Observability and QA | 如何安全扩展、运维、诊断和测试一个 Agent OS |
贯穿案例
全系列可以用同一个任务来读:
用户在手机上对 OpenClaw 说:“帮我看一下这个 repo 的测试为什么失败;如果需要跑命令就先做,修好后在聊天里提醒我。”
这句话看起来简单,但它会穿过几乎所有系统层:
| 层级 | 在这个案例里负责什么 |
|---|---|
| Gateway | 接收移动端消息,创建 run,返回 accepted,广播事件 |
| Session | 判断这属于哪段历史,保证同一会话不会并发写坏 |
| Agent Loop | 组装 context,调用模型,执行工具,保存 transcript |
| Context | 决定模型这一轮能看到哪些历史、文件、工具和记忆 |
| Tools / Skills / Plugins | 让 Agent 能运行测试、读取项目、使用方法论和扩展能力 |
| Channels | 把长输出、提醒、失败状态按移动端渠道限制送回用户 |
| Memory / Compaction | 保留稳定项目事实,压缩长对话,避免上下文污染 |
| Automation / Nodes | 在无人值守或设备能力场景下继续执行和交付 |
| Security / Observability | 控制副作用,记录事件,支持失败后诊断 |
核心术语
| 术语 | 简短解释 |
|---|---|
| Gateway | 常驻控制面,统一连接渠道、客户端、节点、自动化和 Agent Runtime |
| Session | 状态边界,决定历史、并发、隐私和 transcript 归属 |
| Agent Runtime | 执行面,负责 context assembly、model inference、tool execution、streaming 和 persistence |
| Context | 模型这一轮真正看到的全部输入,不等同于 memory |
| Tool | 受控动作,例如读文件、跑命令、发消息、调用 API |
| Skill | 可复用的方法包装,告诉 Agent 如何完成一类任务 |
| Plugin | 运行时扩展机制,用来注册工具、渠道、节点或事件处理 |
| Node | 一台接入 Gateway 的设备或执行环境 |
| Compaction | 把长会话压成可继续行动的上下文,而不是普通摘要 |
怎么判断你读懂了
读完整组文章后,你应该能把任何 Agent 系统拆成几个问题:
- 它的控制面在哪里?
- 状态和上下文由谁拥有?
- 工具副作用如何被授权、执行和审计?
- 长会话如何压缩,长期记忆如何写入?
- 多渠道、多设备、多任务同时存在时,系统如何避免互相污染?
- 出错时能不能从事件、transcript、tool log 和 usage 中复盘?
如果这些问题都有清晰答案,这个系统就不只是一个 demo,而开始接近可长期运行的 Agent OS。