OpenClaw 101|00|Reading Guide

OpenClaw 101 的阅读指南:用 Personal Agent OS 的视角,把 Gateway、Agent Loop、Session、Context、能力系统、记忆、自动化、节点、扩展和 QA 串成一条学习路径。

OpenClaw 101|00|Reading Guide

OpenClaw 101 不是安装教程,也不是按文件顺序展开的实现笔记。它是一组面向 Agent Engineering 的系统文章:用 OpenClaw 作为一个完整样本,理解一个长期运行、跨渠道、有工具、有记忆、有插件、有移动节点的个人 Agent 系统应该怎样被工程化。

这组文章解决什么问题

很多 Agent demo 可以用一句话概括:模型收到消息,选择工具,返回结果。但真实个人 Agent 会遇到更多问题:

  • 用户从多个渠道同时发消息,谁拥有上下文?
  • Agent 一边流式输出,一边调用工具,一边又收到新消息,谁来排队?
  • 工具能读文件、跑命令、发消息,权限和审计在哪里?
  • 长对话超过上下文窗口之后,哪些东西应该留下?
  • 手机、桌面、headless node、cron、webhook 都接进来之后,系统如何保持可观察、可恢复、可扩展?

OpenClaw 101 的主张是:这些问题不能只靠 prompt 解决,它们需要一个 Personal Agent OS 层。

推荐阅读路径

阶段 文章 你会建立的模型
总览 01 Personal Agent OS 为什么 OpenClaw 不是聊天壳,而是个人 Agent 操作层
主路径 02 Gateway / 03 Agent Loop / 04 Sessions 一条任务如何被接收、排队、执行和落盘
模型输入与行动 05 Context / 06 Tools Skills Plugins / 07 Channels and Messages 模型看见什么、能做什么、如何通过真实渠道交互
长期运行 08 Memory / 09 Compaction and Pruning 长期事实如何留下,长会话如何续命
扩展到真实世界 10 Multi-Agent and Delegation / 11 Automation / 12 Nodes and Apps 复杂任务、无人值守任务和设备能力如何进入系统
治理与质量 13 Security and Operations / 14 Building Extensions / 15 Observability and QA 如何安全扩展、运维、诊断和测试一个 Agent OS

贯穿案例

全系列可以用同一个任务来读:

用户在手机上对 OpenClaw 说:“帮我看一下这个 repo 的测试为什么失败;如果需要跑命令就先做,修好后在聊天里提醒我。”

这句话看起来简单,但它会穿过几乎所有系统层:

层级 在这个案例里负责什么
Gateway 接收移动端消息,创建 run,返回 accepted,广播事件
Session 判断这属于哪段历史,保证同一会话不会并发写坏
Agent Loop 组装 context,调用模型,执行工具,保存 transcript
Context 决定模型这一轮能看到哪些历史、文件、工具和记忆
Tools / Skills / Plugins 让 Agent 能运行测试、读取项目、使用方法论和扩展能力
Channels 把长输出、提醒、失败状态按移动端渠道限制送回用户
Memory / Compaction 保留稳定项目事实,压缩长对话,避免上下文污染
Automation / Nodes 在无人值守或设备能力场景下继续执行和交付
Security / Observability 控制副作用,记录事件,支持失败后诊断

核心术语

术语 简短解释
Gateway 常驻控制面,统一连接渠道、客户端、节点、自动化和 Agent Runtime
Session 状态边界,决定历史、并发、隐私和 transcript 归属
Agent Runtime 执行面,负责 context assembly、model inference、tool execution、streaming 和 persistence
Context 模型这一轮真正看到的全部输入,不等同于 memory
Tool 受控动作,例如读文件、跑命令、发消息、调用 API
Skill 可复用的方法包装,告诉 Agent 如何完成一类任务
Plugin 运行时扩展机制,用来注册工具、渠道、节点或事件处理
Node 一台接入 Gateway 的设备或执行环境
Compaction 把长会话压成可继续行动的上下文,而不是普通摘要

怎么判断你读懂了

读完整组文章后,你应该能把任何 Agent 系统拆成几个问题:

  • 它的控制面在哪里?
  • 状态和上下文由谁拥有?
  • 工具副作用如何被授权、执行和审计?
  • 长会话如何压缩,长期记忆如何写入?
  • 多渠道、多设备、多任务同时存在时,系统如何避免互相污染?
  • 出错时能不能从事件、transcript、tool log 和 usage 中复盘?

如果这些问题都有清晰答案,这个系统就不只是一个 demo,而开始接近可长期运行的 Agent OS。