AI Agent 行为治理宇宙 · Inspired by The Three-Body Problem
为什么值得看 · 当前架构 · Skills 关系 · 安装 · 适配场景
三体定其界,诛仙阵定其式。
一套给 AI Agent 使用的行为治理系统: 不只告诉 Agent 该做什么,更告诉它 什么时候该停、什么时候该想、什么时候该查证据、什么时候根本不能继续做。
大多数 agent skill 只解决一个点:教模型怎么写代码、怎么调工具,或者给一套“看起来很强”的提示词。
真实使用里,AI Agent 的问题通常不出在“能力不够”,而是更早的那几步就已经偏了:
- 没先判断任务属于哪种工作模式
- 没有清楚的风险边界
- 复杂任务直接开做,没有先规划
- 方案看起来合理,但没人专门拆它
- 高危动作知道危险,却没有最终裁决者
- 失败以后不回证据,只靠猜
three-body 解决的正是这整条链路。
| 真实问题 | 常见失败表现 | three-body 的回答 |
|---|---|---|
| 任务一上来就开做 | 明明该先分析,却直接写代码 | agent-work-environment-v3 先选工作模式 |
| 风险边界不清 | 该确认的时候不确认 | environment-governance 先定义边界 |
| 复杂任务边做边想 | 路线频繁漂移,返工成本高 | wallfacer 先收敛方案 |
| 方案没人挑战 | 隐含假设没暴露 | wallbreaker 专门拆方案 |
| 高危动作无人裁决 | 知道危险,但没人决定能不能放行 | swordbearer 做最终授权 |
| 失败后靠直觉重试 | 不读日志、重复犯错 | diagnostic-archive 回证据层 |
three-body 关心的不是“赶紧开始做”,而是“先把方向和边界站稳”。
如果你只想先抓住这个项目的核心,可以直接记这四句话:
- 诛仙阵先判断:现在该用什么工作模式
- 三体法则再判断:当前边界在哪里
- 战略层三角色只在复杂或高危场景出现
- 档案读取器负责在失败后把决策重新拉回证据
把这套东西想清楚,其实就一句话:它把 Agent 的行为链路拆成了:
模式选择 → 边界定义 → 战略介入 → 证据回看
《三体》给这个仓库带来的,是一套很强的边界观。
- 上下文有限,必须像脱水一样节省资源
- 环境突变频繁,必须像乱纪元一样考虑升级路径
- 暴露面越大,越容易出错,这就是黑暗森林法则在 Agent 世界里的含义
- 高危动作不靠一时冲动,而要有执剑人式的威慑与裁决
黑暗森林在这里是一条法则,也是一种思路。它不对应某个执行角色。
诛仙阵给这个仓库的,是任务模式选择。
同样是“帮我处理这个任务”,实际可能完全不同:有的应该先研究、有的应该直接实现、有的应该先验证、有的应该写成文档、有的属于运维必须更谨慎。
所以 agent-work-environment-v3 的第一步,是先决定:
现在该进哪一阵。
五阵型速查:观机阵(Research) · 破局阵(Implementation) · 明鉴阵(Verification) · 立言阵(Writing) · 行令阵(Operations)
┌────────────────────────────────────────────────────────────────────┐
│ 战术层 · TACTICS │
│ ⚔️ agent-work-environment-v3 │
│ 诛仙阵:识别任务意图,选择研究 / 实现 / 验证 / 写作 / 运维模式 │
└────────────────────────────────────────────────────────────────────┘
│
▼
┌────────────────────────────────────────────────────────────────────┐
│ 治理层 · GOVERNANCE │
│ ⚖️ environment-governance │
│ 三体法则:根据信号定义确认、升级、写回、诊断访问等行为边界 │
│ 底层哲学:黑暗森林法则 —— 先控制暴露面,再决定行动 │
└────────────────────────────────────────────────────────────────────┘
│
▼
┌────────────────────────────────────────────────────────────────────┐
│ 战略层 · STRATEGY │
│ 🧱 wallfacer → 深度规划 │
│ 🔓 wallbreaker → 对抗式审查 │
│ ⚔️ swordbearer → 高危动作最终授权 │
└────────────────────────────────────────────────────────────────────┘
│
▼
┌────────────────────────────────────────────────────────────────────┐
│ 证据层 · EVIDENCE │
│ 📁 diagnostic-archive │
│ 读取 run archives,定位根因,为重试、授权和方案争议提供证据 │
└────────────────────────────────────────────────────────────────────┘
| Skill | 层级 | 角色 | 负责什么 | 不负责什么 |
|---|---|---|---|---|
agent-work-environment-v3 |
战术层 | 诛仙阵 | 识别任务意图,选择阵型 | 不定义安全边界、不深度规划、不做最终授权 |
environment-governance |
治理层 | 三体法则 | 根据风险、复杂度、失败状态等信号决定边界 | 不负责路由、不代替执行 skill |
wallfacer |
战略层 | 面壁人 | 在复杂任务前收敛候选路径 | 不做对抗审查、不做最终授权 |
wallbreaker |
战略层 | 破壁人 | 对已有方案做拆解,暴露盲点 | 不负责初始规划 |
swordbearer |
战略层 | 执剑人 | 在高危动作前给出 allow/pause/deny 判断 | 不负责全面风险识别 |
diagnostic-archive |
证据层 | 档案读取器 | 从 run archives 读取事实、还原失败原因 | 不修 bug、不重跑任务 |
| Skill | 定位 |
|---|---|
agent-work-environment |
兼容组合版 —— 将“路由 + 治理”合并在一个 skill 中,适合想快速上手的人 |
用户任务 → agent-work-environment-v3 → environment-governance → execution skill
用户任务 → agent-work-environment-v3 → environment-governance → wallfacer → execution skill
用户任务 → agent-work-environment-v3 → environment-governance → wallfacer → wallbreaker → execution skill
用户任务 → agent-work-environment-v3 → environment-governance → swordbearer → careful/guard/execution skill
用户任务 → agent-work-environment-v3 → environment-governance → diagnostic-archive → swordbearer → execution skill
./install.sh claude安装:agent-work-environment-v3 + environment-governance
./install.sh claude --with-archive额外安装:diagnostic-archive
./install.sh claude --with-strategy额外安装:wallfacer + wallbreaker + swordbearer
./install.sh claude --with-strategy --with-archive| 平台 | 标识 | 状态 |
|---|---|---|
| Claude Code | claude |
✅ 已验证 |
| Opencode | opencode |
✅ 已验证 |
| OpenClaw | openclaw |
✅ 已验证 |
如果你担心它只是“换了一种说法的 system prompt”,可以看 examples/behavior-diff.md。
它对比了三种情况:没装 three-body、只装 environment-governance、同时装路由层与治理层。
真正拉开差距的是决策链条本身。
这类人会很适合
- 你正在长期使用 coding agent,不是偶尔来一次一问一答
- 你关心高危操作时的边界,而不只关心“快点做完”
- 你希望复杂任务先出方案,再执行
- 你希望失败后能回看证据,不想靠直觉一遍遍重试
下面这些场景就没必要上 full 套了
- 单次简单问答
- 一次性生成几行代码
- 完全不在乎风险确认与行为一致性
Phase 1:基础层(已完成)
environment-governance·agent-work-environment-v3·diagnostic-archive- 核心价值:会选模式、会立边界、会读证据
Phase 2:战略层(已完成)
wallfacer·wallbreaker·swordbearer- 核心价值:会规划、会挑战、会裁决
Phase 3:情报与长期记忆(规划中)
sophon— 当前尚未实现
three-body/
├── README.md / README_EN.md
├── ARCHITECTURE.md / UNIVERSE.md
├── environment-governance/ # 三体法则
├── agent-work-environment-v3/ # 诛仙阵
├── diagnostic-archive/ # 档案读取器
├── wallfacer/ # 面壁人
├── wallbreaker/ # 破壁人
├── swordbearer/ # 执剑人
└── scripts/
├── validate-repo.ps1
└── build-skill-packages.ps1
- 先分层,再组合 —— 不要一上来做一个“大总控 skill”
- 先识别,再授权 —— 治理层识别风险,执剑人决定放不放行
- 先规划,再执行 —— 复杂任务不要直接跳进实现
- 先挑战,再承诺 —— 高返工成本的方案必须先拆一轮
- 先证据,再结论 —— 失败时优先回 archive,先弄清发生了什么
5 分钟快速路径:
- 看“30 秒快速理解”
- 看“当前架构(Phase 2)”
- 看“它们之间怎么协作”
- 最后决定装最小版还是全量版
深入阅读:
- 理解完整调用顺序 → ARCHITECTURE.md
- 理解未来路线 → UNIVERSE.md
