Releases: FonaTech/Clouds-Coder
Clouds Coder 2026.06.07-Stable
CHANGELOG 2026-06-07
Bugs Fixed.
Slightly Promoted L3&L4 Agent's Performance.
CHANGELOG 2026-06-05
Plan continuity, live user steering, Web search, and Web service observability
This update focuses on making long-running Clouds Coder sessions behave like one continuous task system instead of a sequence of loosely connected model turns. The core change is architectural: plan state, todo state, blackboard memory, live user input, tool evidence, Web search, and Web UI rendering now participate in one tighter runtime loop.
English
Headline: Continuity-first runtime control for plan, multi-agent, and Web sessions
1. Plan resume repair became structural and event-driven
- Added a conservative plan-resume repair path around
_repair_plan_resume_state,_detect_plan_resume_state_issue, and_maybe_prompt_plan_resume_repair. - The runtime now detects real structural conflicts such as missing plan rows, multiple active plan steps, missing active worker subtasks, or missing worker subtask state.
- Repair is surfaced as an LLM-visible structural prompt when the state is actually inconsistent, instead of silently rebuilding the plan tree on every loop.
- Final-subtask and finish gates were separated so completion is not blocked simply because the last subtask has just ended.
2. Safer plan-step advancement evidence
- Plan infrastructure reads, including
.clouds_coder/plan.mdand internal skills-cache reads, no longer count as execution or validation evidence for the current plan step. _worker_step_has_evidenceand_tool_results_have_validation_evidencenow reject infrastructure-only reads through_is_plan_infrastructure_read_result._phase_gatenow blocks step advancement when the approved plan step has extractable expected subtasks but those subtasks are missing or incomplete.- This prevents accidental jumps from step 1 to step 2 after merely reading the plan file.
3. Session continuation and live user input are better connected
submit_user_message()now distinguishes a plan choice, a continuation message, a new task, and a live adjustment during an active run.- Approved plan state is preserved during continuation instead of being reset as a fresh blackboard.
- Runtime live user additions now enter a locked live-input queue with best-effort delivery, so late feedback is not forced to wait for the previous run to finish.
- The frontend no longer treats live-input queue responses as ordinary deferred scheduler tasks.
4. Blackboard-centered cooperation for single and multi-agent modes
- Blackboard state is used more aggressively as the shared task source of truth across Manager, Explorer, Developer, and Reviewer.
- Multi-agent cooperation is tied to the current plan focus instead of letting each role advance a private task.
- Single-agent execution uses the same continuity model at a smaller scale: the active goal, task memory, tool evidence, and todo state still point to the same task line.
- Manager coordination snapshots now carry practical state, including active focus, worker todo progress, recent artifacts, execution evidence, and files already touched for that focus.
5. Tool context, Web search, and user memory integration
- The dynamic tool-context path was expanded so recent tool use can inform later model calls without re-reading the same files or re-running the same commands unnecessarily.
agent_web_searchis integrated as a real runtime tool with enable/disable controls, tool feedback events, HTTP fetching, page/evidence tracking, and persistent search indexing.- Useful search hits and evidence are recorded into a local search index so future searches can reuse successful source patterns.
- User-level long-term memory was added with per-user isolation, summary-only storage, profile capsules,
off/weak/oninfluence levels, and clear/export/config API support.
6. Web UI rendering and structured bubbles
- Chat bubble parsing was expanded for plan handoffs, verification markers, todo focus messages, live user adjustments, finish-blocked messages, and Web search events.
- Scroll anchoring now keeps the current viewport stable unless the user is already attached to the bottom.
- Large-session rendering was tuned to reduce flicker, forced reflow, timer-driven scroll jumps, and bottom-position vibration.
- Multi-agent context bars remain session-aware and only replace the single context bar after multi-agent mode is actually active.
7. Runtime configuration and validation
- Automatic L1-L5 classification now has a default automatic ceiling of L2, while manual level and manual plan-mode choices remain authoritative.
- Web search can be controlled through
--enable-web-searchand--disable-web-search. - User preference memory can be controlled through startup/config modes (
off,weak,on), withweakas the practical default. - The main runtime and the 2.30 compatibility file were kept in sync.
2026-06-05 Summary
- Added event-driven plan resume repair prompts
- Fixed plan-step jumps caused by infrastructure-only reads
- Improved session continuation and live user feedback injection
- Strengthened blackboard cooperation across single/multi-agent and plan/non-plan execution
- Added local agent Web search indexing and feedback visibility
- Added per-user summary memory with configurable influence
- Improved structured bubbles and scroll/render stability
- Validated
Clouds_Coder.py,Clouds_Coder_2.30.py, runtime JavaScript extraction, and split architecture self-check
中文
标题:面向连续任务的 Plan / 多 Agent / Web 会话运行时治理
1. Plan 接续修复改为结构化、按事件触发
- 新增围绕
_repair_plan_resume_state、_detect_plan_resume_state_issue、_maybe_prompt_plan_resume_repair的保守 plan resume 修复链路。 - 运行时会识别真实结构矛盾,例如 plan rows 缺失、多个 active plan step、缺失 active worker subtask、worker subtask 状态缺失等。
- 修复不再是每轮隐式重建任务树,而是在状态确实矛盾时向 LLM 注入可见的结构化修复提示。
- 最后一个 subtask 完成与 finish gate 被拆开处理,避免“所有子任务完成了,却因为仍在子任务状态而无法 finish”的循环。
2. Plan Step 推进证据更严格
.clouds_coder/plan.md和内部 skills cache 读取不再被当作当前 plan step 的执行或验收证据。_worker_step_has_evidence与_tool_results_have_validation_evidence通过_is_plan_infrastructure_read_result排除纯基础设施读取。- 当当前 plan step 可以解析出应有的 subtasks,但 worker subtasks 缺失或未完成时,
_phase_gate会阻止 step 自动推进。 - 这修复了“只读了 plan 文件就从 step 1 跳到 step 2”的误推进问题。
3. Session 接续与实时用户输入衔接更顺畅
submit_user_message()现在区分 plan 选择、接续消息、新任务,以及运行中的实时用户调整。- 已批准的 plan state 在接续任务时会保留,而不是被当成新黑板重置。
- 运行中的用户追加输入会进入带锁的 live-input queue,并以 best-effort 方式尽快注入当前任务链路。
- 前端不再把 live-input queue 的响应误当成普通 scheduler 延迟任务。
4. Blackboard 成为 single / multi-agent 的共同任务事实源
- Blackboard 状态被更积极地用于 Manager、Explorer、Developer、Reviewer 之间同步当前任务。
- 多 Agent 合作围绕当前 plan focus 展开,而不是各角色推进自己的私有任务。
- Single-agent 也复用同一套连续性模型:active goal、task memory、tool evidence、todo state 指向同一条任务主线。
- Manager coordination snapshot 会携带当前 focus、worker todo 进度、近期 artifacts、执行证据、已读/已改文件等可操作上下文。
5. Tool Context、Web Search 与用户记忆接入
- 动态 tool context 能让近期工具调用影响后续模型决策,降低重复 read_file、重复 bash、重复检索的概率。
agent_web_search已作为真实 runtime tool 集成,支持启用/关闭、工具反馈事件、HTTP 抓取、页面/证据追踪与本地搜索索引。- 命中有效信息的网页与证据会写入本地索引,后续检索可以复用成功来源和信息类型。
- 新增用户级长期记忆:按 user_id 隔离、只保存摘要、profile capsule 注入、
off/weak/on影响档位,并支持清空/导出/配置接口。
6. Web UI 渲染与结构化气泡
- 对话气泡结构化解析覆盖 plan handoff、verification marker、todo focus、live user adjustment、finish-blocked、Web search 事件等场景。
- 滚动锚定逻辑改为:只有用户贴底时才自动跟随底部,否则保持当前 viewport 坐标稳定。
- 大会话渲染减少闪屏、强制 reflow、计时器触发的滚动跳动,以及底部细微振动。
- 多 Agent 上下文进度条按 session 状态持久化,只有真实进入多 Agent 后才替换 single context bar。
7. 运行配置与验证
- 自动 L1-L5 分类默认上限改为 L2;用户手动指定复杂度与手动指定 plan mode 仍然优先。
- Web search 支持通过
--enable-web-search与--disable-web-search控制。 - 用户偏好记忆支持
off、weak、on三档启动/配置模式,默认weak。 - 主版本
Clouds_Coder.py与兼容版本Clouds_Coder_2.30.py已同步。
2026-06-05 更新摘要
- 新增按事件触发的 plan resume repair 提示
- 修复基础设施读取导致 plan step 误推进的问题
- 改进 session 接续与运行中用户反馈注入
- 强化 single/multi-agent、plan/non-plan 下的 blackboard 协作连续性
- 新增本地 agent Web search 索引与工具反馈可见性
- 新增可配置影响强度的用户级摘要记忆
- 改进结构化气泡与滚动/渲染稳定性
- 已验证
Clouds_Coder.py、Clouds_Coder_2.30.py、运行时 JS 提取与 split architecture self-check
日本語
見出し:Plan / マルチエージェント / Web セッションを連続タスクとして扱う runtime 制御
1. Plan resume repair を構造検出・イベント駆動に変更
_repair_plan_resume_state、_detect_plan_resume_state_issue、_maybe_prompt_plan_resume_repairを中心に保守的な plan resume 修復経路を追加しました。- plan rows の欠落、複数 active plan step、active worker subtask の欠落、worker subtask 状態の欠落など、実際の構造矛盾を検出します。
- 毎ループで隠れて task tree を再構築するのではなく、矛盾があるときだけ LLM へ構造化された修復プロンプトを提示します。
- 最終 subtask 完了と finish gate を分離し、全 subtask が終わった後に finish が不自然にブロックされる循環を減らしました。
2. Plan step 進行証拠を厳格化
.clouds_coder/plan.mdや内部 skills cache の読み取りは、現在の plan step の実行・検証証拠として扱わなくなりました。_worker_step_has_evidenceと_tool_results_have_validation_evidenceは_is_plan_infrastructure_read_resultにより infrastructure-only read を除外します。- 現在の plan step から期待 subtask を抽出できるのに worker subtasks が欠落または未完了の場合、
_phase_gateは step 自動進行をブロックします。 - plan file を読んだだけで step 1 から step 2 へ進む誤進行を防ぎます。
3. Session 継続と live user input の接続を改善
submit_user_message()は plan 選択、継続メッセージ、新規タスク、実行中の live adjustment を区別します。- 承認済み plan state は継続時に保持され、fresh blackboard として不必要に reset されません。
- 実行中に追加されたユーザー入力は lock 付き live-input queue に入り、best-effort で現在のタスクへ注入されます。
- フロントエンドは live-input queue の応答を通常の遅延 scheduler task と誤認しなくなりました。
4. Blackboard を single / multi-agent 共通の task source of truth に
- Blackboard 状態を Manager、Explorer、Developer、Reviewer の同期基盤としてより積極的に利用します。
- Multi-agent 協調は現在の plan focus を中心に動き、各 role が private task を勝手に進める状態を避けます。
- Single-agent でも active goal、task memory、tool evidence、todo state が同じタスク線を指す連続性モデルを使います。
- Manager coordination snapshot には focus、worker todo 進捗、最近の artifacts、実行証拠、既に触れたファイ...
Clouds Coder 2026.06.06-Stable
CHANGELOG 2026-06-06
Bugs Fixed.
CHANGELOG 2026-06-05
Plan continuity, live user steering, Web search, and Web service observability
This update focuses on making long-running Clouds Coder sessions behave like one continuous task system instead of a sequence of loosely connected model turns. The core change is architectural: plan state, todo state, blackboard memory, live user input, tool evidence, Web search, and Web UI rendering now participate in one tighter runtime loop.
English
Headline: Continuity-first runtime control for plan, multi-agent, and Web sessions
1. Plan resume repair became structural and event-driven
- Added a conservative plan-resume repair path around
_repair_plan_resume_state,_detect_plan_resume_state_issue, and_maybe_prompt_plan_resume_repair. - The runtime now detects real structural conflicts such as missing plan rows, multiple active plan steps, missing active worker subtasks, or missing worker subtask state.
- Repair is surfaced as an LLM-visible structural prompt when the state is actually inconsistent, instead of silently rebuilding the plan tree on every loop.
- Final-subtask and finish gates were separated so completion is not blocked simply because the last subtask has just ended.
2. Safer plan-step advancement evidence
- Plan infrastructure reads, including
.clouds_coder/plan.mdand internal skills-cache reads, no longer count as execution or validation evidence for the current plan step. _worker_step_has_evidenceand_tool_results_have_validation_evidencenow reject infrastructure-only reads through_is_plan_infrastructure_read_result._phase_gatenow blocks step advancement when the approved plan step has extractable expected subtasks but those subtasks are missing or incomplete.- This prevents accidental jumps from step 1 to step 2 after merely reading the plan file.
3. Session continuation and live user input are better connected
submit_user_message()now distinguishes a plan choice, a continuation message, a new task, and a live adjustment during an active run.- Approved plan state is preserved during continuation instead of being reset as a fresh blackboard.
- Runtime live user additions now enter a locked live-input queue with best-effort delivery, so late feedback is not forced to wait for the previous run to finish.
- The frontend no longer treats live-input queue responses as ordinary deferred scheduler tasks.
4. Blackboard-centered cooperation for single and multi-agent modes
- Blackboard state is used more aggressively as the shared task source of truth across Manager, Explorer, Developer, and Reviewer.
- Multi-agent cooperation is tied to the current plan focus instead of letting each role advance a private task.
- Single-agent execution uses the same continuity model at a smaller scale: the active goal, task memory, tool evidence, and todo state still point to the same task line.
- Manager coordination snapshots now carry practical state, including active focus, worker todo progress, recent artifacts, execution evidence, and files already touched for that focus.
5. Tool context, Web search, and user memory integration
- The dynamic tool-context path was expanded so recent tool use can inform later model calls without re-reading the same files or re-running the same commands unnecessarily.
agent_web_searchis integrated as a real runtime tool with enable/disable controls, tool feedback events, HTTP fetching, page/evidence tracking, and persistent search indexing.- Useful search hits and evidence are recorded into a local search index so future searches can reuse successful source patterns.
- User-level long-term memory was added with per-user isolation, summary-only storage, profile capsules,
off/weak/oninfluence levels, and clear/export/config API support.
6. Web UI rendering and structured bubbles
- Chat bubble parsing was expanded for plan handoffs, verification markers, todo focus messages, live user adjustments, finish-blocked messages, and Web search events.
- Scroll anchoring now keeps the current viewport stable unless the user is already attached to the bottom.
- Large-session rendering was tuned to reduce flicker, forced reflow, timer-driven scroll jumps, and bottom-position vibration.
- Multi-agent context bars remain session-aware and only replace the single context bar after multi-agent mode is actually active.
7. Runtime configuration and validation
- Automatic L1-L5 classification now has a default automatic ceiling of L2, while manual level and manual plan-mode choices remain authoritative.
- Web search can be controlled through
--enable-web-searchand--disable-web-search. - User preference memory can be controlled through startup/config modes (
off,weak,on), withweakas the practical default. - The main runtime and the 2.30 compatibility file were kept in sync.
2026-06-05 Summary
- Added event-driven plan resume repair prompts
- Fixed plan-step jumps caused by infrastructure-only reads
- Improved session continuation and live user feedback injection
- Strengthened blackboard cooperation across single/multi-agent and plan/non-plan execution
- Added local agent Web search indexing and feedback visibility
- Added per-user summary memory with configurable influence
- Improved structured bubbles and scroll/render stability
- Validated
Clouds_Coder.py,Clouds_Coder_2.30.py, runtime JavaScript extraction, and split architecture self-check
中文
标题:面向连续任务的 Plan / 多 Agent / Web 会话运行时治理
1. Plan 接续修复改为结构化、按事件触发
- 新增围绕
_repair_plan_resume_state、_detect_plan_resume_state_issue、_maybe_prompt_plan_resume_repair的保守 plan resume 修复链路。 - 运行时会识别真实结构矛盾,例如 plan rows 缺失、多个 active plan step、缺失 active worker subtask、worker subtask 状态缺失等。
- 修复不再是每轮隐式重建任务树,而是在状态确实矛盾时向 LLM 注入可见的结构化修复提示。
- 最后一个 subtask 完成与 finish gate 被拆开处理,避免“所有子任务完成了,却因为仍在子任务状态而无法 finish”的循环。
2. Plan Step 推进证据更严格
.clouds_coder/plan.md和内部 skills cache 读取不再被当作当前 plan step 的执行或验收证据。_worker_step_has_evidence与_tool_results_have_validation_evidence通过_is_plan_infrastructure_read_result排除纯基础设施读取。- 当当前 plan step 可以解析出应有的 subtasks,但 worker subtasks 缺失或未完成时,
_phase_gate会阻止 step 自动推进。 - 这修复了“只读了 plan 文件就从 step 1 跳到 step 2”的误推进问题。
3. Session 接续与实时用户输入衔接更顺畅
submit_user_message()现在区分 plan 选择、接续消息、新任务,以及运行中的实时用户调整。- 已批准的 plan state 在接续任务时会保留,而不是被当成新黑板重置。
- 运行中的用户追加输入会进入带锁的 live-input queue,并以 best-effort 方式尽快注入当前任务链路。
- 前端不再把 live-input queue 的响应误当成普通 scheduler 延迟任务。
4. Blackboard 成为 single / multi-agent 的共同任务事实源
- Blackboard 状态被更积极地用于 Manager、Explorer、Developer、Reviewer 之间同步当前任务。
- 多 Agent 合作围绕当前 plan focus 展开,而不是各角色推进自己的私有任务。
- Single-agent 也复用同一套连续性模型:active goal、task memory、tool evidence、todo state 指向同一条任务主线。
- Manager coordination snapshot 会携带当前 focus、worker todo 进度、近期 artifacts、执行证据、已读/已改文件等可操作上下文。
5. Tool Context、Web Search 与用户记忆接入
- 动态 tool context 能让近期工具调用影响后续模型决策,降低重复 read_file、重复 bash、重复检索的概率。
agent_web_search已作为真实 runtime tool 集成,支持启用/关闭、工具反馈事件、HTTP 抓取、页面/证据追踪与本地搜索索引。- 命中有效信息的网页与证据会写入本地索引,后续检索可以复用成功来源和信息类型。
- 新增用户级长期记忆:按 user_id 隔离、只保存摘要、profile capsule 注入、
off/weak/on影响档位,并支持清空/导出/配置接口。
6. Web UI 渲染与结构化气泡
- 对话气泡结构化解析覆盖 plan handoff、verification marker、todo focus、live user adjustment、finish-blocked、Web search 事件等场景。
- 滚动锚定逻辑改为:只有用户贴底时才自动跟随底部,否则保持当前 viewport 坐标稳定。
- 大会话渲染减少闪屏、强制 reflow、计时器触发的滚动跳动,以及底部细微振动。
- 多 Agent 上下文进度条按 session 状态持久化,只有真实进入多 Agent 后才替换 single context bar。
7. 运行配置与验证
- 自动 L1-L5 分类默认上限改为 L2;用户手动指定复杂度与手动指定 plan mode 仍然优先。
- Web search 支持通过
--enable-web-search与--disable-web-search控制。 - 用户偏好记忆支持
off、weak、on三档启动/配置模式,默认weak。 - 主版本
Clouds_Coder.py与兼容版本Clouds_Coder_2.30.py已同步。
2026-06-05 更新摘要
- 新增按事件触发的 plan resume repair 提示
- 修复基础设施读取导致 plan step 误推进的问题
- 改进 session 接续与运行中用户反馈注入
- 强化 single/multi-agent、plan/non-plan 下的 blackboard 协作连续性
- 新增本地 agent Web search 索引与工具反馈可见性
- 新增可配置影响强度的用户级摘要记忆
- 改进结构化气泡与滚动/渲染稳定性
- 已验证
Clouds_Coder.py、Clouds_Coder_2.30.py、运行时 JS 提取与 split architecture self-check
日本語
見出し:Plan / マルチエージェント / Web セッションを連続タスクとして扱う runtime 制御
1. Plan resume repair を構造検出・イベント駆動に変更
_repair_plan_resume_state、_detect_plan_resume_state_issue、_maybe_prompt_plan_resume_repairを中心に保守的な plan resume 修復経路を追加しました。- plan rows の欠落、複数 active plan step、active worker subtask の欠落、worker subtask 状態の欠落など、実際の構造矛盾を検出します。
- 毎ループで隠れて task tree を再構築するのではなく、矛盾があるときだけ LLM へ構造化された修復プロンプトを提示します。
- 最終 subtask 完了と finish gate を分離し、全 subtask が終わった後に finish が不自然にブロックされる循環を減らしました。
2. Plan step 進行証拠を厳格化
.clouds_coder/plan.mdや内部 skills cache の読み取りは、現在の plan step の実行・検証証拠として扱わなくなりました。_worker_step_has_evidenceと_tool_results_have_validation_evidenceは_is_plan_infrastructure_read_resultにより infrastructure-only read を除外します。- 現在の plan step から期待 subtask を抽出できるのに worker subtasks が欠落または未完了の場合、
_phase_gateは step 自動進行をブロックします。 - plan file を読んだだけで step 1 から step 2 へ進む誤進行を防ぎます。
3. Session 継続と live user input の接続を改善
submit_user_message()は plan 選択、継続メッセージ、新規タスク、実行中の live adjustment を区別します。- 承認済み plan state は継続時に保持され、fresh blackboard として不必要に reset されません。
- 実行中に追加されたユーザー入力は lock 付き live-input queue に入り、best-effort で現在のタスクへ注入されます。
- フロントエンドは live-input queue の応答を通常の遅延 scheduler task と誤認しなくなりました。
4. Blackboard を single / multi-agent 共通の task source of truth に
- Blackboard 状態を Manager、Explorer、Developer、Reviewer の同期基盤としてより積極的に利用します。
- Multi-agent 協調は現在の plan focus を中心に動き、各 role が private task を勝手に進める状態を避けます。
- Single-agent でも active goal、task memory、tool evidence、todo state が同じタスク線を指す連続性モデルを使います。
- Manager coordination snapshot には focus、worker todo 進捗、最近の artifacts、実行証拠、既に触れたファイルなどの実用的な文脈が入ります。
5. Tool context、Web s...
Clouds Coder 2026.06.05-Stable
CHANGELOG 2026-06-05
Plan continuity, live user steering, Web search, and Web service observability
This update focuses on making long-running Clouds Coder sessions behave like one continuous task system instead of a sequence of loosely connected model turns. The core change is architectural: plan state, todo state, blackboard memory, live user input, tool evidence, Web search, and Web UI rendering now participate in one tighter runtime loop.
English
Headline: Continuity-first runtime control for plan, multi-agent, and Web sessions
1. Plan resume repair became structural and event-driven
- Added a conservative plan-resume repair path around
_repair_plan_resume_state,_detect_plan_resume_state_issue, and_maybe_prompt_plan_resume_repair. - The runtime now detects real structural conflicts such as missing plan rows, multiple active plan steps, missing active worker subtasks, or missing worker subtask state.
- Repair is surfaced as an LLM-visible structural prompt when the state is actually inconsistent, instead of silently rebuilding the plan tree on every loop.
- Final-subtask and finish gates were separated so completion is not blocked simply because the last subtask has just ended.
2. Safer plan-step advancement evidence
- Plan infrastructure reads, including
.clouds_coder/plan.mdand internal skills-cache reads, no longer count as execution or validation evidence for the current plan step. _worker_step_has_evidenceand_tool_results_have_validation_evidencenow reject infrastructure-only reads through_is_plan_infrastructure_read_result._phase_gatenow blocks step advancement when the approved plan step has extractable expected subtasks but those subtasks are missing or incomplete.- This prevents accidental jumps from step 1 to step 2 after merely reading the plan file.
3. Session continuation and live user input are better connected
submit_user_message()now distinguishes a plan choice, a continuation message, a new task, and a live adjustment during an active run.- Approved plan state is preserved during continuation instead of being reset as a fresh blackboard.
- Runtime live user additions now enter a locked live-input queue with best-effort delivery, so late feedback is not forced to wait for the previous run to finish.
- The frontend no longer treats live-input queue responses as ordinary deferred scheduler tasks.
4. Blackboard-centered cooperation for single and multi-agent modes
- Blackboard state is used more aggressively as the shared task source of truth across Manager, Explorer, Developer, and Reviewer.
- Multi-agent cooperation is tied to the current plan focus instead of letting each role advance a private task.
- Single-agent execution uses the same continuity model at a smaller scale: the active goal, task memory, tool evidence, and todo state still point to the same task line.
- Manager coordination snapshots now carry practical state, including active focus, worker todo progress, recent artifacts, execution evidence, and files already touched for that focus.
5. Tool context, Web search, and user memory integration
- The dynamic tool-context path was expanded so recent tool use can inform later model calls without re-reading the same files or re-running the same commands unnecessarily.
agent_web_searchis integrated as a real runtime tool with enable/disable controls, tool feedback events, HTTP fetching, page/evidence tracking, and persistent search indexing.- Useful search hits and evidence are recorded into a local search index so future searches can reuse successful source patterns.
- User-level long-term memory was added with per-user isolation, summary-only storage, profile capsules,
off/weak/oninfluence levels, and clear/export/config API support.
6. Web UI rendering and structured bubbles
- Chat bubble parsing was expanded for plan handoffs, verification markers, todo focus messages, live user adjustments, finish-blocked messages, and Web search events.
- Scroll anchoring now keeps the current viewport stable unless the user is already attached to the bottom.
- Large-session rendering was tuned to reduce flicker, forced reflow, timer-driven scroll jumps, and bottom-position vibration.
- Multi-agent context bars remain session-aware and only replace the single context bar after multi-agent mode is actually active.
7. Runtime configuration and validation
- Automatic L1-L5 classification now has a default automatic ceiling of L2, while manual level and manual plan-mode choices remain authoritative.
- Web search can be controlled through
--enable-web-searchand--disable-web-search. - User preference memory can be controlled through startup/config modes (
off,weak,on), withweakas the practical default. - The main runtime and the 2.30 compatibility file were kept in sync.
2026-06-05 Summary
- Added event-driven plan resume repair prompts
- Fixed plan-step jumps caused by infrastructure-only reads
- Improved session continuation and live user feedback injection
- Strengthened blackboard cooperation across single/multi-agent and plan/non-plan execution
- Added local agent Web search indexing and feedback visibility
- Added per-user summary memory with configurable influence
- Improved structured bubbles and scroll/render stability
- Validated
Clouds_Coder.py,Clouds_Coder_2.30.py, runtime JavaScript extraction, and split architecture self-check
中文
标题:面向连续任务的 Plan / 多 Agent / Web 会话运行时治理
1. Plan 接续修复改为结构化、按事件触发
- 新增围绕
_repair_plan_resume_state、_detect_plan_resume_state_issue、_maybe_prompt_plan_resume_repair的保守 plan resume 修复链路。 - 运行时会识别真实结构矛盾,例如 plan rows 缺失、多个 active plan step、缺失 active worker subtask、worker subtask 状态缺失等。
- 修复不再是每轮隐式重建任务树,而是在状态确实矛盾时向 LLM 注入可见的结构化修复提示。
- 最后一个 subtask 完成与 finish gate 被拆开处理,避免“所有子任务完成了,却因为仍在子任务状态而无法 finish”的循环。
2. Plan Step 推进证据更严格
.clouds_coder/plan.md和内部 skills cache 读取不再被当作当前 plan step 的执行或验收证据。_worker_step_has_evidence与_tool_results_have_validation_evidence通过_is_plan_infrastructure_read_result排除纯基础设施读取。- 当当前 plan step 可以解析出应有的 subtasks,但 worker subtasks 缺失或未完成时,
_phase_gate会阻止 step 自动推进。 - 这修复了“只读了 plan 文件就从 step 1 跳到 step 2”的误推进问题。
3. Session 接续与实时用户输入衔接更顺畅
submit_user_message()现在区分 plan 选择、接续消息、新任务,以及运行中的实时用户调整。- 已批准的 plan state 在接续任务时会保留,而不是被当成新黑板重置。
- 运行中的用户追加输入会进入带锁的 live-input queue,并以 best-effort 方式尽快注入当前任务链路。
- 前端不再把 live-input queue 的响应误当成普通 scheduler 延迟任务。
4. Blackboard 成为 single / multi-agent 的共同任务事实源
- Blackboard 状态被更积极地用于 Manager、Explorer、Developer、Reviewer 之间同步当前任务。
- 多 Agent 合作围绕当前 plan focus 展开,而不是各角色推进自己的私有任务。
- Single-agent 也复用同一套连续性模型:active goal、task memory、tool evidence、todo state 指向同一条任务主线。
- Manager coordination snapshot 会携带当前 focus、worker todo 进度、近期 artifacts、执行证据、已读/已改文件等可操作上下文。
5. Tool Context、Web Search 与用户记忆接入
- 动态 tool context 能让近期工具调用影响后续模型决策,降低重复 read_file、重复 bash、重复检索的概率。
agent_web_search已作为真实 runtime tool 集成,支持启用/关闭、工具反馈事件、HTTP 抓取、页面/证据追踪与本地搜索索引。- 命中有效信息的网页与证据会写入本地索引,后续检索可以复用成功来源和信息类型。
- 新增用户级长期记忆:按 user_id 隔离、只保存摘要、profile capsule 注入、
off/weak/on影响档位,并支持清空/导出/配置接口。
6. Web UI 渲染与结构化气泡
- 对话气泡结构化解析覆盖 plan handoff、verification marker、todo focus、live user adjustment、finish-blocked、Web search 事件等场景。
- 滚动锚定逻辑改为:只有用户贴底时才自动跟随底部,否则保持当前 viewport 坐标稳定。
- 大会话渲染减少闪屏、强制 reflow、计时器触发的滚动跳动,以及底部细微振动。
- 多 Agent 上下文进度条按 session 状态持久化,只有真实进入多 Agent 后才替换 single context bar。
7. 运行配置与验证
- 自动 L1-L5 分类默认上限改为 L2;用户手动指定复杂度与手动指定 plan mode 仍然优先。
- Web search 支持通过
--enable-web-search与--disable-web-search控制。 - 用户偏好记忆支持
off、weak、on三档启动/配置模式,默认weak。 - 主版本
Clouds_Coder.py与兼容版本Clouds_Coder_2.30.py已同步。
2026-06-05 更新摘要
- 新增按事件触发的 plan resume repair 提示
- 修复基础设施读取导致 plan step 误推进的问题
- 改进 session 接续与运行中用户反馈注入
- 强化 single/multi-agent、plan/non-plan 下的 blackboard 协作连续性
- 新增本地 agent Web search 索引与工具反馈可见性
- 新增可配置影响强度的用户级摘要记忆
- 改进结构化气泡与滚动/渲染稳定性
- 已验证
Clouds_Coder.py、Clouds_Coder_2.30.py、运行时 JS 提取与 split architecture self-check
日本語
見出し:Plan / マルチエージェント / Web セッションを連続タスクとして扱う runtime 制御
1. Plan resume repair を構造検出・イベント駆動に変更
_repair_plan_resume_state、_detect_plan_resume_state_issue、_maybe_prompt_plan_resume_repairを中心に保守的な plan resume 修復経路を追加しました。- plan rows の欠落、複数 active plan step、active worker subtask の欠落、worker subtask 状態の欠落など、実際の構造矛盾を検出します。
- 毎ループで隠れて task tree を再構築するのではなく、矛盾があるときだけ LLM へ構造化された修復プロンプトを提示します。
- 最終 subtask 完了と finish gate を分離し、全 subtask が終わった後に finish が不自然にブロックされる循環を減らしました。
2. Plan step 進行証拠を厳格化
.clouds_coder/plan.mdや内部 skills cache の読み取りは、現在の plan step の実行・検証証拠として扱わなくなりました。_worker_step_has_evidenceと_tool_results_have_validation_evidenceは_is_plan_infrastructure_read_resultにより infrastructure-only read を除外します。- 現在の plan step から期待 subtask を抽出できるのに worker subtasks が欠落または未完了の場合、
_phase_gateは step 自動進行をブロックします。 - plan file を読んだだけで step 1 から step 2 へ進む誤進行を防ぎます。
3. Session 継続と live user input の接続を改善
submit_user_message()は plan 選択、継続メッセージ、新規タスク、実行中の live adjustment を区別します。- 承認済み plan state は継続時に保持され、fresh blackboard として不必要に reset されません。
- 実行中に追加されたユーザー入力は lock 付き live-input queue に入り、best-effort で現在のタスクへ注入されます。
- フロントエンドは live-input queue の応答を通常の遅延 scheduler task と誤認しなくなりました。
4. Blackboard を single / multi-agent 共通の task source of truth に
- Blackboard 状態を Manager、Explorer、Developer、Reviewer の同期基盤としてより積極的に利用します。
- Multi-agent 協調は現在の plan focus を中心に動き、各 role が private task を勝手に進める状態を避けます。
- Single-agent でも active goal、task memory、tool evidence、todo state が同じタスク線を指す連続性モデルを使います。
- Manager coordination snapshot には focus、worker todo 進捗、最近の artifacts、実行証拠、既に触れたファイルなどの実用的な文脈が入ります。
5. Tool context、Web search、ユーザーメモリの統合
- 動的 tool context により、直近の to...
Clouds Coder 2026.05.30-Stable
CHANGELOG 2026-05-30
Bugs Fixed & Promoted Efficiency
CHANGELOG 2026-05-28
Role-isolated multi-agent context, stronger tool-reading path, and clearer runtime observability
This update turns multi-agent mode into a practical long-horizon execution strategy for short-context local models: agents now carry separate working contexts, compact independently under the existing tiered compression framework, and expose their live context pressure in the Web UI only when multi-agent mode is actually active.
English
Headline: Multi-agent context isolation for long-running work on short-context models
1. Role-isolated context budgets
- Multi-agent sessions now track context pressure by active call and role instead of presenting one ambiguous global number.
- Manager, Explorer, Developer, and Reviewer can each keep their own working context shape, so research, implementation, and review traces no longer compete as aggressively inside a single prompt lane.
- Single-agent sessions still use the original single context budget display and do not expose stale inactive agent contexts.
2. Independent tiered compression per agent
- The existing normal/light/medium/heavy compression framework is preserved.
- Multi-agent mode now applies that framework per active role, allowing the tightest agent to compact without flattening every other role's context at the same time.
- This improves long-line task continuity for smaller local models because each role can retain the evidence most relevant to its own job.
3. Long-horizon capability for short-context models
- The architecture intentionally uses role separation as a context-scaling technique: Explorer can keep discovery notes, Developer can keep implementation state, Reviewer can keep validation evidence, and Manager can keep routing state.
- This makes multi-agent mode valuable even when the model itself has limited context, because the runtime can preserve specialized state and only inject the role context needed for the next call.
- The result is better continuity across research → edit → validate → repair loops without requiring a single huge prompt.
4. Context UI semantics
- The top context indicator keeps the original single bar in single mode.
- Once a session enters sync/sequential multi-agent mode, the same slot shows nested role bars sorted by tightest remaining context first.
- The smallest remaining context is displayed as the outer lane, so the most constrained role is visually prominent.
- Role chips appear only for real multi-agent execution, not for L1/L2 single tasks or stale contexts from previous runs.
5. Tool and preview path refinements
- File-reading and long-output behavior was strengthened around flexible access rather than defensive early exit.
- Chat bubble code/diff previews preserve whitespace and indentation, making function structure and patch shape readable in the conversation stream.
- Runtime mode fallback was corrected so completed L1/L2 single tasks do not regress to global sync-mode display after the run resets transient runtime fields.
2026-05-28 Summary
- Added role-aware context budget snapshots for active multi-agent calls
- Added per-role independent compression under the existing tiered compact framework
- Kept single-mode context display as the original single global bar
- Added nested multi-agent context bars and localized role-specific context labels
- Fixed stale multi-agent context display after simple single-agent tasks finish
- Improved chat bubble code/diff whitespace preservation
中文
标题:用分角色上下文隔离提升短上下文模型的长线处理能力
1. 分 Agent 上下文预算
- 多 Agent 会话现在按真实调用角色展示上下文压力,不再只给一个含义模糊的全局数值。
- Manager、Explorer、Developer、Reviewer 可以保持各自的工作上下文形态,让调研、实现、审查轨迹不再全部挤进同一条 prompt 通道。
- Single-agent 会话保持原来的单一上下文显示,不暴露历史遗留的未激活 agent context。
2. 分 Agent 独立分层压缩
- 保留现有 normal/light/medium/heavy 分级压缩框架。
- 多 Agent 模式下按活跃角色独立应用压缩,让最紧张的 agent 可以先压缩,而不是把所有角色上下文一起压平。
- 这对短上下文本地模型尤其重要,因为每个角色可以保留与自身职责最相关的证据。
3. 短上下文模型的长线能力放大
- 本次架构把角色拆分明确作为一种 context scaling 技术:Explorer 保留发现和证据,Developer 保留实现状态,Reviewer 保留验证依据,Manager 保留路由与裁决状态。
- 即便模型自身上下文较短,运行时也能通过分角色状态保存,只把下一次调用需要的角色上下文注入模型。
- 因此 research → edit → validate → repair 的长链路不再依赖单次巨大 prompt,连续性更强。
4. 上下文 UI 语义
- Single 模式顶部上下文条保持原有单条进度显示。
- 会话真实进入 sync/sequential 多 Agent 后,同一槽位切换为嵌套角色进度条,并按剩余上下文最紧张优先排序。
- 剩余最少的角色显示在最外层,让最容易耗尽上下文的 agent 在视觉上最突出。
- 角色 chips 只在真实多 Agent 执行时显示,L1/L2 简单 single 任务和历史残留 context 不再唤出多 Agent 展示。
5. 工具读取与预览链路细化
- read file / 长输出路径从“被动防御式截断”转向更灵活的读取能力,减少简单保护导致的提前退出。
- 对话气泡中的代码 / diff 预览保留真实空格与缩进,函数结构和补丁结构可以直接读出来。
- 修复 L1/L2 single 任务结束后 transient runtime 字段清空,UI 又回落到全局 sync 显示的问题。
2026-05-28 更新摘要
- 新增按真实多 Agent 调用角色统计的上下文预算快照
- 在现有分层 compact 框架下新增分角色独立压缩
- Single 模式保持原有单一上下文进度条
- 新增嵌套式多 Agent 上下文进度条与多语言角色剩余标签
- 修复简单 single 任务结束后显示历史多 Agent context 的问题
- 改进对话气泡代码 / diff 预览的空格与缩进保真
日本語
見出し:ロール別コンテキスト分離で短コンテキストモデルの長期処理を強化
1. Agent 別コンテキスト予算
- マルチエージェント session は、曖昧な単一グローバル値ではなく、実際の呼び出しロールごとにコンテキスト圧力を表示します。
- Manager、Explorer、Developer、Reviewer はそれぞれの作業コンテキストを保持でき、調査・実装・レビューの痕跡が同じ prompt レーンで過度に競合しにくくなります。
- Single-agent session は従来通り単一コンテキスト表示を維持し、過去の非アクティブ agent context を表示しません。
2. Agent 別の独立階層圧縮
- 既存の normal/light/medium/heavy 圧縮フレームワークを維持します。
- マルチエージェント mode では active role ごとに圧縮を適用し、最も逼迫した agent だけを先に compact できます。
- 各ロールが自分の仕事に最も関係する証拠を保持できるため、短コンテキストのローカルモデルで長い作業を続けやすくなります。
3. 短コンテキストモデル向けの長期処理能力
- ロール分離を context scaling 技術として扱います。Explorer は発見事項、Developer は実装状態、Reviewer は検証根拠、Manager はルーティング状態を保持します。
- モデル自体のコンテキストが短くても、runtime は専用状態を保存し、次の呼び出しに必要なロールコンテキストだけを注入できます。
- research → edit → validate → repair の長いループが、単一の巨大 prompt に依存しにくくなります。
4. コンテキスト UI セマンティクス
- Single mode ではトップのコンテキストバーは従来の単一バーのままです。
- session が実際に sync/sequential マルチエージェント mode に入ると、同じスロットがネストされたロールバーに切り替わり、残りコンテキストが最も少ない順に並びます。
- 最も残りが少ないロールを外側レーンとして表示し、最も制約の強い agent が視覚的に目立つようにしました。
- ロール chips は本物のマルチエージェント実行時だけ表示され、L1/L2 single task や過去 context では表示されません。
5. ツール読み取りとプレビュー経路の改善
- read file / 長出力の経路は、防御的な早期終了よりも柔軟な読み取り能力を重視する方向に強化されました。
- チャットバブル内の code/diff preview は空白とインデントを保持し、関数構造や patch 形状を会話内で確認しやすくなりました。
- L1/L2 single task 終了後に transient runtime field が消え、UI が global sync 表示へ戻る問題を修正しました。
2026-05-28 要約
- 実際のマルチエージェント呼び出しロール別のコンテキスト予算 snapshot を追加
- 既存の階層 compact フレームワーク上でロール別独立圧縮を追加
- Single mode は従来の単一コンテキストバーを維持
- ネスト型マルチエージェントコンテキストバーと多言語ロール別残量ラベルを追加
- simple single task 終了後に過去の multi-agent context が表示される問題を修正
- チャットバブル code/diff preview の空白・インデント保持を改善
Clouds Coder 2026.05.29-Stable
CHANGELOG 2026-05-29
Bugs Fixed
CHANGELOG 2026-05-28
Role-isolated multi-agent context, stronger tool-reading path, and clearer runtime observability
This update turns multi-agent mode into a practical long-horizon execution strategy for short-context local models: agents now carry separate working contexts, compact independently under the existing tiered compression framework, and expose their live context pressure in the Web UI only when multi-agent mode is actually active.
English
Headline: Multi-agent context isolation for long-running work on short-context models
1. Role-isolated context budgets
- Multi-agent sessions now track context pressure by active call and role instead of presenting one ambiguous global number.
- Manager, Explorer, Developer, and Reviewer can each keep their own working context shape, so research, implementation, and review traces no longer compete as aggressively inside a single prompt lane.
- Single-agent sessions still use the original single context budget display and do not expose stale inactive agent contexts.
2. Independent tiered compression per agent
- The existing normal/light/medium/heavy compression framework is preserved.
- Multi-agent mode now applies that framework per active role, allowing the tightest agent to compact without flattening every other role's context at the same time.
- This improves long-line task continuity for smaller local models because each role can retain the evidence most relevant to its own job.
3. Long-horizon capability for short-context models
- The architecture intentionally uses role separation as a context-scaling technique: Explorer can keep discovery notes, Developer can keep implementation state, Reviewer can keep validation evidence, and Manager can keep routing state.
- This makes multi-agent mode valuable even when the model itself has limited context, because the runtime can preserve specialized state and only inject the role context needed for the next call.
- The result is better continuity across research → edit → validate → repair loops without requiring a single huge prompt.
4. Context UI semantics
- The top context indicator keeps the original single bar in single mode.
- Once a session enters sync/sequential multi-agent mode, the same slot shows nested role bars sorted by tightest remaining context first.
- The smallest remaining context is displayed as the outer lane, so the most constrained role is visually prominent.
- Role chips appear only for real multi-agent execution, not for L1/L2 single tasks or stale contexts from previous runs.
5. Tool and preview path refinements
- File-reading and long-output behavior was strengthened around flexible access rather than defensive early exit.
- Chat bubble code/diff previews preserve whitespace and indentation, making function structure and patch shape readable in the conversation stream.
- Runtime mode fallback was corrected so completed L1/L2 single tasks do not regress to global sync-mode display after the run resets transient runtime fields.
2026-05-28 Summary
- Added role-aware context budget snapshots for active multi-agent calls
- Added per-role independent compression under the existing tiered compact framework
- Kept single-mode context display as the original single global bar
- Added nested multi-agent context bars and localized role-specific context labels
- Fixed stale multi-agent context display after simple single-agent tasks finish
- Improved chat bubble code/diff whitespace preservation
中文
标题:用分角色上下文隔离提升短上下文模型的长线处理能力
1. 分 Agent 上下文预算
- 多 Agent 会话现在按真实调用角色展示上下文压力,不再只给一个含义模糊的全局数值。
- Manager、Explorer、Developer、Reviewer 可以保持各自的工作上下文形态,让调研、实现、审查轨迹不再全部挤进同一条 prompt 通道。
- Single-agent 会话保持原来的单一上下文显示,不暴露历史遗留的未激活 agent context。
2. 分 Agent 独立分层压缩
- 保留现有 normal/light/medium/heavy 分级压缩框架。
- 多 Agent 模式下按活跃角色独立应用压缩,让最紧张的 agent 可以先压缩,而不是把所有角色上下文一起压平。
- 这对短上下文本地模型尤其重要,因为每个角色可以保留与自身职责最相关的证据。
3. 短上下文模型的长线能力放大
- 本次架构把角色拆分明确作为一种 context scaling 技术:Explorer 保留发现和证据,Developer 保留实现状态,Reviewer 保留验证依据,Manager 保留路由与裁决状态。
- 即便模型自身上下文较短,运行时也能通过分角色状态保存,只把下一次调用需要的角色上下文注入模型。
- 因此 research → edit → validate → repair 的长链路不再依赖单次巨大 prompt,连续性更强。
4. 上下文 UI 语义
- Single 模式顶部上下文条保持原有单条进度显示。
- 会话真实进入 sync/sequential 多 Agent 后,同一槽位切换为嵌套角色进度条,并按剩余上下文最紧张优先排序。
- 剩余最少的角色显示在最外层,让最容易耗尽上下文的 agent 在视觉上最突出。
- 角色 chips 只在真实多 Agent 执行时显示,L1/L2 简单 single 任务和历史残留 context 不再唤出多 Agent 展示。
5. 工具读取与预览链路细化
- read file / 长输出路径从“被动防御式截断”转向更灵活的读取能力,减少简单保护导致的提前退出。
- 对话气泡中的代码 / diff 预览保留真实空格与缩进,函数结构和补丁结构可以直接读出来。
- 修复 L1/L2 single 任务结束后 transient runtime 字段清空,UI 又回落到全局 sync 显示的问题。
2026-05-28 更新摘要
- 新增按真实多 Agent 调用角色统计的上下文预算快照
- 在现有分层 compact 框架下新增分角色独立压缩
- Single 模式保持原有单一上下文进度条
- 新增嵌套式多 Agent 上下文进度条与多语言角色剩余标签
- 修复简单 single 任务结束后显示历史多 Agent context 的问题
- 改进对话气泡代码 / diff 预览的空格与缩进保真
日本語
見出し:ロール別コンテキスト分離で短コンテキストモデルの長期処理を強化
1. Agent 別コンテキスト予算
- マルチエージェント session は、曖昧な単一グローバル値ではなく、実際の呼び出しロールごとにコンテキスト圧力を表示します。
- Manager、Explorer、Developer、Reviewer はそれぞれの作業コンテキストを保持でき、調査・実装・レビューの痕跡が同じ prompt レーンで過度に競合しにくくなります。
- Single-agent session は従来通り単一コンテキスト表示を維持し、過去の非アクティブ agent context を表示しません。
2. Agent 別の独立階層圧縮
- 既存の normal/light/medium/heavy 圧縮フレームワークを維持します。
- マルチエージェント mode では active role ごとに圧縮を適用し、最も逼迫した agent だけを先に compact できます。
- 各ロールが自分の仕事に最も関係する証拠を保持できるため、短コンテキストのローカルモデルで長い作業を続けやすくなります。
3. 短コンテキストモデル向けの長期処理能力
- ロール分離を context scaling 技術として扱います。Explorer は発見事項、Developer は実装状態、Reviewer は検証根拠、Manager はルーティング状態を保持します。
- モデル自体のコンテキストが短くても、runtime は専用状態を保存し、次の呼び出しに必要なロールコンテキストだけを注入できます。
- research → edit → validate → repair の長いループが、単一の巨大 prompt に依存しにくくなります。
4. コンテキスト UI セマンティクス
- Single mode ではトップのコンテキストバーは従来の単一バーのままです。
- session が実際に sync/sequential マルチエージェント mode に入ると、同じスロットがネストされたロールバーに切り替わり、残りコンテキストが最も少ない順に並びます。
- 最も残りが少ないロールを外側レーンとして表示し、最も制約の強い agent が視覚的に目立つようにしました。
- ロール chips は本物のマルチエージェント実行時だけ表示され、L1/L2 single task や過去 context では表示されません。
5. ツール読み取りとプレビュー経路の改善
- read file / 長出力の経路は、防御的な早期終了よりも柔軟な読み取り能力を重視する方向に強化されました。
- チャットバブル内の code/diff preview は空白とインデントを保持し、関数構造や patch 形状を会話内で確認しやすくなりました。
- L1/L2 single task 終了後に transient runtime field が消え、UI が global sync 表示へ戻る問題を修正しました。
2026-05-28 要約
- 実際のマルチエージェント呼び出しロール別のコンテキスト予算 snapshot を追加
- 既存の階層 compact フレームワーク上でロール別独立圧縮を追加
- Single mode は従来の単一コンテキストバーを維持
- ネスト型マルチエージェントコンテキストバーと多言語ロール別残量ラベルを追加
- simple single task 終了後に過去の multi-agent context が表示される問題を修正
- チャットバブル code/diff preview の空白・インデント保持を改善
Clouds Coder 2026.05.28-Stable
CHANGELOG 2026-05-28
Role-isolated multi-agent context, stronger tool-reading path, and clearer runtime observability
This update turns multi-agent mode into a practical long-horizon execution strategy for short-context local models: agents now carry separate working contexts, compact independently under the existing tiered compression framework, and expose their live context pressure in the Web UI only when multi-agent mode is actually active.
English
Headline: Multi-agent context isolation for long-running work on short-context models
1. Role-isolated context budgets
- Multi-agent sessions now track context pressure by active call and role instead of presenting one ambiguous global number.
- Manager, Explorer, Developer, and Reviewer can each keep their own working context shape, so research, implementation, and review traces no longer compete as aggressively inside a single prompt lane.
- Single-agent sessions still use the original single context budget display and do not expose stale inactive agent contexts.
2. Independent tiered compression per agent
- The existing normal/light/medium/heavy compression framework is preserved.
- Multi-agent mode now applies that framework per active role, allowing the tightest agent to compact without flattening every other role's context at the same time.
- This improves long-line task continuity for smaller local models because each role can retain the evidence most relevant to its own job.
3. Long-horizon capability for short-context models
- The architecture intentionally uses role separation as a context-scaling technique: Explorer can keep discovery notes, Developer can keep implementation state, Reviewer can keep validation evidence, and Manager can keep routing state.
- This makes multi-agent mode valuable even when the model itself has limited context, because the runtime can preserve specialized state and only inject the role context needed for the next call.
- The result is better continuity across research → edit → validate → repair loops without requiring a single huge prompt.
4. Context UI semantics
- The top context indicator keeps the original single bar in single mode.
- Once a session enters sync/sequential multi-agent mode, the same slot shows nested role bars sorted by tightest remaining context first.
- The smallest remaining context is displayed as the outer lane, so the most constrained role is visually prominent.
- Role chips appear only for real multi-agent execution, not for L1/L2 single tasks or stale contexts from previous runs.
5. Tool and preview path refinements
- File-reading and long-output behavior was strengthened around flexible access rather than defensive early exit.
- Chat bubble code/diff previews preserve whitespace and indentation, making function structure and patch shape readable in the conversation stream.
- Runtime mode fallback was corrected so completed L1/L2 single tasks do not regress to global sync-mode display after the run resets transient runtime fields.
2026-05-28 Summary
- Added role-aware context budget snapshots for active multi-agent calls
- Added per-role independent compression under the existing tiered compact framework
- Kept single-mode context display as the original single global bar
- Added nested multi-agent context bars and localized role-specific context labels
- Fixed stale multi-agent context display after simple single-agent tasks finish
- Improved chat bubble code/diff whitespace preservation
中文
标题:用分角色上下文隔离提升短上下文模型的长线处理能力
1. 分 Agent 上下文预算
- 多 Agent 会话现在按真实调用角色展示上下文压力,不再只给一个含义模糊的全局数值。
- Manager、Explorer、Developer、Reviewer 可以保持各自的工作上下文形态,让调研、实现、审查轨迹不再全部挤进同一条 prompt 通道。
- Single-agent 会话保持原来的单一上下文显示,不暴露历史遗留的未激活 agent context。
2. 分 Agent 独立分层压缩
- 保留现有 normal/light/medium/heavy 分级压缩框架。
- 多 Agent 模式下按活跃角色独立应用压缩,让最紧张的 agent 可以先压缩,而不是把所有角色上下文一起压平。
- 这对短上下文本地模型尤其重要,因为每个角色可以保留与自身职责最相关的证据。
3. 短上下文模型的长线能力放大
- 本次架构把角色拆分明确作为一种 context scaling 技术:Explorer 保留发现和证据,Developer 保留实现状态,Reviewer 保留验证依据,Manager 保留路由与裁决状态。
- 即便模型自身上下文较短,运行时也能通过分角色状态保存,只把下一次调用需要的角色上下文注入模型。
- 因此 research → edit → validate → repair 的长链路不再依赖单次巨大 prompt,连续性更强。
4. 上下文 UI 语义
- Single 模式顶部上下文条保持原有单条进度显示。
- 会话真实进入 sync/sequential 多 Agent 后,同一槽位切换为嵌套角色进度条,并按剩余上下文最紧张优先排序。
- 剩余最少的角色显示在最外层,让最容易耗尽上下文的 agent 在视觉上最突出。
- 角色 chips 只在真实多 Agent 执行时显示,L1/L2 简单 single 任务和历史残留 context 不再唤出多 Agent 展示。
5. 工具读取与预览链路细化
- read file / 长输出路径从“被动防御式截断”转向更灵活的读取能力,减少简单保护导致的提前退出。
- 对话气泡中的代码 / diff 预览保留真实空格与缩进,函数结构和补丁结构可以直接读出来。
- 修复 L1/L2 single 任务结束后 transient runtime 字段清空,UI 又回落到全局 sync 显示的问题。
2026-05-28 更新摘要
- 新增按真实多 Agent 调用角色统计的上下文预算快照
- 在现有分层 compact 框架下新增分角色独立压缩
- Single 模式保持原有单一上下文进度条
- 新增嵌套式多 Agent 上下文进度条与多语言角色剩余标签
- 修复简单 single 任务结束后显示历史多 Agent context 的问题
- 改进对话气泡代码 / diff 预览的空格与缩进保真
日本語
見出し:ロール別コンテキスト分離で短コンテキストモデルの長期処理を強化
1. Agent 別コンテキスト予算
- マルチエージェント session は、曖昧な単一グローバル値ではなく、実際の呼び出しロールごとにコンテキスト圧力を表示します。
- Manager、Explorer、Developer、Reviewer はそれぞれの作業コンテキストを保持でき、調査・実装・レビューの痕跡が同じ prompt レーンで過度に競合しにくくなります。
- Single-agent session は従来通り単一コンテキスト表示を維持し、過去の非アクティブ agent context を表示しません。
2. Agent 別の独立階層圧縮
- 既存の normal/light/medium/heavy 圧縮フレームワークを維持します。
- マルチエージェント mode では active role ごとに圧縮を適用し、最も逼迫した agent だけを先に compact できます。
- 各ロールが自分の仕事に最も関係する証拠を保持できるため、短コンテキストのローカルモデルで長い作業を続けやすくなります。
3. 短コンテキストモデル向けの長期処理能力
- ロール分離を context scaling 技術として扱います。Explorer は発見事項、Developer は実装状態、Reviewer は検証根拠、Manager はルーティング状態を保持します。
- モデル自体のコンテキストが短くても、runtime は専用状態を保存し、次の呼び出しに必要なロールコンテキストだけを注入できます。
- research → edit → validate → repair の長いループが、単一の巨大 prompt に依存しにくくなります。
4. コンテキスト UI セマンティクス
- Single mode ではトップのコンテキストバーは従来の単一バーのままです。
- session が実際に sync/sequential マルチエージェント mode に入ると、同じスロットがネストされたロールバーに切り替わり、残りコンテキストが最も少ない順に並びます。
- 最も残りが少ないロールを外側レーンとして表示し、最も制約の強い agent が視覚的に目立つようにしました。
- ロール chips は本物のマルチエージェント実行時だけ表示され、L1/L2 single task や過去 context では表示されません。
5. ツール読み取りとプレビュー経路の改善
- read file / 長出力の経路は、防御的な早期終了よりも柔軟な読み取り能力を重視する方向に強化されました。
- チャットバブル内の code/diff preview は空白とインデントを保持し、関数構造や patch 形状を会話内で確認しやすくなりました。
- L1/L2 single task 終了後に transient runtime field が消え、UI が global sync 表示へ戻る問題を修正しました。
2026-05-28 要約
- 実際のマルチエージェント呼び出しロール別のコンテキスト予算 snapshot を追加
- 既存の階層 compact フレームワーク上でロール別独立圧縮を追加
- Single mode は従来の単一コンテキストバーを維持
- ネスト型マルチエージェントコンテキストバーと多言語ロール別残量ラベルを追加
- simple single task 終了後に過去の multi-agent context が表示される問題を修正
- チャットバブル code/diff preview の空白・インデント保持を改善
Clouds Coder 2026.05.02-Stable
CHANGELOG 2026-05-02
Persistent Wiki RAG + workflow memory + provider resilience + importable split architecture
This update moves Clouds Coder beyond one-shot chunk retrieval: RAG now gains an accumulated Markdown Wiki layer, programming RAG gains scored workflow memory, private vLLM / OpenAI-compatible providers gain long-delay retry governance, and split_coder.py can regenerate an importable architecture package for navigating the monolithic runtime.
English
Headline: Accumulated Wiki RAG, programming workflow memory, and more resilient model/runtime architecture
1. Persistent Wiki RAG layer
- Added
WikiStore, a durable Markdown wiki compiler for both knowledge libraries and code libraries. - The wiki is generated under each library root as
wiki/, with:sources/: source-level pagesentities/: recurring entity / symbol / domain-term pagesconcepts/: community and graph-derived concept pagessynthesis/overview.md: compact library-wide overviewindex.md: first-hop catalog for retrievallog.md: chronological maintenance logschema.md: maintenance and query convention file
- Query flow is now wiki-first for accumulated synthesis, then raw chunks for exact evidence and line-level details.
- Knowledge Wiki RAG and Code RAG are separated at the architecture level, so general knowledge synthesis and programming/code retrieval can evolve independently.
2. Programming RAG workflow memory
- Added
WorkflowMemoryStorefor accepted programming workflow patterns captured from completed sessions. - Sessions are scored from completion signals, code-edit operations, validation/test steps, todo progress, structured planning, and multi-node coordination.
- High-quality workflows are filed as Markdown cards under the code wiki workflow memory and become retrievable with the
workflowroute. - Code RAG can now retrieve both source-code evidence and proven process patterns, strengthening small-model task handoff, tool-use sequencing, and implementation continuity.
3. Private vLLM / OpenAI-compatible provider resilience
- Model HTTP retry governance now defaults to 5 retries with a 60-second retry interval.
- Transient statuses include
408,409,425,429,500,502,503, and504. - vLLM / OpenAI-compatible / LM Studio chat endpoints can also retry nginx/upstream-looking transient
404responses. - Retry timing follows
Retry-After,X-RateLimit-Reset, and common JSON retry fields when present. - Endpoint-level cooldowns reduce repeated hammering of the same failing provider/model endpoint.
- Sessions emit visible status during retry waits, while probe mode avoids long retry delays.
4. Runtime output control
AGENT_RUN_COMPLETION_SUMMARYnow defaults tofalse.- Normal chat completion no longer appends an extra synthetic "task completed" assistant summary bubble.
- Operators can re-enable that completion summary explicitly with
AGENT_RUN_COMPLETION_SUMMARY=true.
5. Importable split architecture output
split_coder.pynow generates a_source_bridge.pylayer that loads the originalClouds_Coder.pyonce and binds routed symbols from it.- Generated modules remain importable navigation stubs instead of recursively importing each other and recreating circular dependencies.
- Self-check now validates top-level symbol coverage,
py_compile, stale generated files, package import walk, entry-point help, and cleanup of generated__pycache__. - RAG/Wiki/Workflow symbols are routed into dedicated RAG modules, reducing unclassified architecture drift.
2026-05-02 Summary
- Added persistent Markdown Wiki RAG with
index.md,log.md, andschema.md - Added programming workflow memory for accepted high-quality code workflows
- Added private vLLM / OpenAI-compatible retry and cooldown governance
- Disabled extra run-completion summary bubbles by default
- Made
split_coder.pygenerate an importable split architecture package
中文
标题:持久化 Wiki RAG、编程工作流记忆、更稳健的模型与运行时架构
1. 持久化 Wiki RAG 层
- 新增
WikiStore,为知识库和代码库生成可持久维护的 Markdown Wiki。 - 每个库根目录下会生成
wiki/,包含:sources/:来源级页面entities/:实体、符号、领域术语页面concepts/:由社区与图结构导出的概念页synthesis/overview.md:全库概览index.md:检索第一跳目录log.md:按时间追加的维护日志schema.md:维护和查询约定
- 检索链路现在优先使用 Wiki 中的累计综合,再回退到 raw chunks 获取精确证据和行级细节。
- 知识 Wiki 图谱 RAG 与编程 Code RAG 在架构上分离,方便分别优化通用知识综合与代码/工程检索。
2. 编程 RAG 工作流记忆
- 新增
WorkflowMemoryStore,从完成后的 session 中捕获可复用的高质量编程工作流。 - 系统会根据完成信号、代码修改、验证/测试步骤、todo 推进、结构化规划、多节点协同等因素自动评分。
- 高质量工作流会以 Markdown 卡片形式收录到代码 Wiki 的 workflow memory,并可通过
workflow路由检索。 - Code RAG 不再只检索代码证据,也能检索已经验证过的过程模式,从而强化小模型的任务交接、工具调用顺序和实现连续性。
3. 私有 vLLM / OpenAI-compatible 模型服务韧性
- 模型 HTTP 重试默认提升为 5 次,重试间隔默认 60 秒。
- 临时状态码覆盖
408、409、425、429、500、502、503、504。 - vLLM / OpenAI-compatible / LM Studio 的 chat endpoint 对 nginx/upstream 风格的临时
404也可进行重试。 - 若服务端返回
Retry-After、X-RateLimit-Reset或常见 JSON retry 字段,系统会按服务端节奏等待。 - endpoint 级 cooldown 避免对同一故障 provider/model 端点反复高频请求。
- 会话会在等待重试时显示状态;探测模式不会触发长时间重试。
4. 运行时输出控制
AGENT_RUN_COMPLETION_SUMMARY默认改为false。- 正常对话完成后不再额外追加“任务执行完成”的合成 assistant 气泡。
- 如需恢复该摘要行为,可显式设置
AGENT_RUN_COMPLETION_SUMMARY=true。
5. 可导入的拆分架构输出
split_coder.py现在生成_source_bridge.py,由桥接层加载原始Clouds_Coder.py,再把符号绑定到拆分模块中。- 生成模块作为可导入的架构导航桩存在,不再互相递归 import 导致循环依赖。
- self-check 覆盖顶层符号一致性、
py_compile、陈旧生成文件、package import walk、entry-point help、__pycache__清理。 - RAG/Wiki/Workflow 相关符号被路由到专门的 RAG 模块,减少未分类架构漂移。
2026-05-02 更新摘要
- 新增持久化 Markdown Wiki RAG,包含
index.md、log.md、schema.md - 新增编程工作流记忆,用于收录高质量代码工作流
- 新增私有 vLLM / OpenAI-compatible 重试与 cooldown 治理
- 默认关闭额外的任务完成摘要气泡
split_coder.py现在可生成可导入的拆分架构包
日本語
見出し:永続 Wiki RAG、プログラミングワークフローメモリ、より堅牢なモデル/ランタイム構造
1. 永続 Wiki RAG レイヤー
WikiStoreを追加し、知識ライブラリとコードライブラリの両方に永続 Markdown Wiki を生成します。- 各ライブラリルート配下に
wiki/が生成され、以下を含みます。sources/:ソース単位ページentities/:反復出現するエンティティ、シンボル、ドメイン語ページconcepts/:コミュニティとグラフ構造から導く概念ページsynthesis/overview.md:ライブラリ全体の概要index.md:検索の第一ホップとなるカタログlog.md:時系列のメンテナンスログschema.md:保守と検索の規約
- 検索は蓄積済みの統合知識として Wiki を優先し、正確な証拠や行レベル詳細が必要な場合に raw chunk へフォールバックします。
- Knowledge Wiki Graph RAG と Programming Code RAG をアーキテクチャ上分離し、一般知識統合とコード/エンジニアリング検索を別々に進化させられます。
2. プログラミング RAG ワークフローメモリ
WorkflowMemoryStoreを追加し、完了済み session から再利用可能な高品質プログラミングワークフローを収集します。- 完了シグナル、コード編集、検証/テスト手順、todo 進捗、構造化計画、複数ノード協調などから自動スコアリングします。
- 高品質ワークフローは Markdown カードとして code wiki workflow memory に保存され、
workflowルートで検索できます。 - Code RAG はコード証拠だけでなく、検証済みのプロセスパターンも検索でき、小型モデルのタスク引き継ぎ、ツール順序、実装継続性を強化します。
3. プライベート vLLM / OpenAI-compatible プロバイダ耐性
- モデル HTTP リトライはデフォルトで 5 回、間隔は 60 秒になりました。
- 一時的ステータスとして
408、409、425、429、500、502、503、504を扱います。 - vLLM / OpenAI-compatible / LM Studio の chat endpoint では、nginx/upstream 由来に見える一時的
404もリトライ対象にできます。 Retry-After、X-RateLimit-Reset、一般的な JSON retry フィールドがある場合はサーバ側の制御に従います。- endpoint 単位の cooldown により、同じ provider/model endpoint への過剰な再試行を抑えます。
- リトライ待機中は session status に表示され、probe mode では長時間リトライを避けます。
4. ランタイム出力制御
AGENT_RUN_COMPLETION_SUMMARYのデフォルトをfalseに変更しました。- 通常のチャット完了後に、追加の「タスク完了」assistant サマリーバブルを出さなくなりました。
- 必要な場合は
AGENT_RUN_COMPLETION_SUMMARY=trueで再有効化できます。
5. import 可能な分割アーキテクチャ出力
split_coder.pyは_source_bridge.pyを生成し、元のClouds_Coder.pyを一度だけ読み込んで、ルーティング済みシンボルを各分割モジュールへバインドします。- 生成モジュールは相互再帰 import を行う実装コピーではなく、import 可能なアーキテクチャナビゲーションスタブになります。
- self-check はトップレベルシンボル一致、
py_compile、古い生成ファイル、package import walk、entry-point help、__pycache__クリーンアップを検証します。 - RAG/Wiki/Workflow 関連シンボルは専用 RAG モジュールにルーティングされ、未分類の構造ドリフトを減らします。
2026-05-02 要約
index.md、log.md、schema.mdを備えた永続 Markdown Wiki RAG を追加- 高品質コードワークフローを収集するプログラミングワークフローメモリを追加
- プライベート vLLM / OpenAI-compatible のリトライと cooldown 制御を追加
- 追加のタスク完了サマリーバブルをデフォルト無効化
split_coder.pyが import 可能な分割アーキテクチャパッケージを生成可能に
v2026.04.06
CHANGELOG 2026-04-06
Bug fixes and minor strategy tweaks.
Clouds Coder 2026.04.05-Stable
CHANGELOG 2026-04-05
Bug fixes and minor strategy tweaks.
Clouds Coder 2026.04.02-Stable
CHANGELOG 2026-04-02
Bug fixes and minor strategy tweaks.
Fix PyPI packaging path issues