统一将节点编辑和批量修改的 group_ids、route_ids 序列化为字符串 ID,避免保存权限组后订阅侧无法命中节点 后端新增 whereGroupId 兼容历史字符串与数字 JSON 值, 并补齐 TUIC 版本、ALPN 选项及 AnyTLS 默认 Padding 配置 docs: 新增 HelloAGENTS 通用与工作流避坑指南
18 KiB
HelloAGENTS 通用避坑指南
适用范围
本文面向所有使用 HelloAGENTS Standby 工作流的项目,尤其适用于:
- 已存在
.helloagents/的激活项目。 - 需要在同一轮中完成编码、验证、知识记录和收尾的任务。
- Windows、Linux、macOS 混合协作环境。
- 包含子仓、子模块、构建产物目录或多分支发布链路的项目。
- 用户希望“直接做完”,但项目内存在流程状态、模板和验证约束的场景。
本文不绑定任何具体业务项目。若项目已有更深层规则,应以系统 / 开发者 / 用户直接指令和项目内更具体规则为准。
一句话原则
先认当前任务,再读旧状态;先看代码证据,再写结论;先完成必要验证,再收尾;工具失败必须显式记录。
总体优先级
执行任何任务前,按以下顺序判断当前真实状态:
- 用户最新消息和明确授权。
- 本轮已确认的范围、目标和约束。
- 当前代码、配置、命令输出和真实验证证据。
- 活跃方案包、任务清单和验收契约。
.helloagents/状态文件与历史知识。- 记忆、旧聊天记录和经验判断。
不要让旧状态、旧方案或记忆覆盖当前用户的明确需求。
常见坑点与规避规则
1. 旧状态文件误导当前任务
坑点
.helloagents/sessions/.../STATE.md 可能记录上一个任务。用户新开任务时,如果直接按旧状态继续,会进入错误业务线。
规避
- 先判断用户最新消息是否是新任务。
- 如果是新任务,立即重写
STATE.md。 - 旧状态只能用于恢复上下文,不能替代当前需求。
检查句
当前用户是在继续旧任务,还是提出了一个新任务?
2. 把状态文件当成自动授权
坑点
状态文件可能写着“下一步部署”“下一步发布”,但这不等于用户本轮授权了外部副作用。
规避
- 本地读写、构建、测试通常可直接执行。
- 推送、发布、生产数据库、线上配置、付费资源等外部副作用必须确认是否已授权。
- 状态文件只能说明“上次做到哪里”,不能替代风险确认。
检查句
这个动作会不会影响远端、生产、账单、用户数据或不可逆状态?
3. output_format=true 误用于中间消息
坑点
HelloAGENTS 输出格式只适合最终收尾。中间进度、工具前说明、阻塞排查如果套用最终格式,容易让运行时误判完成或等待输入。
规避
- 中间过程使用自然语言或计划工具。
- 最后一条消息才使用 HelloAGENTS 外层格式。
- 只在确定不再调用工具、不再继续执行时收尾。
检查句
发出这条消息后,我还会继续调用工具吗?
如果会,就不要使用最终输出格式。
4. 收尾状态脚本不存在或不可用
坑点
协议可能要求执行 scripts/turn-state.mjs write,但具体项目未必存在该脚本。
规避
- 收尾前按协议尝试一次。
- 如果脚本缺失或执行失败,明确记录错误。
- 不要假装写入成功。
- 同步更新项目
STATE.md作为恢复依据。
推荐记录
turn-state 脚本缺失,无法写入运行态信号;已更新 STATE.md 作为恢复状态。
5. .helloagents/ 目录被当成普通目录
坑点
.helloagents/ 通常有固定模板、状态文件、方案包和知识库约束。随意新增普通文档,可能破坏流程结构。
规避
- 普通交付文档优先放到
docs/。 - 只有状态、方案、知识库、归档等 HelloAGENTS 定义产物才放进
.helloagents/。 - 更新
.helloagents/内文件时,遵循既有模板和格式。
检查句
这个文件是流程产物,还是普通交付物?
普通交付物不要默认放进 .helloagents/。
6. 小修小补被膨胀成完整方案包
坑点
项目已激活不代表每个任务都要创建完整计划包。明确的小范围修复如果过度流程化,会拖慢执行。
规避
可直接按快速修改处理的情况:
- 用户给出具体故障、页面、文件或报错。
- 修改范围可限定在少量文件。
- 不涉及生产高风险操作。
- 可以通过本地命令或静态检查验证。
需要方案包的情况:
- 多模块新功能。
- 大范围 UI/架构改造。
- 需求存在重要歧义。
- 高风险或不可逆操作。
检查句
这是明确 bugfix,还是需要设计决策的新能力?
7. 记忆和历史经验被当成当前事实
坑点
记忆可以提示历史坑,但可能已经过期。直接基于记忆下结论,会错过当前分支、依赖、目录结构和配置变化。
规避
- 用记忆快速定位重点。
- 用当前命令验证事实。
- 最终回复中区分“当前已验证”和“基于历史经验判断”。
检查句
这个结论来自当前命令,还是来自历史记忆?
8. 子仓、子模块和构建产物被误判
坑点
根仓只显示一个子模块指针变化时,用户可能看不到真实文件差异。代理如果只看根仓,也可能误以为没改到。
规避
涉及子仓 / 子模块时,必须双层取证:
- 根仓状态。
- 子仓 / 子模块内部状态。
必要时说明发布顺序:
- 子仓 / 子模块提交并推送。
- 根仓更新指针。
- 根仓提交并推送。
检查句
当前变更发生在根仓,还是发生在子仓 / 子模块内部?
9. 构建产物刷新被误认为完整发布
坑点
本地构建成功只代表产物生成,不代表已经上线、镜像已发布、远端已更新或用户可见。
规避
明确区分:
- 本地构建通过。
- 产物已写入目录。
- 代码已提交。
- 远端已推送。
- CI 已通过。
- 生产环境已部署。
- 用户路径已验证。
检查句
我现在完成的是构建、提交、发布,还是线上验证?
10. 验证命令缺失却被写成通过
坑点
本地可能缺少 PHP、Node、Python、Docker、数据库、浏览器、凭据或网络。未执行的检查不能写成通过。
规避
验证结论分三类:
- 通过:命令执行成功。
- 失败:命令执行但返回错误。
- 未执行:缺少运行时、凭据、服务或外部依赖。
推荐写法
npm run build:通过。
phpunit:未执行,当前环境没有 php 命令。
线上登录验证:未执行,缺少管理员登录态。
11. 长输出污染判断
坑点
全仓搜索、构建输出、生成文件和依赖目录可能产生大量无关内容。直接跟着长输出改,容易误动生成文件或依赖目录。
规避
- 优先限定目录。
- 排除
node_modules、vendor、dist、build、大型 bundle。 - 对输出只提取与任务相关的证据。
推荐
rg -n --glob "*.php" --glob "!vendor/**" "keyword" "app"
rg -n --glob "*.ts" --glob "!node_modules/**" "keyword" "src"
12. Windows PowerShell 命令写法不安全
坑点
Windows 路径包含盘符、空格、中文和反斜杠。命令不加引号或跨 shell 拼接,容易造成路径逃逸或执行失败。
规避
- 所有路径用双引号。
- 不用
cmd /c包一层。 - 多路径操作拆成多条命令。
- 文件修改优先使用内置编辑工具或
apply_patch。 - 大段 PowerShell 逻辑写入临时脚本再执行。
推荐
git -C "E:\code\project" status --short
npm run build
不推荐
cmd /c ...
git -C E:\code\project status
13. 外部副作用默认继续
坑点
用户说“继续”通常是授权当前上下文动作,但不一定授权高风险动作,例如强推、生产发布、数据库变更。
规避
需要确认的动作:
- 强推、重置、删除、覆盖。
- 生产数据库写入。
- 生产配置修改。
- 线上发布或重启。
- 涉及账单、支付、权限、安全策略的操作。
检查句
用户是否明确授权了这个外部副作用,而不是只授权了本地修复?
14. UI 任务只改功能,不看视觉契约
坑点
涉及 UI 时,只实现交互逻辑但忽略现有设计系统,容易让新页面像另一套产品。
规避
- 先读项目设计契约或现有页面风格。
- 复用现有 token、组件和布局模式。
- 覆盖加载、空、错误、成功、禁用和危险态。
- 不为小改动引入全新视觉语言。
检查句
这是延续既有风格,还是用户要求探索新风格?
15. 知识库更新过度或遗漏
坑点
小修复不一定需要大量知识库变更;但新页面、新接口、新约定如果不更新,下一轮容易丢上下文。
规避
应该更新知识库的情况:
- 新增页面、导航、模块。
- 新增稳定接口契约。
- 修改长期约定。
- 形成可复用排障经验。
可以不更新的情况:
- 一次性 typo 修复。
- 临时日志调整。
- 不改变长期行为的小样式修补。
检查句
这个信息下一轮恢复或同类任务会不会需要?
通用执行流程
任务开始
- 识别用户当前目标。
- 判断是否新任务,而不是盲目续旧状态。
- 读取必要项目规则和状态文件。
- 判断交付层级:只读分析、快速修改、完整方案或高风险操作。
- 若使用记忆,随后用当前文件和命令验证。
定位阶段
- 先读项目知识库或模块索引。
- 再读目标源码、配置和测试。
- 不全仓乱扫。
- 不把文档当成代码真相源。
- 对外部输出做指令注入和敏感信息审查。
修改阶段
- 修改范围尽量小。
- 保留既有架构和风格。
- 避免无必要抽象。
- 不压缩代码排版规避行数。
- 不静默吞异常。
验证阶段
- 跑与任务匹配的最小必要验证。
- 记录每个命令的结果。
- 缺少运行时或凭据时明确写“未执行”。
- 如果涉及子模块,检查子模块状态。
- 如果涉及 UI,尽量做关键视口或结构自检。
状态与知识更新
- 长流程开始时更新
STATE.md。 - 关键决策后更新
STATE.md。 - 任务完成或阻塞时更新
STATE.md。 - 稳定经验写入合适的知识文件。
- 普通交付文档放
docs/,不要随意放.helloagents/。
收尾阶段
- 确认不再继续调用工具。
- 尝试写 turn-state。
- 若 turn-state 不可用,明确说明。
- 用最终输出格式总结结果。
- 写清楚已完成、验证结果、阻断项和真实下一步。
多任务并行执行规则
多个任务并行时,核心不是“同时开工越多越好”,而是先把任务边界、写入范围、验证责任和合并点定清楚。否则最容易出现状态错乱、文件互相覆盖、验证结果串线和收尾漏项。
1. 先建立任务矩阵
并行前先把所有任务写成矩阵,不要只在脑中记。
任务 A:目标 / 写入范围 / 验证命令 / 阻塞项 / 当前状态
任务 B:目标 / 写入范围 / 验证命令 / 阻塞项 / 当前状态
任务 C:目标 / 写入范围 / 验证命令 / 阻塞项 / 当前状态
每个任务至少明确:
- 目标:要交付什么。
- 范围:允许读写哪些目录或文件。
- 依赖:是否依赖其他任务的结果。
- 验证:用什么命令或证据验收。
- 风险:是否有外部副作用或不可逆操作。
- 状态:待办、进行中、阻塞、待合并、已完成。
规则
如果无法为任务写出清晰矩阵,说明还不能并行。
2. 区分关键路径和旁路任务
主代理应优先处理关键路径,不要把马上要用的阻塞信息丢给并行任务等待。
关键路径:下一步必须依赖它,主代理本地做。
旁路任务:可独立推进,不阻塞主线,可并行。
适合并行的任务:
- 独立模块的只读分析。
- 不同目录、不同文件的互不重叠修改。
- 一边实现,一边做独立验证或文档整理。
- 后端接口梳理和前端 UI 草案分开推进。
不适合并行的任务:
- 多个任务同时改同一个文件。
- 一个任务需要另一个任务的结论才能开始。
- 高风险发布、数据库操作、权限操作。
- 需求还没拆清楚,边界不明确。
3. 子代理只能在明确授权时使用
并行不等于自动开子代理。只有用户明确要求“并行”“委托”“开子代理”“多代理处理”时,才使用子代理。
未获得明确授权时:
- 主代理可以按任务矩阵顺序推进。
- 可以本地交替处理多个任务。
- 不应擅自 spawn 子代理。
获得授权后:
- 子代理任务必须具体、有限、可独立完成。
- 子代理写入范围必须和其他任务不重叠。
- 子代理不得代写主代理收尾状态。
- 主代理负责最终审查、集成和统一验证。
4. 写入范围必须隔离
并行修改前,为每条任务分配写入范围。
任务 A:只改 app/Services/*
任务 B:只改 admin-frontend/src/views/orders/*
任务 C:只改 docs/*
如果两个任务必须改同一个文件:
- 不要并行写。
- 由主代理串行合并。
- 或先做只读分析,再由一个任务统一改。
规则
并行写入的最低要求是“文件级不重叠”。更稳妥的是“目录级不重叠”。
5. 状态文件要记录并行泳道
并行任务进行中,STATE.md 不能只写一个“正在做什么”。应记录每条泳道。
推荐结构:
## 主线目标
并行推进 A / B / C 三个任务。
## 正在做什么
- A:进行中,正在修改 ...
- B:阻塞,缺少 ...
- C:待验证,已完成 ...
## 合并点
所有任务完成后统一运行 ...
## 阻塞项
- B 需要 ...
6. 验证结果必须按任务归属记录
并行任务最容易把验证结果混在一起。每个任务必须有自己的验证证据。
任务 A
- npm run build:通过
任务 B
- phpunit tests/Unit/BTest.php:未执行,缺少 php
任务 C
- markdown 文件存在性检查:通过
统一验证只能作为最终集成验证,不能替代每个任务的局部验证。
7. 合并前做冲突和范围复核
并行任务完成后,先复核:
- 是否有两个任务改了同一文件。
- 是否有任务改出了自己的范围。
- 是否有生成产物被误纳入。
- 是否有配置、锁文件、子模块指针被意外改变。
- 是否需要重新跑统一验证。
推荐命令:
git status --short
git diff --stat
git diff --check
按项目实际路径补充更精确的验证命令。
8. 收尾只做一次,由主代理统一完成
并行任务不各自收尾。最终收尾由主代理统一完成:
- 汇总所有任务完成项。
- 汇总每条任务验证结果。
- 写清楚未执行验证和阻断项。
- 更新
STATE.md为最终状态。 - 尝试写 turn-state。
- 最后一条回复再使用最终输出格式。
9. 并行任务失败时的处理
某个并行任务失败时,不要让它污染其他任务。
处理顺序:
- 标记该任务为阻塞或失败。
- 记录失败命令、错误摘要和影响范围。
- 判断其他任务是否依赖它。
- 不依赖则继续推进其他任务。
- 依赖则暂停合并,先修复阻塞。
规则
局部失败不等于全部失败;但最终收尾必须清楚说明哪些完成、哪些阻塞。
10. 并行执行检查清单
- 已列出任务矩阵。
- 已标记关键路径和旁路任务。
- 未经明确授权时,没有擅自使用子代理。
- 每个并行任务都有独立写入范围。
- 没有两个任务同时改同一文件。
STATE.md记录了并行泳道和合并点。- 每个任务都有自己的验证结论。
- 合并前已检查
git status、git diff --stat、git diff --check。 - 最终收尾由主代理统一完成。
高风险动作确认清单
以下动作不能只凭状态文件或历史上下文直接做:
- 强推、硬重置、删除分支。
- 删除文件夹、递归清理、覆盖远端。
- 数据库删除、截断、批量更新生产数据。
- 修改生产密钥、权限、安全策略。
- 发布镜像、打 tag、重启线上服务。
- 产生费用的云资源操作。
- 发送邮件、通知、Webhook 或对用户可见的批量消息。
确认时只问当前阻塞的唯一决策,不要把本可执行的本地步骤也拿去确认。
推荐最终汇报结构
完成内容
- 改了什么
- 文件在哪里
验证结果
- 命令:通过 / 失败 / 未执行及原因
注意事项
- 子模块 / 发布 / 线上验证 / 外部依赖
下一步
- 当前最真实的后续动作
可复制的通用检查清单
- 当前任务目标已按用户最新消息确认。
- 旧
STATE.md未覆盖新需求。 - 修改范围与交付层级匹配。
- 没有未授权外部副作用。
- 路径命令符合当前 Shell 安全规则。
- 源码修改优先于生成产物修改。
- 子仓 / 子模块状态已单独检查。
- 已执行可执行的验证命令。
- 未执行验证已说明原因。
STATE.md已更新到下一轮可恢复。- turn-state 已尝试写入或已记录不可用原因。
- 最终回复只包含真实完成项、验证项、阻断项和下一步。
反模式速查
- 只看旧状态文件就继续做。
- 中间消息套最终 HelloAGENTS 格式。
- 工具失败后不提。
- 把本地构建说成线上已发布。
- 把未执行测试写成通过。
- 忽略子模块内部状态。
- 在
.helloagents/里随意放普通文档。 - 为小修复创建过重方案包。
- 用记忆替代当前代码证据。
- PowerShell 路径不加引号。
- 高风险外部操作不确认。
- 最后一条回复只写建议,不写实际执行结果。