P1 · 从理论回到现场

分享一下：MyAgents 开发小组，背后怎么干活

我们就是做 MyAgents 平台的一线小组——把第二部分讲的"AI 型组织"真拿来，改了自己一遍。不讲大道理，就讲日常实际怎么干。

人人都是 PO → 规划与研究变稀缺 → 取消专职 SM → Issues + Skill pipeline → 多任务并行

句句有真实 issue / MR / 数据托底，本章配 4 张真实截图。

P2 · 先说当时的处境

四个现实约束，逼出一个共识——每个人都得是全栈

都是新东西，模型通识少

Agent、模型这套，大家都是边学边干——没有现成经验可抄，谁也不能只守自己一摊。

规划，根本排不过来

需求和变化太快，靠少数人在前面排计划、派活——排到一半就过期了。

测试，测不过来

大量非功能性测试——对话的、队列的、异步的、SSE…… 传统"功能验收"根本覆盖不了。

人就 2 个，还都在业务组

前期启动只有 2 个人，且都扎进业务一线——没有专职的"平台 / 中台"分工可言。

四条叠加，结论只有一个：每个人都得是全栈——自己定义问题、自己实现、自己测、自己交付。

P3 · 角色升维

人人都是 PO——能力跟着问题走，不跟岗位走

不是人人写需求文档，而是每个人都对"做什么、为什么做、做出来有没有效果"负责。

UI 设计师也进来做前端了

设计角色直接下场写前端——岗位边界被打掉。不是"画完图扔给开发"，而是自己把页面落地到能跑。

测试也自己做 Skill 来测

测试不再只是接收交付物去验收，而是自己造工具（Skill）来测，测试能力沉淀成可复用资产。

执行被 AI 接管后，定义问题的能力成了每个人的基本盘。

P4 · 能力升维

规划与研究，变成了稀缺能力

执行白菜价了——稀缺的不再是"写得出来"，而是深度的分析与判断：把没有标准答案的问题，研究出一个当下最优解。

很多问题，没有标准答案

Agent 安全怎么做？AUI（人机交互范式）怎么做？——全行业都在探索，没有完全正确的答案。

靠研究，逼近最优解

大量社区实践分析 + A/B 方案实验，在不确定里试出当下最优，而不是干等一个标准答案。

社区实践分析→ A/B 方案实验→ 逼近最优解

没有现成答案的领域，规划 + 研究（分析 · 实验 · 判断）才是真正的稀缺能力。

P5 · 去协调中间层

没有专职 SM——优先级铺排、人员安排，交给一个 Agent

协调成本本该被机制吃掉，而不是养一个人去做。整个流程跑成自动接力的 Loop：

问题登记→ 问题处理→ 发包

群里一句话 → bot 自动登记成需求单 #364
自动指派负责人（@jiangyy）、打优先级 / 类型标签
优先级铺排、人员安排全由 Agent 接管——没人传话、没人催进度

@MyAgent 一句话 → 自动登记 #364、指派、打标签，真实截图

P6 · 机制① · 单一事实源

一个 Issue，就是全组的共享上下文

不靠周报 / 会议 / 口头对齐——所有角色都在同一个 ISSUE 上协同，Agent 也基于这个 issue 来调度大家完成工作。

架构师审核· UI 出交互设计· 开发提测· 测试关单

四个角色，全在同一个 ISSUE 上完成协同 · 状态靠 label 物化 workflow::planning → doing → review → testing

真实案例 · #6 会话分析功能 ↗ 现场点击打开

一个 issue 跑了 4 期迭代 / 2 个 MR（!35 含 v1+v2+v4，!36 含 v5+v6）/ 7 条评论—— 任何成员（含架构师、UI、测试）都能 5 分钟读完"一个能力怎么从想法变成产品"。

git.xx.com/my-agents/-/issues/6

P7 · 机制② · 流程固化成 Skill

my-pipeline 五阶段——AI 做机械的，人只做决策的

pickup → plan → implement → review → close，整条流程固化成一个 Skill，由 Agent 跑。

人只在 5 处决策点出现

① 类型不明 ② 图拉不到 ③ plan 拍板 ④ E2E 定方向 ⑤ MR 合不合。
其它（切分支 / 跑测试 / push / 开 MR / 关 issue / 清 label）AI 全包——别问"要不要 push"。

不是 PPT 画的——my-pipeline 5 阶段 × AI做/人做真实流程图

P8 · 机制 · 开发 SPEC · 架构门禁

全栈不等于放飞——一道架构门禁守住质量

没有专职 SM、人人全栈，质量靠什么兜底？——一条写进规范、由 pipeline 自动卡的"架构门禁"。

规则 · 写在 AGENTS.md 里

涉及架构设计变更 / 大范围代码 / 命名调整，必须有架构师评估记录；评估确认要在 issue / MR 备注里留痕——否则 review 不过、pipeline 不能继续。

确认人：小涛 · 架构 / ChatKit 小蒋 · 应用 / 数据规范固化在 8 个 AGENTS.md + my-pipeline / my-review Skill

↗ 现场点开真实评审 issue · #186

「按 ChatKit 架构评审收口标注协议与公共面」——小涛的架构评估记录全留在 issue 里

git.xx.com/my-agents/-/issues/186

仓库 2 个月 1706 commits（4/26 起）· 把关 Merge：小涛 166 / 小蒋 66 · ⚠ 据本仓库 git 历史

P9 · 两种模式 · 按复杂度选

🚀 自动挡 vs 🧭 手动挡——按复杂度选

🚀 自动挡（GOAL）

简单任务：你说目标 → AI 全包 → 你验收，中间 2 次说话就完事。例 #1 历史会话排序。

🧭 手动挡（PIPELINE）

复杂 / 跨模块 / 要把控架构：走完整 5 阶段、介入 5+ 次，迭代痕迹完整留在 issue。例 #6 会话分析。

把开发者从机械流程里解放——是注意力分配的革命，不是技能的革命。

自动挡省 80% 注意力；用错挡代价两边都吃——真实对比

P10 · 产出形态

多任务并行——组织改造后实际拿到的产能

2–4 天

以前 · 一个故事 / 一个人

→

3–5 个

现在 · 一天 / 一个人同时推

怎么做到的

用 Claude Code 的 Agents 视图 + Git Worktree，为多个 issue 各开独立 worktree 同时并行
人只把控两个关键节点：关键方案设计 + 代码 review，再验收结果
执行被机制和 AI 吃掉，人的注意力集中到只有人能做的三个节点——单人吞吐直接抬一个量级

P11 · 产出形态 · 多任务并行实证

8 个 issue 同屏排队，多 worktree 真在并行

这不是渲染的概念图，是 Claude Code Agents 视图的真实一屏：

8 个 issue 各占一个独立 worktree（#184 / #210 / #318 / #221 …）
状态一屏可见：completed / working / await
串行等交接 → 并行同时推，这就是产能抬升的物理形态

Claude Code Agents 视图 · 8 个 issue 多 worktree 并行，真实截图

P12 · 下一步 · 已经在试点

把明确的活，交给 AI 程序员（Hermes + Codex）

探索 AI 程序员（对标 Devin）：把明确的需求、确定的 BUG 直接交给它——Hermes 编排 + Codex 写码，已经能自动跑到 review。

交给 AI 程序员：明确需求 · 确定 BUG · 重复改动（有标准答案的活）

留给人：规划 · 研究 · 架构判断 · 找最优解

执行白菜价，稀缺的是规划与研究——明确的活交给 AI 程序员，人只留在研究最优解上。

Hermes 编排 + Codex 写码——自动把 #355 做到 workflow::review（含分支 feature/f-355、commit、MR !405），真实截图

三个站点，覆盖从 Harness、到 Skill / 本体 / CLI、到 平台 Cookbook 的完整链路。