第 4 章 · AI 型组织实践
01 / 14
P1 · 从理论回到现场

分享一下:MyAgents 开发小组,背后怎么干活

我们就是做 MyAgents 平台的一线小组——把第二部分讲的"AI 型组织"真拿来,改了自己一遍。 不讲大道理,就讲日常实际怎么干
人人都是 PO 规划与研究变稀缺 取消专职 SM Issues + Skill pipeline 多任务并行
句句有真实 issue / MR / 数据托底,本章配 4 张真实截图。
P2 · 先说当时的处境

四个现实约束,逼出一个共识——每个人都得是全栈

都是新东西,模型通识少

Agent、模型这套,大家都是边学边干——没有现成经验可抄,谁也不能只守自己一摊。

规划,根本排不过来

需求和变化太快,靠少数人在前面排计划、派活——排到一半就过期了。

测试,测不过来

大量非功能性测试——对话的、队列的、异步的、SSE…… 传统"功能验收"根本覆盖不了。

人就 2 个,还都在业务组

前期启动只有 2 个人,且都扎进业务一线——没有专职的"平台 / 中台"分工可言。

四条叠加,结论只有一个:每个人都得是全栈——自己定义问题、自己实现、自己测、自己交付。
P3 · 角色升维

人人都是 PO——能力跟着问题走,不跟岗位走

不是人人写需求文档,而是每个人都对"做什么、为什么做、做出来有没有效果"负责。

UI 设计师也进来做前端了

设计角色直接下场写前端——岗位边界被打掉。不是"画完图扔给开发",而是自己把页面落地到能跑。

测试也自己做 Skill 来测

测试不再只是接收交付物去验收,而是自己造工具(Skill)来测,测试能力沉淀成可复用资产。

执行被 AI 接管后,定义问题的能力成了每个人的基本盘。
P4 · 能力升维

规划与研究,变成了稀缺能力

执行白菜价了——稀缺的不再是"写得出来",而是深度的分析与判断:把没有标准答案的问题,研究出一个当下最优解。

很多问题,没有标准答案

Agent 安全怎么做?AUI(人机交互范式)怎么做?——全行业都在探索,没有完全正确的答案

靠研究,逼近最优解

大量社区实践分析 + A/B 方案实验,在不确定里试出当下最优,而不是干等一个标准答案。

社区实践分析 A/B 方案实验 逼近最优解
没有现成答案的领域,规划 + 研究(分析 · 实验 · 判断)才是真正的稀缺能力。
P5 · 去协调中间层

没有专职 SM——优先级铺排、人员安排,交给一个 Agent

协调成本本该被机制吃掉,而不是养一个人去做。整个流程跑成自动接力的 Loop:
问题登记 问题处理 发包
  • 群里一句话 → bot 自动登记成需求单 #364
  • 自动指派负责人(@jiangyy)、打优先级 / 类型标签
  • 优先级铺排、人员安排全由 Agent 接管——没人传话、没人催进度
企微机器人登记需求 #364 · 自动指派打标签
@MyAgent 一句话 → 自动登记 #364、指派、打标签,真实截图
P6 · 机制① · 单一事实源

一个 Issue,就是全组的共享上下文

不靠周报 / 会议 / 口头对齐——所有角色都在同一个 ISSUE 上协同,Agent 也基于这个 issue 来调度大家完成工作。
架构师审核· UI 出交互设计· 开发提测· 测试关单
四个角色,全在同一个 ISSUE 上完成协同 · 状态靠 label 物化 workflow::planning → doing → review → testing

真实案例 · #6 会话分析功能 ↗ 现场点击打开

一个 issue 跑了 4 期迭代 / 2 个 MR(!35 含 v1+v2+v4,!36 含 v5+v6)/ 7 条评论—— 任何成员(含架构师、UI、测试)都能 5 分钟读完"一个能力怎么从想法变成产品"。

git.xx.com/my-agents/-/issues/6
P7 · 机制② · 流程固化成 Skill

my-pipeline 五阶段——AI 做机械的,人只做决策的

pickup → plan → implement → review → close,整条流程固化成一个 Skill,由 Agent 跑。

人只在 5 处决策点出现

① 类型不明 ② 图拉不到 ③ plan 拍板 ④ E2E 定方向 ⑤ MR 合不合。
其它(切分支 / 跑测试 / push / 开 MR / 关 issue / 清 label)AI 全包——别问"要不要 push"。

my-pipeline 5 阶段真实流程图
不是 PPT 画的——my-pipeline 5 阶段 × AI做/人做 真实流程图
P8 · 机制 · 开发 SPEC · 架构门禁

全栈不等于放飞——一道架构门禁守住质量

没有专职 SM、人人全栈,质量靠什么兜底?——一条写进规范、由 pipeline 自动卡的"架构门禁"。

规则 · 写在 AGENTS.md 里

涉及架构设计变更 / 大范围代码 / 命名调整,必须有架构师评估记录;评估确认要在 issue / MR 备注里留痕——否则 review 不过、pipeline 不能继续

确认人: 小涛 · 架构 / ChatKit 小蒋 · 应用 / 数据规范 固化在 8 个 AGENTS.md + my-pipeline / my-review Skill
↗ 现场点开真实评审 issue · #186
「按 ChatKit 架构评审收口标注协议与公共面」——小涛 的架构评估记录全留在 issue 里
git.xx.com/my-agents/-/issues/186
仓库 2 个月 1706 commits(4/26 起)· 把关 Merge:小涛 166 / 小蒋 66 · ⚠ 据本仓库 git 历史
P9 · 两种模式 · 按复杂度选

🚀 自动挡 vs 🧭 手动挡——按复杂度选

🚀 自动挡(GOAL)

简单任务:你说目标 → AI 全包 → 你验收,中间 2 次说话就完事。例 #1 历史会话排序。

🧭 手动挡(PIPELINE)

复杂 / 跨模块 / 要把控架构:走完整 5 阶段、介入 5+ 次,迭代痕迹完整留在 issue。例 #6 会话分析。

把开发者从机械流程里解放——是注意力分配的革命,不是技能的革命。
GOAL vs PIPELINE 真实对比
自动挡省 80% 注意力;用错挡代价两边都吃——真实对比
P10 · 产出形态

多任务并行——组织改造后实际拿到的产能

2–4
以前 · 一个故事 / 一个人
3–5
现在 · 一天 / 一个人同时推

怎么做到的

  • 用 Claude Code 的 Agents 视图 + Git Worktree,为多个 issue 各开独立 worktree 同时并行
  • 人只把控两个关键节点:关键方案设计 + 代码 review,再验收结果
  • 执行被机制和 AI 吃掉,人的注意力集中到只有人能做的三个节点——单人吞吐直接抬一个量级
P11 · 产出形态 · 多任务并行实证

8 个 issue 同屏排队,多 worktree 真在并行

这不是渲染的概念图,是 Claude Code Agents 视图的真实一屏:
  • 8 个 issue 各占一个独立 worktree(#184 / #210 / #318 / #221 …)
  • 状态一屏可见:completed / working / await
  • 串行等交接 → 并行同时推,这就是产能抬升的物理形态
Claude Code Agents 视图 多 worktree 并行
Claude Code Agents 视图 · 8 个 issue 多 worktree 并行,真实截图
P12 · 下一步 · 已经在试点

把明确的活,交给 AI 程序员(Hermes + Codex)

探索 AI 程序员(对标 Devin):把明确的需求、确定的 BUG 直接交给它——Hermes 编排 + Codex 写码,已经能自动跑到 review。
交给 AI 程序员:明确需求 · 确定 BUG · 重复改动(有标准答案的活)
留给人:规划 · 研究 · 架构判断 · 找最优解
执行白菜价,稀缺的是规划与研究——明确的活交给 AI 程序员,人只留在研究最优解上。
Hermes 编排 + Codex 写码 自动完成 #355 推到 review
Hermes 编排 + Codex 写码——自动把 #355 做到 workflow::review(含分支 feature/f-355、commit、MR !405),真实截图