Agent、模型这套,大家都是边学边干——没有现成经验可抄,谁也不能只守自己一摊。
需求和变化太快,靠少数人在前面排计划、派活——排到一半就过期了。
大量非功能性测试——对话的、队列的、异步的、SSE…… 传统"功能验收"根本覆盖不了。
前期启动只有 2 个人,且都扎进业务一线——没有专职的"平台 / 中台"分工可言。
设计角色直接下场写前端——岗位边界被打掉。不是"画完图扔给开发",而是自己把页面落地到能跑。
测试不再只是接收交付物去验收,而是自己造工具(Skill)来测,测试能力沉淀成可复用资产。
Agent 安全怎么做?AUI(人机交互范式)怎么做?——全行业都在探索,没有完全正确的答案。
大量社区实践分析 + A/B 方案实验,在不确定里试出当下最优,而不是干等一个标准答案。
一个 issue 跑了 4 期迭代 / 2 个 MR(!35 含 v1+v2+v4,!36 含 v5+v6)/ 7 条评论—— 任何成员(含架构师、UI、测试)都能 5 分钟读完"一个能力怎么从想法变成产品"。
① 类型不明 ② 图拉不到 ③ plan 拍板 ④ E2E 定方向 ⑤ MR 合不合。
其它(切分支 / 跑测试 / push / 开 MR / 关 issue / 清 label)AI 全包——别问"要不要 push"。
涉及架构设计变更 / 大范围代码 / 命名调整,必须有架构师评估记录;评估确认要在 issue / MR 备注里留痕——否则 review 不过、pipeline 不能继续。
简单任务:你说目标 → AI 全包 → 你验收,中间 2 次说话就完事。例 #1 历史会话排序。
复杂 / 跨模块 / 要把控架构:走完整 5 阶段、介入 5+ 次,迭代痕迹完整留在 issue。例 #6 会话分析。
Agent = Model + Harness:运行时骨架怎么搭,为什么这一层决定 Agent 的上限。
差异化沉淀在哪:Skill 编排、Ontology 语义底座、CLI 执行层的完整设计实践。
Skill、本体、Agent 的构建指南——怎么写 Skill、定义本体、搭出能落地的 Agent。