第 3 章 · MyAgents 平台
01 / 11
前导 · Harness ① · 一个公式说清楚

Agent = Model + Harness

Model
单次预测机器
会预测下一个 token 的「大脑」
+
Harness
把原始力量转化为
「有用功」的装置
=
Agent
不只是会说话
而是能干活
模型本身没变 —— 真正让它从「会回答」变成「能交付」的,是外面那层 Harness。
「你要么是模型,要么是Harness,没有中间地带。」
前导 · Harness ② · 工程认知的三阶段

Prompt → Context → Harness 工程

我们对 AI 的工程理解走过三个台阶 —— Harness 工程是当前的分界线
STAGE 01
Prompt 工程
关心「我这一次怎么问」。prompt 是一次请求,不是契约 —— 换个说法结果就飘。
STAGE 02
Context 工程
管理模型「能看到什么」:RAG、记忆、上下文压缩。必要,但还不够 —— 它只管输入。
STAGE 03 · 当前
Harness 工程
所有 agent 框架、工具调用拆开看,都是 Harness 的一部分。它管的是「模型怎么持续地干活」。
Prompt 管一句话,Context 管输入,Harness 管整个运行时 —— 一层比一层往「系统」走。
前导 · Harness ③ · 详细类比

造一辆车一样造 Agent

汽车的关键系统各司其职、又强耦合 —— Harness Agent 的复杂度,与之同级。
🚗 汽车关键系统
🤖 Harness Agent
⚙️ 发动机
提供动力,但单靠它车跑不起来。
模型本身
提供智能 / 推理力,单靠它也只是「会说话」。
🔄 变速箱
把动力转成可控节奏;档位没配好,动力再大也顿挫。
笨循环与调度
把模型的原始输出转成可控的执行节奏。
🛞 底盘车架
承载一切的结构基座,决定整车稳不稳。
文件系统与上下文工程
承载任务状态与材料的结构基座。
📡 电控 / 传感
感知环境、反馈状态,让行驶可被纠正。
工具调用与评测反馈
感知结果、反馈状态,让每次行动可被纠正。
造出赛道上破纪录的赛车,和造出智能的 Agent 一样 —— 都有大量的不确定性,靠的是一整套系统工程方法,而不是碰运气。
P1 · 范式迁移

AI 的架构范式,正在从"调模型 / 调 prompt"
迁移到 "编排 Skill"

Model
单次预测机器
+
Harness
运行时骨架
=
Agent
差异化在 Skill + Ontology
本章主角
MyAgents 平台 = Harness Agent 运行底座
把这套 Harness(运行时骨架 + Skill + Ontology + CLI)工程化、产品化——让 Agent 真正跑起来、落到客户系统里。
这一章就讲这套底座长什么样——呼应第一部分"胜负手在 Skill / 评测集"、第二部分"intent 驱动、Skill 沉淀"。
P2 · AI 人机交互的变化

待会儿看的不是聊天机器人,是新的人机交互

旧交互 · 人找功能

  • 查"近一年华东区毛利":要点开报表中心
  • 选维度 → 选时间 → 选区域 → 加筛选
  • 在菜单和层级里翻 5 层,导出再算一遍

新交互 · 人表达意图

  • 一句话:"近一年华东区毛利怎么样"
  • Agent 组装本体 + 指标 + 数据源
  • 直接拿到结果,连带口径与下钻链路
范式句:human navigates hierarchy, intent assembles data
AUI 近期迭代 ① · 交互范式

对话不止是问答——它升级成了可追踪的协作任务

执行过程默认折叠

自动折叠执行过程、默认展示结果——注意力从"Agent 做了什么"转向"任务交付了什么"。长任务不再刷屏,报告 / 结论 / 文件卡片更突出;过程可一键展开,满足复盘、审计、排错与信任验证。
执行过程默认折叠
默认只看结果,过程可一键展开 · 适合多工具、多步骤的企业 Agent 场景

对话升级为"协作任务"

用户不只看到回答,还看见进度、产物、资源与上下文来源,降低黑箱感。Folder 承载材料与结果,Process 记录任务推进,Context 保持业务连续——让复杂工作可追踪、可接续、可复用
对话升级为协作任务
右侧实时呈现 任务进度 3/3 · 产出文档 · 相关资源
AUI 近期迭代 ② · 产出形态

产出不止文字——Excel、可视化报告,一句话生成

在线预览 Excel / Word

支持 Excel 在线预览,可以用自然语言生成 Excel 文档、对话调整指标与分组,例如直接生成"成本测算表"——表格在右侧即问即看,不用导出再算。
在线预览 Excel
对话生成成本测算表,右侧 Excel 在线预览

内置"可视化报告"Skill

内置报告模板 + 可视化 Skill,根据上下文对话和生成的 MD 报告,自动做成可视化网页(Echart)——让数据与报告更容易阅读与理解
可视化报告
MD 报告一键转可视化网页:摘要卡 + Echart 环形/柱状图
P3 · 为什么是 Skill

模型和 Harness 都商品化了——
能复用、能调度、能沉淀领域知识的单元,就是 Skill

Skill · 技能
把特定任务的专业知识、工作流、可执行逻辑结构化封装;按需加载(渐进式披露 Progressive Disclosure)。
Ontology · 本体
语义底座,定义业务对象 / 属性 / 关系 / 动作,让 Agent 在受控边界内理解业务、判断状态、触发动作、留可审计链路。
CLI / 工具 · 执行层
真正把动作落到系统里——把意图变成对系统的一次次确定调用。
三层抽象
Skill 调度,Ontology 理解,CLI 执行——三层各司其职。
P3+ · Ontology 不是概念 · 真实产物

本体论,是 Agent 看懂业务的那张语义地图

  • 没有本体:Agent 只能瞎猜"毛利"是哪张表哪个字段
  • 有了本体:业务对象 / 属性 / 关系 / 动作被显式定义
  • 它划出 Agent 的"受控边界"——只能在定义内行动
  • 每次问答都留下可审计链路,错了能回溯
本体定义得越厚,Agent 答得越准、越敢落地动作。
本体论定义
AI 成本问数 · 本体论定义(真实产物):业务对象与关系被显式声明,成为 Agent 的语义底座。
P4 · intent assembles data · 真实例子

用户问一句业务问题,Agent 用本体 + DSL + CLI 组装出数据

用户只说一句 "华东区 Q2 的项目成本超预算了吗?" 1 意图理解 把自然语言映射成"要算什么" intent · 成本是否超预算 2 本体解析 · 口径来自本体,不靠瞎猜 对象 = Project 指标 = CostVsBudget 3 生成受控 DSL → CLI 执行 query CostVsBudget where 华东·2024Q2 $ cost-cli run --metric CostVsBudget --scope 华东.Q2 结果 + 下钻链路 每一步都来自本体,全程可审计、可回溯 Agent 据此组装数据,而不是编造
意图 → 本体解析 → DSL → CLI,四步把"一句话"变成"可审计的数据"。
指标图谱
AI 成本问数 · 指标图谱:指标与口径在图谱里被显式连接,Agent 据此组装而非编造。
现场演示 · AI 成本数据库

不绕弯子——直接现场跑三个真实场景

三个场景都建在刚讲的 Skill + 本体 + CLI 三层之上,已进入客户生产试水——每张卡片下方是各自的预览链接,点开现场跑给你看。
① 成本问数
成本问数
不只是查数据,而是复现高级成本专家的洞察——自然语言深度归因,从异常指标反向定位到设计问题,给出可落地整改建议。
对话预览 ↗
xxx.com/chat/main
② 控制价审核
控制价审核
模拟人工完成复杂场景审核全流程并输出报告——AI 1–2 小时完成人工 2–3 天的工作量,交付可直接使用的业务结果。
对话预览 ↗
xxx.com/chat/qdgl-cpa
③ 成本测算
成本测算
只需输入项目规划与建造标准,AI 自动抓取沉淀数据、即改即算、直接出具可复用测算报告——基于问数能力快速构建。
对话预览 ↗
xxx.com/chat/cost-query