前导 · Harness ① · 一个公式说清楚

Agent = Model + Harness

Model

单次预测机器
会预测下一个 token 的「大脑」

+

Harness

把原始力量转化为
「有用功」的装置

=

Agent

不只是会说话
而是能干活

模型本身没变 —— 真正让它从「会回答」变成「能交付」的，是外面那层 Harness。

「你要么是模型，要么是Harness，没有中间地带。」

前导 · Harness ② · 工程认知的三阶段

Prompt → Context → Harness 工程

我们对 AI 的工程理解走过三个台阶 —— Harness 工程是当前的分界线。

STAGE 01

Prompt 工程

关心「我这一次怎么问」。prompt 是一次请求，不是契约 —— 换个说法结果就飘。

STAGE 02

Context 工程

管理模型「能看到什么」：RAG、记忆、上下文压缩。必要，但还不够 —— 它只管输入。

STAGE 03 · 当前

Harness 工程

所有 agent 框架、工具调用拆开看，都是 Harness 的一部分。它管的是「模型怎么持续地干活」。

Prompt 管一句话，Context 管输入，Harness 管整个运行时 —— 一层比一层往「系统」走。

前导 · Harness ③ · 详细类比

像造一辆车一样造 Agent

汽车的关键系统各司其职、又强耦合 —— Harness Agent 的复杂度，与之同级。

🚗 汽车关键系统

🤖 Harness Agent

⚙️ 发动机

提供动力，但单靠它车跑不起来。

→

模型本身

提供智能 / 推理力，单靠它也只是「会说话」。

🔄 变速箱

把动力转成可控节奏；档位没配好，动力再大也顿挫。

→

笨循环与调度

把模型的原始输出转成可控的执行节奏。

🛞 底盘车架

承载一切的结构基座，决定整车稳不稳。

→

文件系统与上下文工程

承载任务状态与材料的结构基座。

📡 电控 / 传感

感知环境、反馈状态，让行驶可被纠正。

→

工具调用与评测反馈

感知结果、反馈状态，让每次行动可被纠正。

造出赛道上破纪录的赛车，和造出智能的 Agent 一样 —— 都有大量的不确定性，靠的是一整套系统工程方法，而不是碰运气。

P1 · 范式迁移

AI 的架构范式，正在从"调模型 / 调 prompt"
迁移到 "编排 Skill"

Model

单次预测机器

+

Harness

运行时骨架

=

Agent

差异化在 Skill + Ontology

↓

本章主角

MyAgents 平台 = Harness Agent 运行底座

把这套 Harness（运行时骨架 + Skill + Ontology + CLI）工程化、产品化——让 Agent 真正跑起来、落到客户系统里。

这一章就讲这套底座长什么样——呼应第一部分"胜负手在 Skill / 评测集"、第二部分"intent 驱动、Skill 沉淀"。

P2 · AI 人机交互的变化

待会儿看的不是聊天机器人，是新的人机交互

旧交互 · 人找功能

查"近一年华东区毛利"：要点开报表中心
选维度 → 选时间 → 选区域 → 加筛选
在菜单和层级里翻 5 层，导出再算一遍

新交互 · 人表达意图

一句话："近一年华东区毛利怎么样"
Agent 组装本体 + 指标 + 数据源
直接拿到结果，连带口径与下钻链路

范式句：human navigates hierarchy, intent assembles data。

AUI 近期迭代 ① · 交互范式

对话不止是问答——它升级成了可追踪的协作任务

执行过程默认折叠

自动折叠执行过程、默认展示结果——注意力从"Agent 做了什么"转向"任务交付了什么"。长任务不再刷屏，报告 / 结论 / 文件卡片更突出；过程可一键展开，满足复盘、审计、排错与信任验证。

默认只看结果，过程可一键展开 · 适合多工具、多步骤的企业 Agent 场景

对话升级为"协作任务"

用户不只看到回答，还看见进度、产物、资源与上下文来源，降低黑箱感。Folder 承载材料与结果，Process 记录任务推进，Context 保持业务连续——让复杂工作可追踪、可接续、可复用。

右侧实时呈现任务进度 3/3 · 产出文档 · 相关资源

AUI 近期迭代 ② · 产出形态

产出不止文字——Excel、可视化报告，一句话生成

在线预览 Excel / Word

支持 Excel 在线预览，可以用自然语言生成 Excel 文档、对话调整指标与分组，例如直接生成"成本测算表"——表格在右侧即问即看，不用导出再算。

对话生成成本测算表，右侧 Excel 在线预览

内置"可视化报告"Skill

内置报告模板 + 可视化 Skill，根据上下文对话和生成的 MD 报告，自动做成可视化网页（Echart）——让数据与报告更容易阅读与理解。

MD 报告一键转可视化网页：摘要卡 + Echart 环形/柱状图

P3 · 为什么是 Skill

模型和 Harness 都商品化了——
能复用、能调度、能沉淀领域知识的单元，就是 Skill

Skill · 技能

把特定任务的专业知识、工作流、可执行逻辑结构化封装；按需加载（渐进式披露 Progressive Disclosure）。

Ontology · 本体

语义底座，定义业务对象 / 属性 / 关系 / 动作，让 Agent 在受控边界内理解业务、判断状态、触发动作、留可审计链路。

CLI / 工具 · 执行层

真正把动作落到系统里——把意图变成对系统的一次次确定调用。

Skill 调度，Ontology 理解，CLI 执行——三层各司其职。

P3+ · Ontology 不是概念 · 真实产物

本体论，是 Agent 看懂业务的那张语义地图

没有本体：Agent 只能瞎猜"毛利"是哪张表哪个字段
有了本体：业务对象 / 属性 / 关系 / 动作被显式定义
它划出 Agent 的"受控边界"——只能在定义内行动
每次问答都留下可审计链路，错了能回溯

本体定义得越厚，Agent 答得越准、越敢落地动作。

AI 成本问数 · 本体论定义（真实产物）：业务对象与关系被显式声明，成为 Agent 的语义底座。

P4 · intent assembles data · 真实例子

用户问一句业务问题，Agent 用本体 + DSL + CLI 组装出数据

意图 → 本体解析 → DSL → CLI，四步把"一句话"变成"可审计的数据"。

AI 成本问数 · 指标图谱：指标与口径在图谱里被显式连接，Agent 据此组装而非编造。

现场演示 · AI 成本数据库

不绕弯子——直接现场跑三个真实场景

三个场景都建在刚讲的 Skill + 本体 + CLI 三层之上，已进入客户生产试水——每张卡片下方是各自的预览链接，点开现场跑给你看。

① 成本问数

不只是查数据，而是复现高级成本专家的洞察——自然语言深度归因，从异常指标反向定位到设计问题，给出可落地整改建议。

▶

对话预览 ↗

xxx.com/chat/main

② 控制价审核

模拟人工完成复杂场景审核全流程并输出报告——AI 1–2 小时完成人工 2–3 天的工作量，交付可直接使用的业务结果。

▶

对话预览 ↗

xxx.com/chat/qdgl-cpa

③ 成本测算

只需输入项目规划与建造标准，AI 自动抓取沉淀数据、即改即算、直接出具可复用测算报告——基于问数能力快速构建。

▶

对话预览 ↗

xxx.com/chat/cost-query

Agent = Model + Harness

Prompt → Context → Harness 工程

像造一辆车一样造 Agent

AI 的架构范式，正在从"调模型 / 调 prompt"迁移到 "编排 Skill"

待会儿看的不是聊天机器人，是新的人机交互

旧交互 · 人找功能

新交互 · 人表达意图

对话不止是问答——它升级成了可追踪的协作任务

执行过程默认折叠

对话升级为"协作任务"

产出不止文字——Excel、可视化报告，一句话生成

在线预览 Excel / Word

内置"可视化报告"Skill

模型和 Harness 都商品化了——能复用、能调度、能沉淀领域知识的单元，就是 Skill

本体论，是 Agent 看懂业务的那张语义地图

用户问一句业务问题，Agent 用本体 + DSL + CLI 组装出数据

不绕弯子——直接现场跑三个真实场景

AI 的架构范式，正在从"调模型 / 调 prompt"
迁移到 "编排 Skill"

模型和 Harness 都商品化了——
能复用、能调度、能沉淀领域知识的单元，就是 Skill