第 1 章 · 技术发展趋势
01 / 10
P1 · 真实案例

一个人、一台电脑,一个月烧掉 5 万美元 token

刘小排——非程序员出身的 AI 创业者,2025 年单月消耗超 5 万美元(约 35 万人民币)Claude token, 被 Anthropic 官方点名、直接逼出官方限速,人称 Claude Code "榜一大哥"。
他是怎么做到的?背后不是一个工具,是四条线同时拐头
据其本人访谈 / 即刻分享
P2 · 现场互动 · 三连问(举手 / 投票)

你其实,已经站在这条曲线上

01

你日常用什么模型?

GPT / Claude / Gemini / 豆包 / DeepSeek / GLM / Qwen …

02

你日常用什么 Agent 工具?

Claude Code / Codex / 扣子 / OpenClaw / 豆包任务模式 / 微信小微 …

03

哪些场景已经在用 AI?

谁在用、用来干什么?——把真实场景说出来。

你大概率已经在用了——已经站在这条曲线上。问题只是:为什么是现在
P3 · "一个人公司" 群像

不是个例——一个人,跑出一家公司

刘小排 · Raphael AI(中国)
非程序员出身,团队只有他自己,去年收入近千万。Claude Code "榜一大哥"——200 美元套餐薅出价值 5 万美元/月的用量。
技术栈:Claude Code / Codex / Hermes Agent
Pieter Levels · 独立开发之王
0 员工、0 融资,独自上线 40+ 产品;组合 $3.1M ARR,PhotoAI 单品月入 13.8 万美元。Lex Fridman 播客座上宾。
Cluely · Roy Lee · 话题之王
21 岁哈佛退学,一款"AI 提词器"2 个月冲到 600 万美元 ARR;公司只设"工程师 + 网红"两种岗位。
Marc Lou · indie hacker 顶流
纯单干、0 员工,2025 个人收入超 103 万美元;代码模板 ShipFast 服务 7200+ 开发者,毛利 91%。
Midjourney · David Holz · 约 50 人做到 $200M+ 年收,人均创收超英伟达——"小团队 ≠ 小生意" 数据来自媒体报道与本人自述
一个人公司
P4 · 为什么是"现在" 四条线在 2026 Q2 三个月内"接力拐头"——通用层商品化,胜负手转向 Skill ① 判断 · SO WHAT Agent 拐点已至:通用层(模型 + Harness)正快速商品化 胜负手由"能不能造" → 转向"垂直 Skill 与评测集" ② 四力共振 · 论点 线三 加速 Agent 应用 OpenClaw 起势 + 国内厂商跟进 OpenClaw 19–21 万★;腾讯 QClaw 钉钉悟空 · 飞书 / 企微 CLI 落地办公 线二 Harness 门槛塌方 Claude Code SDK · Codex SDK 降门槛 把 Harness Engineering 这一层 SDK 化 搭 Agent:从"造轮子" → "调 SDK" 线一 模型越过水平线 国产越过基准线 · 长任务结果交付稳定 Qwen3.7-Max GPQA 92.4 · Arena 国产第一 Fable 5 部分基准超 Opus 4.8 逾 10% 线四 C 端超级入口 超级入口即将出现 · 灰度内测中 微信 AI 调小程序+AI专属卡 下单闭环 豆包"任务模式"全链路、可定时 ③ 时间线 · 论据 · 2026 真实事件 时间 → 2026.02 OpenClaw 生态成势 2026.03 钉钉悟空 · 飞书 / 企微 CLI 2026.05.20 Qwen3.7-Max 登榜 2026.06.09 Claude Fable 5 发布 2026.06.12 豆包"任务模式"上线 2026.06.17 微信 AI + AI专属卡 来源:GitHub · IT之家 · 财新 · 36氪 · 观察者网(2026.06 检索) 星数 / 月活 / 跑分以官方口径为准
P5 · 国产发动机登榜

发动机国产已可得——GLM-5.2 是第三大模型家族

DeepSWE v1.1(Best)· 9 个模型统一在 mini-swe-agent 上跑 · 指标 Pass@1(真实榜单)
claude-fable-5Anthropic
70%
gpt-5.5OpenAI
67%
claude-opus-4.8Anthropic
59%
gpt-5.4OpenAI
52%
glm-5.2智谱·开源③ 第三大家族
44%
gemini-3.5-flashGoogle
37%
kimi-k2.7-codeMoonshot
31%
claude-sonnet-4.6Anthropic
30%
gemini-3.1-proGoogle
12%
Anthropic · Claude Fable 5 · 70%
OpenAI · GPT-5.5 · 67%
智谱 GLM-5.2 · 44% · 力压 Gemini / Kimi
按厂商取最强,GLM-5.2 = Claude、GPT 之后的第三大模型家族;且是 Top 梯队里成本最低的——单跑 $3.92,约为 Claude Fable 5($21.63)的 1/5,还全量开源、可本地、可控。
数据来源:DeepSWE v1.1 榜单(Best 档)
P6 · 线四深读 · C 端超级入口

AI 离每个人更近——它住进了 14 亿人每天都开的微信

微信「小微」灰度内测:不是又一个 AI App,而是把 Agent 变成贯穿 社交 / 服务 / 生活 / 创作 的基础接口。
帮我点个奶茶
帮你办事「点个奶茶」→ 直接开美团外卖、定位甜点饮品
附近不辣的饭店
懂你生活「附近不辣的饭店」→ 腾讯地图按距离口味帮你挑
帮我看看朋友圈
替你读信息「看看朋友圈」→ 一句话总结今天大家在发啥
对话造小工具
帮你创造「做个旅行 AA 账本」→ 对话直接生成微信小工具
14.32 亿 微信月活 百万级 小程序可调 AI 专属卡 下单支付闭环 入口无处不在:聊天框 · 长按「问小微」· 公众号/视频转发 ⚠ 测试版灰度内测 · 据「特工宇宙 · 观猹」实测 · 月活/能力以官方为准
P7 · 一句判断
模型越线 · 门槛塌方 · 应用加速 · 入口将至
通用层(模型 + Harness)正在快速商品化—— 胜负手转移到垂直 Skill 与评测集
P8 · 四力共振

四力共振 · 四条线同时拐头

线一 · 国内模型越过驱动 Agent 水平线

多步推理 / 工具调用 / 指令遵循稳定到位,长任务以"结果交付"跑得起来。DeepSWE 榜上 GLM-5.2 是第三大模型家族;Qwen3.7-Max GPQA 92.4、Arena 国产第一。

▸ 印证:信创 / 政务云可本地、可控、低成本拿到发动机。

线二 · Harness Engineering 门槛塌方

Claude Code SDK / Codex SDK 把 Harness 这一层 SDK 化。搭 Agent 从"各自造轮子"变成"调一个 SDK 就有"。

▸ 印证:开发者不再搭骨架,只定义 intent、挂 Skill、配工具。

线三 · OpenClaw + 国内厂商加速 Agent 应用

开源 OpenClaw 19–21 万★ 起势,国内厂商快速跟进:腾讯 QClaw、钉钉悟空、飞书 / 企微 CLI 把办公能力 CLI 化、普惠化。

▸ 印证:三大办公平台 3 个月内齐齐 CLI 化,Agent 直接调办公数据。

线四 · C 端超级入口即将出现

微信「小微」灰度内测——14.32 亿月活 + 百万小程序可调,AI 专属卡下单闭环;豆包「任务模式」全链路、可定时。

▸ 印证:一句话让 AI 办成事,正成为十几亿人的日常入口。

P9 · 当个人成为瓶颈

榜一大哥也会变成瓶颈

当他亲自把关每一层

  • 合伙人接手产品,每个改动都过他审
  • 每多一层 review,速度就慢一截
  • "Every layer of review makes you 10x slower"
  • 他本人成了整条流水线的瓶颈

当他把权限全部下放

  • 不再卡在每一层审核
  • 效率立刻提升
  • 戴明:"检查层数越多,质量越差"
  • 人退到"定义问题",让工具去执行
个人能力到位之后,组织方式反而成了新的天花板。
P10 · 小结

OPC 不是"一个人"——是一种思想

OPC(One-Person Company)是一种思想
不是真的只有一个人——
它真正指向的,是我们 AI 时代的组织
「我只负责定义问题,工具负责伺候我。」
人退到定义问题,执行交给 AI 与工具。
所以真正的问题,不是"一个人能干多少"——而是:这样的组织,到底长什么样?