GPT / Claude / Gemini / 豆包 / DeepSeek / GLM / Qwen …
Claude Code / Codex / 扣子 / OpenClaw / 豆包任务模式 / 微信小微 …
谁在用、用来干什么?——把真实场景说出来。




多步推理 / 工具调用 / 指令遵循稳定到位,长任务以"结果交付"跑得起来。DeepSWE 榜上 GLM-5.2 是第三大模型家族;Qwen3.7-Max GPQA 92.4、Arena 国产第一。
▸ 印证:信创 / 政务云可本地、可控、低成本拿到发动机。
Claude Code SDK / Codex SDK 把 Harness 这一层 SDK 化。搭 Agent 从"各自造轮子"变成"调一个 SDK 就有"。
▸ 印证:开发者不再搭骨架,只定义 intent、挂 Skill、配工具。
开源 OpenClaw 19–21 万★ 起势,国内厂商快速跟进:腾讯 QClaw、钉钉悟空、飞书 / 企微 CLI 把办公能力 CLI 化、普惠化。
▸ 印证:三大办公平台 3 个月内齐齐 CLI 化,Agent 直接调办公数据。
微信「小微」灰度内测——14.32 亿月活 + 百万小程序可调,AI 专属卡下单闭环;豆包「任务模式」全链路、可定时。
▸ 印证:一句话让 AI 办成事,正成为十几亿人的日常入口。