AutoGen (Microsoft) 深度拆解 — 对话式 Agent 框架

AutoGen (Microsoft) 深度拆解 — 对话式 Agent 框架
开场
一个 AI 框架能在 18 个月内分裂成 4 个版本,这在开源世界也算罕见。AutoGen 是微软研究院在 2023 年发布的多 Agent 对话框架,GitHub 上拿到 35K+ stars,一度被认为是 LangChain 在多 Agent 场景的最大竞争对手。然后,创始团队出走、社区分裂、版本混乱,最终微软决定把 AutoGen 合并进 Semantic Kernel,重新包装为 Microsoft Agent Framework。我全程跟踪了这个过程,也在自己的项目中从 AutoGen 0.2 迁移到过 0.4,这篇文章记录我观察到的一切。
他们解决什么问题
AutoGen 的起点是一个学术研究问题:能不能让多个 AI Agent 通过"对话"来协作完成复杂任务?传统的多 Agent 系统用消息队列、状态机或工作流引擎来协调,但这些方法对 LLM Agent 来说过于僵硬。AutoGen 的核心假设是:LLM 的强项就是对话,那就让 Agent 之间直接对话。
具体来说,你定义两个或多个 ConversableAgent,给它们各自的系统提示和工具,然后让它们互相聊天、互相质疑、互相补充,直到达成一致或完成任务。这种模式在代码生成、数学推理、研究分析等场景确实有效——Agent A 写代码,Agent B 执行并反馈错误,Agent A 修改,循环直到通过。
目标用户是 AI 研究者和高级开发者。AutoGen 从一开始就更偏学术,文档里充满了论文引用,API 设计也更底层。
产品矩阵
核心产品(以及它的分裂史)
AutoGen 0.2(原版):微软研究院发布的初版,核心概念是 ConversableAgent 和 GroupChat。两个或多个 Agent 在一个 group chat 里对话,支持人类参与(UserProxyAgent)。代码简洁,上手不难,但功能相对基础。
AG2(社区分叉):2024 年 9 月,AutoGen 的两位核心创建者 Chi Wang 和 Qingyun Wu 离开微软,fork 了代码库,创建了 AG2 项目。AG2 继承了 AutoGen 0.2 的架构,保持向后兼容,由社区驱动治理。它拿到了 PyPI 上的 autogen 和 pyautogen 包名。
AutoGen 0.4(微软重写版):微软在 2025 年 1 月发布了完全重写的 0.4 版本。异步事件驱动架构,支持分布式 Agent,有内建的调试和监控。和 0.2 完全不兼容——不是升级,是重写。
Microsoft Agent Framework:2025 年 10 月,微软宣布将 AutoGen 0.4 和 Semantic Kernel 合并为统一的 Microsoft Agent Framework。AutoGen 和 Semantic Kernel 都进入维护模式(只修 bug,不加新功能),目标是 2026 年 Q1 达到 1.0 GA。
技术差异化
AutoGen 的对话驱动模型在学术上有独创性——让 Agent "聊"出结果而不是"编排"出结果。这种模式的优势是灵活性极高:不需要预定义工作流,Agent 可以动态决定下一步做什么。劣势也明显:对话容易跑偏、token 消耗大、调试困难。
AutoGen 0.4 的技术亮点在异步事件驱动架构:Agent 之间通过消息传递通信,支持请求/响应和事件驱动两种模式,可以水平扩展。但这些特性在合并进 Microsoft Agent Framework 后,会被 Semantic Kernel 的 plugin 生态和 Azure 的基础设施包裹。
商业模式
定价策略
AutoGen 本身没有独立的商业化——它是微软研究院的开源项目,没有自己的 SaaS 产品或订阅服务。AG2 也是纯开源、社区驱动,没有商业化计划。
微软的商业化路径是通过 Azure AI 服务:Microsoft Agent Framework + Azure AI Foundry + Copilot Studio。企业客户通过 Azure 订阅使用这些能力,定价混在 Azure 的 consumption-based 模型里。
| 方案 | 价格 | 说明 |
|---|---|---|
| AutoGen/AG2 开源 | $0 | 完全免费 |
| Azure AI Foundry | 按用量 | 含 Agent 部署和管理 |
| Copilot Studio | $200/月/用户 | 低代码 Agent 构建 |
| Azure Enterprise | 定制 | 包含完整 Agent 基础设施 |
收入模式
不存在独立收入。AutoGen 是微软 AI 战略的一颗棋子——通过开源建立开发者心智,然后把他们导入 Azure 生态。这和 Google 用 TensorFlow/JAX 绑定 GCP、Meta 用 PyTorch 绑定自家硬件是同一套逻辑。
融资与估值
不适用。AutoGen 是微软内部项目,AG2 是社区项目。微软 2025 年在 AI 基础设施上的 capex 超过 $80B,AutoGen 只占其中极小的一部分。
客户与市场
标杆客户
AutoGen 的用户画像两极分化:一端是学术研究者(发论文引用 AutoGen 的超过 500 篇),另一端是微软生态里的企业客户(通过 Azure AI Foundry 使用)。中间层——独立的 AI 创业公司——在社区分裂后大量流失到 LangGraph 和 CrewAI。
市场规模
AutoGen 作为独立产品没有自己的市场。它的价值被包裹在微软的 AI 平台战略里。Microsoft Agent Framework 的真正竞争对象是 AWS Bedrock Agents 和 Google Vertex AI Agent Builder——这是一个 $50B+ 的云 AI 平台市场。
竞争格局
| 维度 | AutoGen/MS Agent Framework | LangGraph | CrewAI | AWS Bedrock Agents |
|---|---|---|---|---|
| 核心模式 | 对话式 → 图式 + Plugin | 图驱动 | 角色扮演 | 托管 Agent 服务 |
| 开源程度 | 是(但方向不确定) | 是 | 是 | 否 |
| 云绑定 | Azure | 无 | 无 | AWS |
| 企业级 | 强(微软背书) | 中等 | 早期 | 强(AWS 背书) |
| 社区稳定性 | 低(分裂中) | 高 | 高 | 不适用 |
| 生产验证 | 中等 | 中等 | 早期 | 高 |
我实际看到的
好的:AutoGen 0.2 的对话模式在代码生成场景真的好用。我用两个 Agent(一个写代码、一个执行测试)做自动化代码审核,对话式的迭代修复比预定义工作流更自然。0.4 版本的异步架构在理论上也更先进——如果你需要分布式 Agent 系统,它的消息传递模型是最接近生产级的。
复杂的:分裂造成的混乱是真实的。2024 年底到 2025 年初,如果你搜 "AutoGen tutorial",你会找到 0.2 的旧教程、AG2 的新教程、0.4 的官方文档,三套完全不兼容的代码。我帮一个团队迁移 AutoGen 0.2 到 0.4,花了两周重写所有 Agent 定义——因为 API 完全不同。现在又要迁移到 Microsoft Agent Framework,估计还要再来一次。
现实的:对话式 Agent 的 token 消耗是个问题。两个 Agent "聊" 10 轮解决一个任务,token 消耗可能是单 Agent 直接执行的 5-8 倍。在 GPT-4 级别的模型上,这意味着一个任务的成本从 $0.10 变成 $0.50-$0.80。对于批量场景,成本差异会被放大。
我的判断
AutoGen 的学术创新值得尊重——对话式多 Agent 协作是一个有价值的范式。但作为一个实际工具,它的价值已经被社区分裂严重稀释。2026 年的选择很明确:如果你在微软生态里,等 Microsoft Agent Framework 1.0 GA(预计 2026 Q1);如果你不在微软生态里,用 LangGraph 或 CrewAI。AG2 社区版有热情但缺乏资源,长期前景不确定。
✅ 适合:深度绑定 Azure 生态的企业团队(等 Microsoft Agent Framework),学术研究和论文实验(0.2 版本或 AG2),需要分布式异步 Agent 系统的高级场景(0.4 版本)
❌ 跳过如果:你需要一个稳定的、API 不会大改的框架(版本混乱还没结束),你不在微软生态里(没有必要绑定 Azure),你是初学者(学习曲线高,且学的东西可能很快过时)
一句话:AutoGen 是一个好的学术创新,但"被微软政治搞乱了的框架"不应该是你生产系统的基础。
互动
你经历过 AutoGen 的版本分裂吗?从 0.2 迁移到 0.4 花了多久?对 Microsoft Agent Framework 有什么期待?评论区分享你的经历。