Solo Unicorn Club logoSolo Unicorn
2,800

AutoGen (Microsoft) 深度拆解 — 对话式 Agent 框架

公司拆解AutoGenMicrosoft多AgentAI框架行业分析
AutoGen (Microsoft) 深度拆解 — 对话式 Agent 框架

AutoGen (Microsoft) 深度拆解 — 对话式 Agent 框架

开场

一个 AI 框架能在 18 个月内分裂成 4 个版本,这在开源世界也算罕见。AutoGen 是微软研究院在 2023 年发布的多 Agent 对话框架,GitHub 上拿到 35K+ stars,一度被认为是 LangChain 在多 Agent 场景的最大竞争对手。然后,创始团队出走、社区分裂、版本混乱,最终微软决定把 AutoGen 合并进 Semantic Kernel,重新包装为 Microsoft Agent Framework。我全程跟踪了这个过程,也在自己的项目中从 AutoGen 0.2 迁移到过 0.4,这篇文章记录我观察到的一切。

他们解决什么问题

AutoGen 的起点是一个学术研究问题:能不能让多个 AI Agent 通过"对话"来协作完成复杂任务?传统的多 Agent 系统用消息队列、状态机或工作流引擎来协调,但这些方法对 LLM Agent 来说过于僵硬。AutoGen 的核心假设是:LLM 的强项就是对话,那就让 Agent 之间直接对话。

具体来说,你定义两个或多个 ConversableAgent,给它们各自的系统提示和工具,然后让它们互相聊天、互相质疑、互相补充,直到达成一致或完成任务。这种模式在代码生成、数学推理、研究分析等场景确实有效——Agent A 写代码,Agent B 执行并反馈错误,Agent A 修改,循环直到通过。

目标用户是 AI 研究者和高级开发者。AutoGen 从一开始就更偏学术,文档里充满了论文引用,API 设计也更底层。

产品矩阵

核心产品(以及它的分裂史)

AutoGen 0.2(原版):微软研究院发布的初版,核心概念是 ConversableAgent 和 GroupChat。两个或多个 Agent 在一个 group chat 里对话,支持人类参与(UserProxyAgent)。代码简洁,上手不难,但功能相对基础。

AG2(社区分叉):2024 年 9 月,AutoGen 的两位核心创建者 Chi Wang 和 Qingyun Wu 离开微软,fork 了代码库,创建了 AG2 项目。AG2 继承了 AutoGen 0.2 的架构,保持向后兼容,由社区驱动治理。它拿到了 PyPI 上的 autogenpyautogen 包名。

AutoGen 0.4(微软重写版):微软在 2025 年 1 月发布了完全重写的 0.4 版本。异步事件驱动架构,支持分布式 Agent,有内建的调试和监控。和 0.2 完全不兼容——不是升级,是重写。

Microsoft Agent Framework:2025 年 10 月,微软宣布将 AutoGen 0.4 和 Semantic Kernel 合并为统一的 Microsoft Agent Framework。AutoGen 和 Semantic Kernel 都进入维护模式(只修 bug,不加新功能),目标是 2026 年 Q1 达到 1.0 GA。

技术差异化

AutoGen 的对话驱动模型在学术上有独创性——让 Agent "聊"出结果而不是"编排"出结果。这种模式的优势是灵活性极高:不需要预定义工作流,Agent 可以动态决定下一步做什么。劣势也明显:对话容易跑偏、token 消耗大、调试困难。

AutoGen 0.4 的技术亮点在异步事件驱动架构:Agent 之间通过消息传递通信,支持请求/响应和事件驱动两种模式,可以水平扩展。但这些特性在合并进 Microsoft Agent Framework 后,会被 Semantic Kernel 的 plugin 生态和 Azure 的基础设施包裹。

商业模式

定价策略

AutoGen 本身没有独立的商业化——它是微软研究院的开源项目,没有自己的 SaaS 产品或订阅服务。AG2 也是纯开源、社区驱动,没有商业化计划。

微软的商业化路径是通过 Azure AI 服务:Microsoft Agent Framework + Azure AI Foundry + Copilot Studio。企业客户通过 Azure 订阅使用这些能力,定价混在 Azure 的 consumption-based 模型里。

方案 价格 说明
AutoGen/AG2 开源 $0 完全免费
Azure AI Foundry 按用量 含 Agent 部署和管理
Copilot Studio $200/月/用户 低代码 Agent 构建
Azure Enterprise 定制 包含完整 Agent 基础设施

收入模式

不存在独立收入。AutoGen 是微软 AI 战略的一颗棋子——通过开源建立开发者心智,然后把他们导入 Azure 生态。这和 Google 用 TensorFlow/JAX 绑定 GCP、Meta 用 PyTorch 绑定自家硬件是同一套逻辑。

融资与估值

不适用。AutoGen 是微软内部项目,AG2 是社区项目。微软 2025 年在 AI 基础设施上的 capex 超过 $80B,AutoGen 只占其中极小的一部分。

客户与市场

标杆客户

AutoGen 的用户画像两极分化:一端是学术研究者(发论文引用 AutoGen 的超过 500 篇),另一端是微软生态里的企业客户(通过 Azure AI Foundry 使用)。中间层——独立的 AI 创业公司——在社区分裂后大量流失到 LangGraph 和 CrewAI。

市场规模

AutoGen 作为独立产品没有自己的市场。它的价值被包裹在微软的 AI 平台战略里。Microsoft Agent Framework 的真正竞争对象是 AWS Bedrock Agents 和 Google Vertex AI Agent Builder——这是一个 $50B+ 的云 AI 平台市场。

竞争格局

维度 AutoGen/MS Agent Framework LangGraph CrewAI AWS Bedrock Agents
核心模式 对话式 → 图式 + Plugin 图驱动 角色扮演 托管 Agent 服务
开源程度 是(但方向不确定)
云绑定 Azure AWS
企业级 强(微软背书) 中等 早期 强(AWS 背书)
社区稳定性 低(分裂中) 不适用
生产验证 中等 中等 早期

我实际看到的

好的:AutoGen 0.2 的对话模式在代码生成场景真的好用。我用两个 Agent(一个写代码、一个执行测试)做自动化代码审核,对话式的迭代修复比预定义工作流更自然。0.4 版本的异步架构在理论上也更先进——如果你需要分布式 Agent 系统,它的消息传递模型是最接近生产级的。

复杂的:分裂造成的混乱是真实的。2024 年底到 2025 年初,如果你搜 "AutoGen tutorial",你会找到 0.2 的旧教程、AG2 的新教程、0.4 的官方文档,三套完全不兼容的代码。我帮一个团队迁移 AutoGen 0.2 到 0.4,花了两周重写所有 Agent 定义——因为 API 完全不同。现在又要迁移到 Microsoft Agent Framework,估计还要再来一次。

现实的:对话式 Agent 的 token 消耗是个问题。两个 Agent "聊" 10 轮解决一个任务,token 消耗可能是单 Agent 直接执行的 5-8 倍。在 GPT-4 级别的模型上,这意味着一个任务的成本从 $0.10 变成 $0.50-$0.80。对于批量场景,成本差异会被放大。

我的判断

AutoGen 的学术创新值得尊重——对话式多 Agent 协作是一个有价值的范式。但作为一个实际工具,它的价值已经被社区分裂严重稀释。2026 年的选择很明确:如果你在微软生态里,等 Microsoft Agent Framework 1.0 GA(预计 2026 Q1);如果你不在微软生态里,用 LangGraph 或 CrewAI。AG2 社区版有热情但缺乏资源,长期前景不确定。

✅ 适合:深度绑定 Azure 生态的企业团队(等 Microsoft Agent Framework),学术研究和论文实验(0.2 版本或 AG2),需要分布式异步 Agent 系统的高级场景(0.4 版本)

❌ 跳过如果:你需要一个稳定的、API 不会大改的框架(版本混乱还没结束),你不在微软生态里(没有必要绑定 Azure),你是初学者(学习曲线高,且学的东西可能很快过时)

一句话:AutoGen 是一个好的学术创新,但"被微软政治搞乱了的框架"不应该是你生产系统的基础。

互动

你经历过 AutoGen 的版本分裂吗?从 0.2 迁移到 0.4 花了多久?对 Microsoft Agent Framework 有什么期待?评论区分享你的经历。