Sourcegraph 深度拆解 — 大规模代码智能的先行者与转型阵痛

Sourcegraph 深度拆解 — 大规模代码智能的先行者与转型阵痛
开场
Sourcegraph 可能是这批 AI 编程公司里最"资深"的一家——成立于 2013 年,比 Cursor、Windsurf 这些后浪早了近十年。2021 年的 Series D 估值 $2.6B,但到 2025 年,年收入只有约 $50M。作为对比,Cursor 在不到两年内就做到了 $1.2B ARR。我在大型代码库的项目中用过 Sourcegraph 的搜索功能,也测试过他们的 AI 助手 Cody。这篇拆解,我想探讨一个问题:在 AI 编程浪潮中,先发优势到底有多大价值?
他们解决什么问题
大型企业的代码库规模超出一般人的想象。Google 的 monorepo 有超过 20 亿行代码,一个普通的 Fortune 500 企业可能有几百万行分布在几百个仓库里。在这种规模下,"找到你需要的代码"本身就是一个巨大的效率瓶颈。
Sourcegraph 最初解决的就是这个问题:跨仓库的代码搜索和导航。你可以在一个统一的界面中搜索所有仓库的代码,追踪函数调用链、查看引用关系。这在 GitHub 原生搜索根本不够用的大型组织中,是刚需。
目标客户一直是大型技术组织:Google、Uber、Lyft、Databricks 这类有海量代码库的公司。
产品矩阵
核心产品
Sourcegraph Code Search — 跨仓库的代码搜索引擎,支持正则表达式、结构化搜索、差异搜索。能索引 GitHub、GitLab、Bitbucket 等多个代码托管平台。
Cody — 2023 年推出的 AI 编程助手,能利用 Sourcegraph 的代码搜索能力为 AI 提供精准的上下文。Cody 的卖点是"它真正理解你的代码库",因为背后有 Sourcegraph 的代码图谱。但到 2025 年 7 月,Sourcegraph 宣布关停 Cody Free 和 Pro 版本,只保留 Enterprise 版。
Amp — 从 Sourcegraph 内部孵化出来的独立产品/公司,定位为 AI 编程代理(Agent)。和 Cody 的"助手"模式不同,Amp 更强调自主执行能力——可以规划和完成复杂的编码任务。定价 $59/月。
Cody Enterprise — 面向企业的 AI 编程助手,$59/用户/月。包含企业级安全、可扩展性和灵活性。
技术差异化
Sourcegraph 的核心技术资产是它的代码图谱(Code Graph)。它不只是做文本搜索,而是理解代码的语义结构——函数调用关系、类型定义、依赖链。这种结构化的代码理解能力,在 AI 时代变成了一个潜在的杀手级优势:如果你能给 AI 提供精准的代码上下文,生成的代码质量会大幅提升。
问题在于,这个优势没有被充分转化成产品竞争力。Cursor 用自研的代码索引系统实现了"足够好"的上下文能力,而且迭代速度快得多。
商业模式
定价策略
| 方案 | 价格 | 目标客户 |
|---|---|---|
| Cody Enterprise | $59/用户/月 | 大型企业开发团队 |
| Amp | $59/月(个人) | 高级开发者 |
| Code Search Enterprise | 自定义 | 需要跨仓库搜索的组织 |
注意:Cody Free 和 Pro 已在 2025 年 7 月关停。这意味着 Sourcegraph 在个人开发者市场上基本放弃了竞争。
收入模式
企业订阅为主。年收入约 $50M(2025 年),团队约 184 人。人均产出约 $272K/年,在 SaaS 行业算中等水平。
融资与估值
| 轮次 | 时间 | 金额 | 估值 |
|---|---|---|---|
| Series C | 2020 | $50M | - |
| Series D | 2021.07 | $125M | $2.6B |
| (后续无新轮次公开) |
主要投资人:Andreessen Horowitz、Insight Partners、Geodesic Capital。值得注意的是,自 2021 年的 D 轮之后,Sourcegraph 没有再进行公开融资。$2.6B 的估值是 4 年前的数字,按目前 $50M 的收入水平,实际估值可能已经大幅缩水。
客户与市场
标杆客户
已知客户包括 Uber、Lyft、Databricks、Yelp、Cloudflare 等。这些都是代码库规模大、有跨仓库搜索刚需的技术型企业。但客户数量一直不多——Sourcegraph 的产品形态决定了它只服务于金字塔顶端的大型工程组织。
市场规模
代码搜索和智能的 TAM 比较难独立估算——它更像是 AI 编程工具大市场的一个子集。如果聚焦在 500 人以上工程团队的企业客户,全球可能有几千家潜在客户,按每家 $100K-$500K/年的合同规模计算,SAM 约 $5-10B。
竞争格局
| 维度 | Sourcegraph | GitHub Copilot | Cursor |
|---|---|---|---|
| 核心能力 | 代码搜索 + AI | AI 编程 + GitHub 生态 | AI-first 编辑器 |
| 目标客户 | 大型企业 | 全层级 | 开发者个人 + 团队 |
| AI 产品 | Cody Enterprise + Amp | Copilot 全家族 | Editor + Agent |
| 市场地位 | 垂直领域领先 | 市场份额最大 | 产品体验最好 |
| 增长势头 | 停滞/转型中 | 稳健增长 | 爆发式增长 |
我实际看到的
好的:Sourcegraph 的代码搜索在大型 monorepo 中确实好用。当你需要找到"所有调用了这个 API 的地方",或者"这个函数在过去 6 个月内被改了几次",Sourcegraph 的搜索体验远超 GitHub 原生搜索和 grep。Cody Enterprise 利用代码图谱提供上下文的能力也比一般的 AI 助手更精准。
复杂的:战略方向的频繁调整是最大的隐忧。先推 Cody 对标 Copilot,效果不理想后砍掉个人版,又孵化 Amp 做 Agent。每次转向都意味着资源分散和用户信任的消耗。Amp 独立出去更是释放了一个信号:Sourcegraph 内部对 AI 方向的判断也在摇摆。
现实的:13 年的老公司在快速变化的 AI 赛道上有明显的包袱。Cursor 两年做到 $1B+ ARR,而 Sourcegraph 13 年做到 $50M。这不是执行力的问题——代码搜索本身就是一个小众市场,而 Sourcegraph 在转向更大的 AI 编程市场时,速度和魄力都不够。
我的判断
- ✅ 适合:拥有超大型代码库(数百万行+、数百个仓库)的企业工程团队——Sourcegraph 的代码搜索在这个场景下没有替代品
- ✅ 适合:对代码上下文质量有极高要求的 AI 编程场景——Cody Enterprise 的上下文精准度确实更高
- ❌ 跳过如果:你是个人开发者或中小团队——Sourcegraph 的产品和定价完全不面向你
- ❌ 跳过如果:你需要一个长期稳定迭代的 AI 编程工具——Sourcegraph 的产品战略还在频繁调整中
一句话:Sourcegraph 拥有 AI 编程时代最有价值的底层资产之一(代码图谱),但把这个资产转化成增长的过程异常艰难。它更像是 AI 编程生态的"基础设施供应商",而非面向终端用户的产品赢家。
互动
你在大型项目中用什么工具搜索和理解代码?代码搜索这个需求对你来说有多重要?你觉得 Sourcegraph 应该继续独立还是被某个大公司收购整合?