Snowflake 深度拆解 — AI 加持的数据云

Snowflake 深度拆解 — AI 加持的数据云
开场
Snowflake 曾经是华尔街最受追捧的 SaaS 公司——2020 年 IPO 首日涨幅 111%,巴菲特都罕见地参与了 IPO 认购。但 2023-2024 年增速放缓,股价从高点腰斩。然后 AI 的浪潮来了。2025 年底,Cortex AI 收入年化突破 1 亿美元,比多数分析师预期快了一个季度。FY2026 产品收入达到约 44.7 亿美元,增长 29%。
我在企业客户那里接触 Snowflake 的频率可能比任何其他数据工具都高。它是很多公司"第一个认真用的云数据仓库"。这篇文章拆解它现在到底在做什么,以及 AI 这张牌打得怎么样。
他们解决什么问题
传统数据仓库(Oracle、Teradata)有两个根本问题:贵,且弹性差。你必须预购容量,不管用不用都在付钱。数据量增长时扩容周期以月计。跨部门数据共享靠导出 CSV。
Snowflake 用计算存储分离架构解决了这些问题:存储按实际用量计费(接近 S3 价格),计算资源按需启停,几秒内弹性扩缩。数据共享不需要搬数据——直接授权访问。
目标客户:中大型企业的数据分析和 BI 团队,尤其是已经在用 Tableau、Looker、Power BI 的组织。行业覆盖金融、零售、科技、医疗,基本上任何需要 SQL 分析的企业都在 Snowflake 的射程内。
时机:企业数据量的增长速度远超预算增长速度。IDC 的数据显示,全球企业数据量每两年翻一番,但 IT 预算的年增长率只有 5-8%。消费制的弹性定价让 CFO 能接受"用多少付多少"的模式,而不是跟 Oracle 签三年锁定合同。Snowflake 在 2020-2023 年抓住了"去 Oracle 化"的窗口期,拿下了大量从传统数据仓库迁移的客户。
产品矩阵
核心产品
Snowflake Data Cloud:核心数据仓库,支持 SQL 查询、半结构化数据(JSON、Parquet)处理、数据共享和 Marketplace。
Snowflake Cortex:2024 年推出的 AI 服务层,直接在 Snowflake 环境内运行 LLM 推理。包括 AI_COMPLETE(文本生成)、AI_CLASSIFY(分类)、AI_SUMMARIZE(摘要)等 SQL 函数。支持调用 Claude、Llama、Mistral 等模型。
Snowflake Intelligence:2025 年底推出,让非技术用户用自然语言查询数据,定位类似 ThoughtSpot 的 Search 体验,但内嵌在 Snowflake 生态中。
Cortex Search:基于 Snowflake 数据构建 RAG 应用的搜索服务,按索引数据量和 token 使用量计费。
Snowpark:在 Snowflake 内运行 Python、Java、Scala 代码的运行时,让数据科学家不用把数据搬出去就能做 ML。
Snowflake Marketplace:数据和应用的交易市场。第三方供应商可以在 Marketplace 上发布数据集、ML 模型和数据应用。客户可以直接在 Snowflake 内订阅第三方数据,不需要建 ETL 管道。这个模式创造了数据层面的网络效应。
技术差异化
Snowflake 的护城河是"数据引力"——一旦企业把数据放进 Snowflake,围绕这些数据的查询、权限、管道都绑定了。数据共享和 Marketplace 进一步强化了网络效应:你的合作伙伴也在 Snowflake 上,数据直接互通。
跟 Databricks 比,Snowflake 的 SQL 体验更成熟、更快——Snowflake 的查询优化器针对分析型 SQL 做了深度优化,对数据分析师来说上手成本接近零。跟 BigQuery 比,Snowflake 的跨云能力(AWS、Azure、GCP 都支持)是关键差异。跟 Redshift 比,Snowflake 的计算存储分离架构让扩缩容体验好一个量级——Redshift 扩容还要等节点预热。
Snowflake 的数据引力效应是其最深的护城河:一旦企业把核心数据放进 Snowflake,围绕这些数据的 BI 工具、ETL 管道、数据共享关系都绑定了。迁移成本不只是技术成本,还有业务关系的重建成本。
商业模式
定价策略
Snowflake 是纯消费制——没有 seat-based 许可证。核心计费单位是 Credit。
| 计费维度 | 模式 | 参考价格 |
|---|---|---|
| 计算(Virtual Warehouse) | 按 Credit 消耗 | $2-4/Credit(按需),$1.50-2.50/Credit(年约) |
| 存储 | 按实际用量 | ~$23-40/TB/月 |
| Cortex AI 函数 | 按 Token | Claude-4-opus: 12 Credit/百万 Token |
| Cortex Search | 按索引数据量 + Token | 6.3 Credit/GB/月(持续计费) |
需要特别注意的是 Cortex Search 的"空闲税"——不管你查不查询,只要索引存在就按 GB/月持续计费。50GB 索引 + 20GB 嵌入 = 70GB,每月固定 441 Credit。
收入模式
消费制的好处是收入跟客户价值正相关,坏处是季节性波动大。Snowflake 通过年度承诺合同(Capacity Contract)来平滑——客户预购 Credit,锁定折扣价。FY2027 指引产品收入约 $57 亿,暗示 27% 增长。
融资与估值
Snowflake 于 2020 年 9 月 IPO,当前市值约 $750 亿。过去 12 个月,Snowflake 和 Databricks 的 ARR 差距从 Snowflake 领先 $8.8 亿缩小到几乎持平。Databricks 估值 $1340 亿,是 Snowflake 的接近 2 倍——市场在用估值投票谁更像"AI 公司"。
客户与市场
标杆客户
- Capital One:核心数据分析平台迁移到 Snowflake,替换了 Teradata
- Instacart:供应链和用户行为分析跑在 Snowflake 上
- Siemens:工业数据共享和分析的全球平台
- DoorDash:实时运营分析和定价模型
Snowflake 有超过 6100 个账户在使用 Cortex 构建 AI 应用。净收入留存率约 120%,相比历史峰值 170%+ 有所下降,反映了消费增速放缓。
市场规模
云数据仓库市场 2026 年预计约 $350 亿。Snowflake 的 $44.7 亿产品收入意味着约 13% 的市场份额。如果加上 AI 服务市场的增量,TAM 可以扩展到 $500 亿以上。
竞争格局
| 维度 | Snowflake | Databricks | Google BigQuery | Amazon Redshift |
|---|---|---|---|---|
| SQL 性能 | 强 | 中等(在追赶) | 强 | 中等 |
| AI/ML 原生 | 中等(Cortex 起步) | 强(Mosaic AI) | 强(Vertex AI) | 中等 |
| 非结构化数据 | 弱 | 强 | 中等 | 弱 |
| 数据共享 | 强(Marketplace) | 中等 | 弱 | 弱 |
| 跨云 | 三大云都支持 | 三大云都支持 | 仅 GCP | 仅 AWS |
| 定价模式 | 消费制(Credit) | 消费制(DBU) | 消费制 | 预留 + 按需 |
| 增长 | 29% YoY | 65% YoY | 未单独披露 | 未单独披露 |
核心观察:Snowflake 和 Databricks 正在从两个方向互相侵入。Snowflake 从 SQL 分析向 AI 延伸,Databricks 从 ML 向 SQL 延伸。短期内 Snowflake 在 SQL 场景仍有优势,但 AI 方向 Databricks 领先明显。
我实际看到的
好的:Snowflake 对 SQL 分析师非常友好。我见过数据团队从 Teradata 迁移到 Snowflake 后,查询速度提升 5-10 倍,同时总成本降低 40%。数据共享功能是真正的差异化——跨组织分享数据不需要 ETL,直接授权就行。对于已经有 Tableau/Looker 的团队,Snowflake 是最无缝的后端选择。
复杂的:消费制定价是双刃剑。一方面灵活,另一方面不可预测。我见过客户因为一个写得不好的 SQL 查询烧掉了 $5000——一个查询。Cortex AI 的定价更复杂,Cortex Search 的持续计费模式让很多客户在概念验证时吃了暗亏。没有 FinOps 意识的团队,Snowflake 的月账单可以让 CFO 心跳加速。
现实的:Snowflake 在 AI 方向的竞争力还需要验证。Cortex 年化收入 1 亿听起来不少,但跟 Databricks AI 收入的 14 亿比就知道差距。6100 个 Cortex 用户很多是试用阶段。真正把生产级 ML 模型跑在 Snowflake 上的企业,我还没见到几个。Snowflake 的长期赌注是:企业会选择在数据已经存在的地方做 AI,而不是把数据搬到 AI 平台去。这个逻辑成立,但需要 Cortex 的能力追上 Databricks。
我的判断
- ✅ 适合:核心需求是 SQL 分析和 BI 的企业。Snowflake 的查询性能、易用性和生态成熟度是最好的。
- ✅ 适合:有跨组织数据共享需求的场景(金融、医疗、供应链)。
- ✅ 适合:已经用 Tableau/Looker/Power BI 的团队,Snowflake 是最平滑的升级路径。
- ❌ 跳过如果:核心需求是 ML 模型训练和推理。现阶段 Databricks 或者直接用云厂商的 ML 服务更成熟。
- ❌ 跳过如果:预算有限且没有 FinOps 团队。消费制的灵活性在缺乏管控时会变成成本陷阱。
一句话:Snowflake 是企业数据分析的默认选择,但 AI 这张牌还在打——能不能打赢,2026 年下半年见分晓。
互动
你觉得 Snowflake 的"在数据所在的地方做 AI"逻辑成立吗?还是说企业最终会把数据搬到专门的 AI 平台?你的团队 Cortex 用上了吗?