Solo Unicorn Club logoSolo Unicorn
2,600

Cohere 深度拆解 — 面向企业的 LLM

公司拆解Cohere企业AILLMRAG
Cohere 深度拆解 — 面向企业的 LLM

Cohere 深度拆解 — 面向企业的 LLM

开场

2.4 亿美元 ARR,同比增长 287%——这是 Cohere 在 2025 年交出的成绩单。在一个所有人都在谈论 ChatGPT 和 Claude 的市场里,Cohere 选择了一条完全不同的路:不做消费者产品,不追模型榜单排名,只做企业客户的私有部署。CEO Aidan Gomez 是 Transformer 论文"Attention Is All You Need"的八位共同作者之一。我在给几家金融客户评估 LLM 供应商时深入研究了 Cohere 的方案,它的定位和执行都很独特。

他们解决什么问题

大模型在企业落地的核心障碍不是模型能力——GPT-5 和 Claude 已经足够强了。真正的障碍是:

  1. 数据安全:企业数据不能发送到第三方 API 端点
  2. 合规要求:金融、医疗、政府等行业有严格的数据驻留规定
  3. 可控性:企业需要模型在自己的基础设施上运行,可以审计、定制、控制

Cohere 的答案:85% 的收入来自私有部署。模型直接跑在客户的 VPC 或本地服务器上,数据不出客户的网络边界。

目标客户画像:

  • Fortune 500 级别的企业,IT 团队有能力管理私有部署
  • 金融机构(银行、保险、资产管理)
  • 日本、韩国等对数据主权敏感的市场
  • 已经在使用 Oracle、AWS、GCP 等云平台的企业客户

产品矩阵

核心产品

Command 系列:Cohere 的生成模型家族。

  • Command A / Command R+:旗舰模型,定价 $2.50/$10 每百万 token
  • Command R:中端模型,$0.15/$0.60 每百万 token
  • Command R7B:最轻量版,$0.0375/$0.15 每百万 token

Embed:向量嵌入模型,专门为 RAG(检索增强生成)场景设计。支持 100+ 语言,在企业搜索和知识库场景中被广泛使用。

Rerank:重排序模型,显著提升 RAG 系统的检索精度。这是 Cohere 的差异化杀手锏——很多用 OpenAI 或 Claude 做生成的团队,会单独用 Cohere 的 Rerank 做检索优化。

Model Vault(2025 年 9 月推出):企业级模型推理平台,支持在隔离的 VPC 或本地环境中部署 Command、Rerank、Embed 全系列模型。

技术差异化

Cohere 不追求"全球最强"的模型,而是追求"企业最适用"的模型。关键差异:

  • Embed + Rerank 组合:做 RAG 的团队都知道,检索质量决定了最终效果的上限。Cohere 在 Embed 和 Rerank 上的投入让它在 RAG 场景中有明显优势
  • 多语言能力:100+ 语言的 Embed 支持,对跨国企业有直接价值
  • 私有部署架构:Model Vault 的设计让企业可以在不牺牲安全性的前提下使用大模型

商业模式

定价策略

方案 价格 目标客户
Command R7B API $0.0375/$0.15 每百万token 高吞吐量/低成本场景
Command R API $0.15/$0.60 每百万token 中端使用
Command A / R+ API $2.50/$10 每百万token 高质量生成
Embed API 按 token 计费 RAG/搜索场景
Rerank API 按请求计费 搜索优化
Model Vault 企业定制报价 私有部署
Fine-tuned Command R $0.30/$1.20 每百万token 定制模型

收入模式

  • 85% 来自企业私有部署的多年合同
  • API 按量计费是补充收入
  • 毛利率约 70%

增长飞轮:私有部署的企业合同周期长(多年期),续约率高,一旦部署切换成本极高,形成天然的 lock-in。

融资与估值

轮次 时间 金额 估值
Series C 2023.6 $2.7亿 ~$22亿
Series D 2024.7 $5亿 $55亿
最新轮 2025.8-9 $6亿 $70亿

总融资 15.4 亿美元。由 Radical Ventures、Inovia Capital 领投,AMD Ventures、Nvidia、Salesforce Ventures 参投。

CEO 公开表示 IPO"即将到来",已聘请有 IPO 经验的 CFO,2026 年 IPO 被广泛预期。

客户与市场

标杆客户

  • Oracle:深度集成 Cohere 模型到 OCI(Oracle Cloud Infrastructure)
  • Fujitsu:日本市场的关键合作伙伴
  • RBC(加拿大皇家银行):金融行业标杆
  • LG:韩国市场的代表
  • Notion:产品 AI 功能的底层模型之一

这些客户的共同特征:对数据安全有刚性需求,愿意为私有部署付溢价。

市场规模

企业 LLM 私有部署市场在 2026 年预计 200-400 亿美元规模。Cohere 在这个细分市场中的定位非常精准——不和 OpenAI 争消费者,不和 Meta 争开源,只争企业的钱包。

竞争格局

维度 Cohere OpenAI Anthropic 开源方案
旗舰模型能力 二线 最强 最强 接近一线
私有部署 核心优势 有但非重点 自行部署
RAG 工具链 Embed+Rerank最强 基础 基础 需自建
企业合规 深度 在追赶 在追赶 自控
定价 中等 较高 最高 基础设施成本
IPO 时间 2026 预期 2027 预期 2026 预期

我实际看到的

好的:在我给金融客户做的 LLM 供应商评估中,Cohere 的 Rerank 模型表现确实突出。一个客户的内部知识库搜索项目,加上 Cohere Rerank 后,Top-5 检索准确率提升了 30% 以上。Model Vault 解决了"数据不出网"的刚性需求,这在银行和保险行业是 deal-breaker 级别的要求。70% 的毛利率在 AI 公司中算健康。

复杂的:Cohere 的模型在公开基准测试上不如 GPT-5 和 Claude,这是事实。一些客户在做 PoC(概念验证)时会先拿 ChatGPT 做 demo,效果很好,然后切换到 Cohere 时发现质量有差距。"够用但不是最好"是一个需要持续解释的定位。

现实的:2.4 亿 ARR 对应 70 亿估值,P/S 约 29 倍。增速很快(287%),但基数还小。私有部署虽然粘性高,但扩展速度比 API 慢——每个客户都需要专门的部署和支持。而且,OpenAI 和 Anthropic 都在加强企业部署能力,Cohere 的窗口期在缩短。

我的判断

  • ✅ 适合:对数据安全有零容忍要求的金融、医疗、政府客户;做 RAG 系统需要高质量 Embed + Rerank 的团队;已经在 Oracle Cloud 上的企业(集成最顺畅)
  • ❌ 跳过如果:你需要最强的生成能力(选 GPT-5 或 Claude);你是创业公司只需要 API(Cohere 的优势你用不到);你对 RAG 没有需求

一句话:Cohere 是企业 LLM 私有部署市场中最专注的玩家,Embed + Rerank 组合是它的护城河,但它必须在 OpenAI 和 Anthropic 把企业部署做得更好之前,把客户基数做到足够大。

互动

你的团队在做 RAG 时用什么 Embedding 模型?是直接用 OpenAI 的 text-embedding-3 还是试过其他选择?Cohere 的 Embed + Rerank 组合在我测试中效果最好,但很多团队因为惯性还是默认选 OpenAI。你是怎么选的?