Cohere 深度拆解 — 面向企业的 LLM

Cohere 深度拆解 — 面向企业的 LLM
开场
2.4 亿美元 ARR,同比增长 287%——这是 Cohere 在 2025 年交出的成绩单。在一个所有人都在谈论 ChatGPT 和 Claude 的市场里,Cohere 选择了一条完全不同的路:不做消费者产品,不追模型榜单排名,只做企业客户的私有部署。CEO Aidan Gomez 是 Transformer 论文"Attention Is All You Need"的八位共同作者之一。我在给几家金融客户评估 LLM 供应商时深入研究了 Cohere 的方案,它的定位和执行都很独特。
他们解决什么问题
大模型在企业落地的核心障碍不是模型能力——GPT-5 和 Claude 已经足够强了。真正的障碍是:
- 数据安全:企业数据不能发送到第三方 API 端点
- 合规要求:金融、医疗、政府等行业有严格的数据驻留规定
- 可控性:企业需要模型在自己的基础设施上运行,可以审计、定制、控制
Cohere 的答案:85% 的收入来自私有部署。模型直接跑在客户的 VPC 或本地服务器上,数据不出客户的网络边界。
目标客户画像:
- Fortune 500 级别的企业,IT 团队有能力管理私有部署
- 金融机构(银行、保险、资产管理)
- 日本、韩国等对数据主权敏感的市场
- 已经在使用 Oracle、AWS、GCP 等云平台的企业客户
产品矩阵
核心产品
Command 系列:Cohere 的生成模型家族。
- Command A / Command R+:旗舰模型,定价 $2.50/$10 每百万 token
- Command R:中端模型,$0.15/$0.60 每百万 token
- Command R7B:最轻量版,$0.0375/$0.15 每百万 token
Embed:向量嵌入模型,专门为 RAG(检索增强生成)场景设计。支持 100+ 语言,在企业搜索和知识库场景中被广泛使用。
Rerank:重排序模型,显著提升 RAG 系统的检索精度。这是 Cohere 的差异化杀手锏——很多用 OpenAI 或 Claude 做生成的团队,会单独用 Cohere 的 Rerank 做检索优化。
Model Vault(2025 年 9 月推出):企业级模型推理平台,支持在隔离的 VPC 或本地环境中部署 Command、Rerank、Embed 全系列模型。
技术差异化
Cohere 不追求"全球最强"的模型,而是追求"企业最适用"的模型。关键差异:
- Embed + Rerank 组合:做 RAG 的团队都知道,检索质量决定了最终效果的上限。Cohere 在 Embed 和 Rerank 上的投入让它在 RAG 场景中有明显优势
- 多语言能力:100+ 语言的 Embed 支持,对跨国企业有直接价值
- 私有部署架构:Model Vault 的设计让企业可以在不牺牲安全性的前提下使用大模型
商业模式
定价策略
| 方案 | 价格 | 目标客户 |
|---|---|---|
| Command R7B API | $0.0375/$0.15 每百万token | 高吞吐量/低成本场景 |
| Command R API | $0.15/$0.60 每百万token | 中端使用 |
| Command A / R+ API | $2.50/$10 每百万token | 高质量生成 |
| Embed API | 按 token 计费 | RAG/搜索场景 |
| Rerank API | 按请求计费 | 搜索优化 |
| Model Vault | 企业定制报价 | 私有部署 |
| Fine-tuned Command R | $0.30/$1.20 每百万token | 定制模型 |
收入模式
- 85% 来自企业私有部署的多年合同
- API 按量计费是补充收入
- 毛利率约 70%
增长飞轮:私有部署的企业合同周期长(多年期),续约率高,一旦部署切换成本极高,形成天然的 lock-in。
融资与估值
| 轮次 | 时间 | 金额 | 估值 |
|---|---|---|---|
| Series C | 2023.6 | $2.7亿 | ~$22亿 |
| Series D | 2024.7 | $5亿 | $55亿 |
| 最新轮 | 2025.8-9 | $6亿 | $70亿 |
总融资 15.4 亿美元。由 Radical Ventures、Inovia Capital 领投,AMD Ventures、Nvidia、Salesforce Ventures 参投。
CEO 公开表示 IPO"即将到来",已聘请有 IPO 经验的 CFO,2026 年 IPO 被广泛预期。
客户与市场
标杆客户
- Oracle:深度集成 Cohere 模型到 OCI(Oracle Cloud Infrastructure)
- Fujitsu:日本市场的关键合作伙伴
- RBC(加拿大皇家银行):金融行业标杆
- LG:韩国市场的代表
- Notion:产品 AI 功能的底层模型之一
这些客户的共同特征:对数据安全有刚性需求,愿意为私有部署付溢价。
市场规模
企业 LLM 私有部署市场在 2026 年预计 200-400 亿美元规模。Cohere 在这个细分市场中的定位非常精准——不和 OpenAI 争消费者,不和 Meta 争开源,只争企业的钱包。
竞争格局
| 维度 | Cohere | OpenAI | Anthropic | 开源方案 |
|---|---|---|---|---|
| 旗舰模型能力 | 二线 | 最强 | 最强 | 接近一线 |
| 私有部署 | 核心优势 | 有但非重点 | 有 | 自行部署 |
| RAG 工具链 | Embed+Rerank最强 | 基础 | 基础 | 需自建 |
| 企业合规 | 深度 | 在追赶 | 在追赶 | 自控 |
| 定价 | 中等 | 较高 | 最高 | 基础设施成本 |
| IPO 时间 | 2026 预期 | 2027 预期 | 2026 预期 | — |
我实际看到的
好的:在我给金融客户做的 LLM 供应商评估中,Cohere 的 Rerank 模型表现确实突出。一个客户的内部知识库搜索项目,加上 Cohere Rerank 后,Top-5 检索准确率提升了 30% 以上。Model Vault 解决了"数据不出网"的刚性需求,这在银行和保险行业是 deal-breaker 级别的要求。70% 的毛利率在 AI 公司中算健康。
复杂的:Cohere 的模型在公开基准测试上不如 GPT-5 和 Claude,这是事实。一些客户在做 PoC(概念验证)时会先拿 ChatGPT 做 demo,效果很好,然后切换到 Cohere 时发现质量有差距。"够用但不是最好"是一个需要持续解释的定位。
现实的:2.4 亿 ARR 对应 70 亿估值,P/S 约 29 倍。增速很快(287%),但基数还小。私有部署虽然粘性高,但扩展速度比 API 慢——每个客户都需要专门的部署和支持。而且,OpenAI 和 Anthropic 都在加强企业部署能力,Cohere 的窗口期在缩短。
我的判断
- ✅ 适合:对数据安全有零容忍要求的金融、医疗、政府客户;做 RAG 系统需要高质量 Embed + Rerank 的团队;已经在 Oracle Cloud 上的企业(集成最顺畅)
- ❌ 跳过如果:你需要最强的生成能力(选 GPT-5 或 Claude);你是创业公司只需要 API(Cohere 的优势你用不到);你对 RAG 没有需求
一句话:Cohere 是企业 LLM 私有部署市场中最专注的玩家,Embed + Rerank 组合是它的护城河,但它必须在 OpenAI 和 Anthropic 把企业部署做得更好之前,把客户基数做到足够大。
互动
你的团队在做 RAG 时用什么 Embedding 模型?是直接用 OpenAI 的 text-embedding-3 还是试过其他选择?Cohere 的 Embed + Rerank 组合在我测试中效果最好,但很多团队因为惯性还是默认选 OpenAI。你是怎么选的?