Featured image of post OpenRouter 融了 1.13 亿美元:AI 应用的入口,正在从“选模型”变成“选路由”

OpenRouter 融了 1.13 亿美元:AI 应用的入口,正在从“选模型”变成“选路由”

OpenRouter 完成 1.13 亿美元 B 轮融资,真正值得看的不是融资金额,而是多模型时代的应用架构变化。开发者不再只需要一个最强模型,而是需要一层能处理价格、延迟、故障切换、合规和供应商替换的模型路由基础设施。

OpenRouter 刚完成 1.13 亿美元 B 轮融资。

公告里写得很漂亮:CapitalG 领投,NVentures、ServiceNow Ventures、MongoDB Ventures、Snowflake Ventures、Databricks Ventures 等参投;过去六个月,平台周处理量从 5 万亿 tokens 增长到 25 万亿 tokens;OpenRouter 称自己服务 800 万以上开发者,覆盖 400 多个模型。

这条新闻也上了 Hacker News 首页。当前条目显示,它拿到了 342 points 和 166 comments。一个模型调用基础设施产品能有这个讨论度,已经说明它不只是开发者圈里的小工具了。

不过,如果只把这件事写成“又一家 AI 公司融了大钱”,就有点浪费了。

我更关心的是另一个问题:为什么现在是 OpenRouter?为什么一个站在应用和模型之间、做聚合、路由、账单和故障切换的平台,会突然变得这么有价值?

答案可能不在融资金额里,而在 AI 应用开发的日常麻烦里。

过去大家做 AI 产品,第一反应往往是选模型:用 GPT,还是 Claude?用 Gemini,还是开源模型?但到了生产环境,问题会慢慢变成另一种样子:这个请求该走哪个模型?如果供应商限流怎么办?成本超预算怎么办?企业客户不允许数据留存怎么办?某个模型变贵或者变弱,系统能不能切走?

也就是说,AI 应用的入口,正在从“选模型”变成“选路由”。

以前接 AI,像是在押一个主力模型

过去两年,很多 AI 应用的架构其实很朴素:选一个主力模型,然后围绕它把产品做出来。

押 OpenAI,就围绕 GPT API 设计提示词、上下文和成本。押 Anthropic,就围绕 Claude 的长上下文、写作能力或代码能力来做体验。偏开源路线,就在 Llama、Qwen、Mistral、DeepSeek 这些模型里选一个部署方案。

早期这样做没问题。很多产品本质上就是“一个模型加一个界面”:用户输入一句话,模型返回一段内容。模型差距足够大时,选对模型就能把体验拉起来。

麻烦出现在产品长大以后。

比如,一个客服产品可能发现,八成请求用便宜模型就够了,但少数高价值客户的问题必须交给更强模型。一个编程工具可能发现,A 模型写代码更稳,B 模型解释报错更清楚,C 模型便宜到适合做批处理。再比如,某个供应商今天延迟突然飙升,或者晚上高峰期开始限流,产品不能跟着一起卡住。

成本也会改变心态。每月几百美元模型账单时,大家更在意上线速度;一旦账单涨到几万美元,模型调用就不再是可以忽略的小开销。你会开始追问:哪些请求真的需要强模型?哪些请求可以降级?哪些功能在偷偷烧钱?

这时,真正的问题已经不是“哪个模型最强”,而是能不能把模型当成一组可调度、可替换、可观察的资源来管理。

OpenRouter 这类平台的机会,就出现在这个转折点上。

OpenRouter 位于应用与多个模型供应商之间,承担路由、成本、延迟、故障切换和合规控制

OpenRouter 不只是“模型超市”

从外面看,OpenRouter 很容易被理解成一个模型超市:一个接口,接很多模型,开发者不用分别注册一堆账号。

这个理解没错,但太浅。

在 B 轮融资公告里,OpenRouter 把自己放在应用、Agent 和模型提供商之间。它强调的能力不是“模型数量多”这么简单,而是路由、可靠性、成本优化、合规、企业 workspace、费用管理、guardrails、零数据保留、供应商级故障切换、质量感知路由。

这些词有点枯燥,但它们恰恰是生产环境里最真实的问题。

一个 Demo 只需要能调通模型。一个要收钱、要签企业客户、要稳定运行的 AI 应用,需要知道每一次请求去了哪里,花了多少钱,失败了怎么处理,日志能不能审计,数据会不会被保留,客户要求换供应商时能不能动得了。

这和云服务的发展有点像。刚开始上云时,大家关心的是“有没有机器”。后来系统规模起来,真正每天缠着工程团队的是负载均衡、监控、权限、账单、故障切换、区域部署。服务器当然重要,但只会开服务器还不够。

AI 模型也在走这条路。

模型本身仍然是核心能力,但当模型越来越多、价格越来越复杂、企业要求越来越细,应用和模型之间就需要一层操作台。它不负责把模型变聪明,而是负责决定:这次请求交给谁,出了问题切到谁,成本算到谁头上,以及这条调用链能不能被企业接受。

OpenRouter 想站的位置,大概就是这张操作台。

多模型不会只是过渡阶段

有人可能会说,等最强模型足够强以后,大家直接用最好的那个不就行了?

听起来省事,但真实软件世界很少这样运转。

公司不会因为一家云厂商好用,就永远不考虑备份;不会因为一个支付通道稳定,就完全不准备备用通道;也不会因为一个数据库强大,就把所有场景都塞进去。成熟系统通常都会慢慢长出抽象层,因为业务不喜欢被单点绑住。

AI 模型尤其容易出现这种情况。

一方面,模型能力变化太快。今天某个模型代码能力强,过几周另一个模型可能在长文本、图像理解或工具调用上更划算。模型厂商更新很频繁,能力边界也经常变化。把整个产品体验押在一个模型上,等于把一部分产品路线图交给供应商。

另一方面,不同任务本来就不该用同一个模型。用户意图分类、客服初筛、合同摘要、代码修复、研究报告、后台批处理,对质量、延迟、成本和合规的要求都不一样。用最强模型处理所有请求当然简单,但账单会很难看。

企业客户还会继续增加约束。有的客户不允许数据被训练,有的要求特定地区处理,有的要求供应商白名单,有的要日志留存,有的只关心预算上限。AI 一旦进入企业采购,就不只是模型回答得好不好,还要过采购、法务、安全和财务那几关。

所以,多模型不是“模型还不够强之前的临时方案”。它更像是 AI 应用成熟后的常态。

从 API Key 到 Gateway

很多团队第一次接入 AI,都是从一个 API Key 开始。

拿到 key,写几行 SDK 调用,调一段 prompt,功能上线。这个阶段越简单越好,没必要过度设计。

但真实用户来了以后,代码里的模型调用会慢慢变成一堆散点:这个功能接 OpenAI,那个功能接 Claude,后台任务用了另一个便宜模型;每个地方都有自己的错误处理和重试逻辑;账单来了以后,也很难说清楚到底是谁烧掉的。

再往后,模型升级也开始变麻烦。一个模型换版本,可能影响多个功能;一个供应商出问题,临时切换要改代码;某个客户要求数据不出某个供应商,工程团队还得专门绕一套逻辑。

于是 gateway 或 router 这类中间层会自然长出来。

它大概承担几件事:统一模型调用入口;根据任务、用户等级、成本预算和延迟要求选择模型;主供应商失败时切到备用模型;记录每个功能、团队或客户的消耗;处理数据保留、权限和审计;比较不同模型在真实任务里的表现。

OpenRouter、Vercel AI Gateway、LiteLLM、自建代理层,都是这类需求的不同解法。

区别不在于谁“绝对更好”,而在于团队想把控制权放在哪里。

OpenRouter 这样的托管平台,优势是快。模型多,接入省事,不用自己维护一堆供应商适配。Vercel AI Gateway 更贴近前端和应用部署生态。LiteLLM 或自建网关则适合更在意数据、日志、私有化部署和内部控制的团队。

小项目可以直接调 API。产品走到一定规模后,模型调用就不该只是散落在代码里的 SDK 调用。

AI 应用架构从单一 API Key 调用,演进到由 Gateway 或 Router 统一管理多模型、账单、监控和故障切换

投资方阵容透露了什么

OpenRouter 这轮融资的投资方名单值得多看一眼。

除了 CapitalG,里面还有 ServiceNow Ventures、MongoDB Ventures、Snowflake Ventures、Databricks Ventures、NVentures。这些名字背后连接的是企业软件、数据平台、云基础设施和 AI 计算生态。

这不能直接推导出 OpenRouter 会和它们达成具体合作,公告也没有这么承诺。但这至少说明,模型路由已经不只是开发者社区里的便利工具,而开始被企业基础设施玩家看见。

企业为什么会在意这件事?因为它们问的问题通常不浪漫,却很关键。

哪个团队用了多少 tokens?哪个客户的成本最高?请求失败有没有重试和降级?数据会不会被模型供应商保留?新模型上线前有没有灰度和回滚?合同里写的安全承诺,能不能落实到每一次模型调用?

这些问题听起来不像 AI 新闻里的主角,但它们决定 AI 能不能真正进入生产环境。

OpenRouter 的融资叙事,正是把自己放在这组问题中间:不是帮你尝鲜某个新模型,而是帮你管理一套多模型生产系统。

什么样的团队需要模型路由层?

不是每个项目都需要 OpenRouter,也不是每个团队都该立刻搭一层复杂网关。

如果你只是做个人工具、Demo、内部小脚本,直接调用一个模型 API 往往最合适。早期最重要的是把东西做出来,而不是先把架构画得很完整。

但有几种信号出现时,就该认真考虑模型路由层了。

第一,模型账单开始影响毛利。你不再只关心“效果好不好”,还要知道每个功能、每类用户、每个客户到底消耗了多少。否则 AI 功能越受欢迎,财务压力反而越大。

第二,AI 功能已经是核心体验。供应商故障、限流、价格变化不能再只是“等一下就好”。你需要备用模型、重试策略和降级路径。

第三,团队正在同时试多个模型。早期工程师手工切配置还行,后期如果没有统一评估和监控,模型实验很快会变成一堆临时分支。

第四,产品开始进入企业客户。客户一旦关心数据保留、审计、权限、预算和供应商风险,模型调用就变成治理问题。这个时候,路由层不只是工程优化,也会影响销售和交付。

第五,你希望保留谈判空间。系统天然支持多供应商替换,就不会在价格、能力和策略变化上完全被一家模型厂商牵着走。

这也是 OpenRouter 这类平台最实际的价值:它不保证每次调用都更便宜,但它给应用保留了选择权。

别把中间层当成新的神

当然,OpenRouter 不是银弹。

在应用和模型供应商之间增加第三方平台,本身也是一种新依赖。它可以降低你对单个模型的依赖,也可能让你依赖新的路由平台。

这里有几个风险不能忽略。

数据和合规是第一层。模型请求会经过路由平台,企业必须确认数据保留、日志、加密、访问控制和合规承诺是否符合自己的业务要求。OpenRouter 公告里提到了零数据保留等企业能力,但具体到某个行业、某个客户,仍然要一项项看。

调试是第二层。多模型路由越智能,问题排查越麻烦。同一个用户问题,今天走 A 模型,明天走 B 模型,效果变化到底来自模型、prompt、路由策略,还是供应商状态?如果日志和评估没做好,所谓智能路由也可能变成黑盒。

锁定是第三层。平台刚接入时很方便;调用量上来以后,你会越来越依赖它的模型列表、路由规则、账单体系和企业控制台。未来想换走,未必轻松。

所以,更稳妥的态度是:把模型路由层当成架构里的一个可替换组件,而不是新的单点信仰。

这也是为什么有些团队会选择 LiteLLM 或自建网关。它们未必最省事,但能把关键控制面留在自己手里。

最后拼的不是模型名字,而是模型管理能力

我倾向于把未来的 AI 应用调用链看成三层。

底层是模型供应商。OpenAI、Anthropic、Google、Meta、DeepSeek、Mistral、Qwen 等继续竞争模型能力、价格、上下文长度和多模态能力。

中间是路由和治理。OpenRouter、Vercel AI Gateway、LiteLLM、自建网关以及云厂商服务,会围绕这层继续竞争。它们解决的不是“哪个模型最聪明”,而是怎样把一堆模型变成稳定、可控、可审计的生产资源。

最上层才是用户真正看到的应用。客服、编程工具、内容生成、研究助理、企业工作流,用户最终关心的是结果是否稳定、价格是否可接受、出了问题有没有兜底。

普通用户以后可能越来越不关心底层用了哪个模型。就像你使用一个 SaaS 产品时,通常不会在意它跑在哪个云区域、用了哪家数据库。你只关心它快不快、稳不稳、结果好不好。

但对开发者和企业来说,模型选择不会变得不重要。它会从“产品早期选一个模型”,变成“运行过程中持续调度一组模型”。

这才是 OpenRouter 这轮融资最值得看的地方。

它提醒我们,AI 应用开发正在从接入模型,走向管理模型。模型仍然是发动机,但当发动机越来越多,真正影响驾驶体验的,往往是变速箱、仪表盘、维修系统和整套控制链。

最强模型会继续吸引注意力。可真正把 AI 做进生产系统的人,迟早都要回答另一个更朴素的问题:这些模型,谁来管?

参考来源

RSS Feed 使用 Hugo 构建
主题 StackJimmy 设计