<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>AI应用开发 on 奇诺分享 | 重在分享</title>
        <link>https://blog.ccino.org/tags/ai%E5%BA%94%E7%94%A8%E5%BC%80%E5%8F%91/</link>
        <description>Recent content in AI应用开发 on 奇诺分享 | 重在分享</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language>
        <lastBuildDate>Sun, 31 May 2026 09:00:00 +0800</lastBuildDate><atom:link href="https://blog.ccino.org/tags/ai%E5%BA%94%E7%94%A8%E5%BC%80%E5%8F%91/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>OpenRouter 融了 1.13 亿美元：AI 应用的入口，正在从“选模型”变成“选路由”</title>
        <link>https://blog.ccino.org/p/openrouter-model-routing-infra/</link>
        <pubDate>Sun, 31 May 2026 09:00:00 +0800</pubDate>
        
        <guid>https://blog.ccino.org/p/openrouter-model-routing-infra/</guid>
        <description>&lt;img src="https://blog.ccino.org/p/openrouter-model-routing-infra/imgs/cover.png" alt="Featured image of post OpenRouter 融了 1.13 亿美元：AI 应用的入口，正在从“选模型”变成“选路由”" /&gt;&lt;p&gt;OpenRouter 刚完成 1.13 亿美元 B 轮融资。&lt;/p&gt;
&lt;p&gt;公告里写得很漂亮：CapitalG 领投，NVentures、ServiceNow Ventures、MongoDB Ventures、Snowflake Ventures、Databricks Ventures 等参投；过去六个月，平台周处理量从 5 万亿 tokens 增长到 25 万亿 tokens；OpenRouter 称自己服务 800 万以上开发者，覆盖 400 多个模型。&lt;/p&gt;
&lt;p&gt;这条新闻也上了 Hacker News 首页。当前条目显示，它拿到了 342 points 和 166 comments。一个模型调用基础设施产品能有这个讨论度，已经说明它不只是开发者圈里的小工具了。&lt;/p&gt;
&lt;p&gt;不过，如果只把这件事写成“又一家 AI 公司融了大钱”，就有点浪费了。&lt;/p&gt;
&lt;p&gt;我更关心的是另一个问题：为什么现在是 OpenRouter？为什么一个站在应用和模型之间、做聚合、路由、账单和故障切换的平台，会突然变得这么有价值？&lt;/p&gt;
&lt;p&gt;答案可能不在融资金额里，而在 AI 应用开发的日常麻烦里。&lt;/p&gt;
&lt;p&gt;过去大家做 AI 产品，第一反应往往是选模型：用 GPT，还是 Claude？用 Gemini，还是开源模型？但到了生产环境，问题会慢慢变成另一种样子：这个请求该走哪个模型？如果供应商限流怎么办？成本超预算怎么办？企业客户不允许数据留存怎么办？某个模型变贵或者变弱，系统能不能切走？&lt;/p&gt;
&lt;p&gt;也就是说，AI 应用的入口，正在从“选模型”变成“选路由”。&lt;/p&gt;
&lt;h2 id=&#34;以前接-ai像是在押一个主力模型&#34;&gt;以前接 AI，像是在押一个主力模型
&lt;/h2&gt;&lt;p&gt;过去两年，很多 AI 应用的架构其实很朴素：选一个主力模型，然后围绕它把产品做出来。&lt;/p&gt;
&lt;p&gt;押 OpenAI，就围绕 GPT API 设计提示词、上下文和成本。押 Anthropic，就围绕 Claude 的长上下文、写作能力或代码能力来做体验。偏开源路线，就在 Llama、Qwen、Mistral、DeepSeek 这些模型里选一个部署方案。&lt;/p&gt;
&lt;p&gt;早期这样做没问题。很多产品本质上就是“一个模型加一个界面”：用户输入一句话，模型返回一段内容。模型差距足够大时，选对模型就能把体验拉起来。&lt;/p&gt;
&lt;p&gt;麻烦出现在产品长大以后。&lt;/p&gt;
&lt;p&gt;比如，一个客服产品可能发现，八成请求用便宜模型就够了，但少数高价值客户的问题必须交给更强模型。一个编程工具可能发现，A 模型写代码更稳，B 模型解释报错更清楚，C 模型便宜到适合做批处理。再比如，某个供应商今天延迟突然飙升，或者晚上高峰期开始限流，产品不能跟着一起卡住。&lt;/p&gt;
&lt;p&gt;成本也会改变心态。每月几百美元模型账单时，大家更在意上线速度；一旦账单涨到几万美元，模型调用就不再是可以忽略的小开销。你会开始追问：哪些请求真的需要强模型？哪些请求可以降级？哪些功能在偷偷烧钱？&lt;/p&gt;
&lt;p&gt;这时，真正的问题已经不是“哪个模型最强”，而是能不能把模型当成一组可调度、可替换、可观察的资源来管理。&lt;/p&gt;
&lt;p&gt;OpenRouter 这类平台的机会，就出现在这个转折点上。&lt;/p&gt;
&lt;p&gt;&lt;img src=&#34;https://blog.ccino.org/p/openrouter-model-routing-infra/imgs/model-routing-layer.png&#34;
	width=&#34;1536&#34;
	height=&#34;864&#34;
	srcset=&#34;https://blog.ccino.org/p/openrouter-model-routing-infra/imgs/model-routing-layer_hu_cba2d105c90894bf.png 480w, https://blog.ccino.org/p/openrouter-model-routing-infra/imgs/model-routing-layer_hu_1e3cdafa1b7d71ff.png 1024w&#34;
	loading=&#34;lazy&#34;
	
		alt=&#34;OpenRouter 位于应用与多个模型供应商之间，承担路由、成本、延迟、故障切换和合规控制&#34;
	
	
		class=&#34;gallery-image&#34; 
		data-flex-grow=&#34;177&#34;
		data-flex-basis=&#34;426px&#34;
	
&gt;&lt;/p&gt;
&lt;h2 id=&#34;openrouter-不只是模型超市&#34;&gt;OpenRouter 不只是“模型超市”
&lt;/h2&gt;&lt;p&gt;从外面看，OpenRouter 很容易被理解成一个模型超市：一个接口，接很多模型，开发者不用分别注册一堆账号。&lt;/p&gt;
&lt;p&gt;这个理解没错，但太浅。&lt;/p&gt;
&lt;p&gt;在 B 轮融资公告里，OpenRouter 把自己放在应用、Agent 和模型提供商之间。它强调的能力不是“模型数量多”这么简单，而是路由、可靠性、成本优化、合规、企业 workspace、费用管理、guardrails、零数据保留、供应商级故障切换、质量感知路由。&lt;/p&gt;
&lt;p&gt;这些词有点枯燥，但它们恰恰是生产环境里最真实的问题。&lt;/p&gt;
&lt;p&gt;一个 Demo 只需要能调通模型。一个要收钱、要签企业客户、要稳定运行的 AI 应用，需要知道每一次请求去了哪里，花了多少钱，失败了怎么处理，日志能不能审计，数据会不会被保留，客户要求换供应商时能不能动得了。&lt;/p&gt;
&lt;p&gt;这和云服务的发展有点像。刚开始上云时，大家关心的是“有没有机器”。后来系统规模起来，真正每天缠着工程团队的是负载均衡、监控、权限、账单、故障切换、区域部署。服务器当然重要，但只会开服务器还不够。&lt;/p&gt;
&lt;p&gt;AI 模型也在走这条路。&lt;/p&gt;
&lt;p&gt;模型本身仍然是核心能力，但当模型越来越多、价格越来越复杂、企业要求越来越细，应用和模型之间就需要一层操作台。它不负责把模型变聪明，而是负责决定：这次请求交给谁，出了问题切到谁，成本算到谁头上，以及这条调用链能不能被企业接受。&lt;/p&gt;
&lt;p&gt;OpenRouter 想站的位置，大概就是这张操作台。&lt;/p&gt;
&lt;h2 id=&#34;多模型不会只是过渡阶段&#34;&gt;多模型不会只是过渡阶段
&lt;/h2&gt;&lt;p&gt;有人可能会说，等最强模型足够强以后，大家直接用最好的那个不就行了？&lt;/p&gt;
&lt;p&gt;听起来省事，但真实软件世界很少这样运转。&lt;/p&gt;
&lt;p&gt;公司不会因为一家云厂商好用，就永远不考虑备份；不会因为一个支付通道稳定，就完全不准备备用通道；也不会因为一个数据库强大，就把所有场景都塞进去。成熟系统通常都会慢慢长出抽象层，因为业务不喜欢被单点绑住。&lt;/p&gt;
&lt;p&gt;AI 模型尤其容易出现这种情况。&lt;/p&gt;
&lt;p&gt;一方面，模型能力变化太快。今天某个模型代码能力强，过几周另一个模型可能在长文本、图像理解或工具调用上更划算。模型厂商更新很频繁，能力边界也经常变化。把整个产品体验押在一个模型上，等于把一部分产品路线图交给供应商。&lt;/p&gt;
&lt;p&gt;另一方面，不同任务本来就不该用同一个模型。用户意图分类、客服初筛、合同摘要、代码修复、研究报告、后台批处理，对质量、延迟、成本和合规的要求都不一样。用最强模型处理所有请求当然简单，但账单会很难看。&lt;/p&gt;
&lt;p&gt;企业客户还会继续增加约束。有的客户不允许数据被训练，有的要求特定地区处理，有的要求供应商白名单，有的要日志留存，有的只关心预算上限。AI 一旦进入企业采购，就不只是模型回答得好不好，还要过采购、法务、安全和财务那几关。&lt;/p&gt;
&lt;p&gt;所以，多模型不是“模型还不够强之前的临时方案”。它更像是 AI 应用成熟后的常态。&lt;/p&gt;
&lt;h2 id=&#34;从-api-key-到-gateway&#34;&gt;从 API Key 到 Gateway
&lt;/h2&gt;&lt;p&gt;很多团队第一次接入 AI，都是从一个 API Key 开始。&lt;/p&gt;
&lt;p&gt;拿到 key，写几行 SDK 调用，调一段 prompt，功能上线。这个阶段越简单越好，没必要过度设计。&lt;/p&gt;
&lt;p&gt;但真实用户来了以后，代码里的模型调用会慢慢变成一堆散点：这个功能接 OpenAI，那个功能接 Claude，后台任务用了另一个便宜模型；每个地方都有自己的错误处理和重试逻辑；账单来了以后，也很难说清楚到底是谁烧掉的。&lt;/p&gt;
&lt;p&gt;再往后，模型升级也开始变麻烦。一个模型换版本，可能影响多个功能；一个供应商出问题，临时切换要改代码；某个客户要求数据不出某个供应商，工程团队还得专门绕一套逻辑。&lt;/p&gt;
&lt;p&gt;于是 gateway 或 router 这类中间层会自然长出来。&lt;/p&gt;
&lt;p&gt;它大概承担几件事：统一模型调用入口；根据任务、用户等级、成本预算和延迟要求选择模型；主供应商失败时切到备用模型；记录每个功能、团队或客户的消耗；处理数据保留、权限和审计；比较不同模型在真实任务里的表现。&lt;/p&gt;
&lt;p&gt;OpenRouter、Vercel AI Gateway、LiteLLM、自建代理层，都是这类需求的不同解法。&lt;/p&gt;
&lt;p&gt;区别不在于谁“绝对更好”，而在于团队想把控制权放在哪里。&lt;/p&gt;
&lt;p&gt;OpenRouter 这样的托管平台，优势是快。模型多，接入省事，不用自己维护一堆供应商适配。Vercel AI Gateway 更贴近前端和应用部署生态。LiteLLM 或自建网关则适合更在意数据、日志、私有化部署和内部控制的团队。&lt;/p&gt;
&lt;p&gt;小项目可以直接调 API。产品走到一定规模后，模型调用就不该只是散落在代码里的 SDK 调用。&lt;/p&gt;
&lt;p&gt;&lt;img src=&#34;https://blog.ccino.org/p/openrouter-model-routing-infra/imgs/api-to-gateway.png&#34;
	width=&#34;1536&#34;
	height=&#34;864&#34;
	srcset=&#34;https://blog.ccino.org/p/openrouter-model-routing-infra/imgs/api-to-gateway_hu_47c01dd53742b0cd.png 480w, https://blog.ccino.org/p/openrouter-model-routing-infra/imgs/api-to-gateway_hu_9088fbb979fb784a.png 1024w&#34;
	loading=&#34;lazy&#34;
	
		alt=&#34;AI 应用架构从单一 API Key 调用，演进到由 Gateway 或 Router 统一管理多模型、账单、监控和故障切换&#34;
	
	
		class=&#34;gallery-image&#34; 
		data-flex-grow=&#34;177&#34;
		data-flex-basis=&#34;426px&#34;
	
&gt;&lt;/p&gt;
&lt;h2 id=&#34;投资方阵容透露了什么&#34;&gt;投资方阵容透露了什么
&lt;/h2&gt;&lt;p&gt;OpenRouter 这轮融资的投资方名单值得多看一眼。&lt;/p&gt;
&lt;p&gt;除了 CapitalG，里面还有 ServiceNow Ventures、MongoDB Ventures、Snowflake Ventures、Databricks Ventures、NVentures。这些名字背后连接的是企业软件、数据平台、云基础设施和 AI 计算生态。&lt;/p&gt;
&lt;p&gt;这不能直接推导出 OpenRouter 会和它们达成具体合作，公告也没有这么承诺。但这至少说明，模型路由已经不只是开发者社区里的便利工具，而开始被企业基础设施玩家看见。&lt;/p&gt;
&lt;p&gt;企业为什么会在意这件事？因为它们问的问题通常不浪漫，却很关键。&lt;/p&gt;
&lt;p&gt;哪个团队用了多少 tokens？哪个客户的成本最高？请求失败有没有重试和降级？数据会不会被模型供应商保留？新模型上线前有没有灰度和回滚？合同里写的安全承诺，能不能落实到每一次模型调用？&lt;/p&gt;
&lt;p&gt;这些问题听起来不像 AI 新闻里的主角，但它们决定 AI 能不能真正进入生产环境。&lt;/p&gt;
&lt;p&gt;OpenRouter 的融资叙事，正是把自己放在这组问题中间：不是帮你尝鲜某个新模型，而是帮你管理一套多模型生产系统。&lt;/p&gt;
&lt;h2 id=&#34;什么样的团队需要模型路由层&#34;&gt;什么样的团队需要模型路由层？
&lt;/h2&gt;&lt;p&gt;不是每个项目都需要 OpenRouter，也不是每个团队都该立刻搭一层复杂网关。&lt;/p&gt;
&lt;p&gt;如果你只是做个人工具、Demo、内部小脚本，直接调用一个模型 API 往往最合适。早期最重要的是把东西做出来，而不是先把架构画得很完整。&lt;/p&gt;
&lt;p&gt;但有几种信号出现时，就该认真考虑模型路由层了。&lt;/p&gt;
&lt;p&gt;第一，模型账单开始影响毛利。你不再只关心“效果好不好”，还要知道每个功能、每类用户、每个客户到底消耗了多少。否则 AI 功能越受欢迎，财务压力反而越大。&lt;/p&gt;
&lt;p&gt;第二，AI 功能已经是核心体验。供应商故障、限流、价格变化不能再只是“等一下就好”。你需要备用模型、重试策略和降级路径。&lt;/p&gt;
&lt;p&gt;第三，团队正在同时试多个模型。早期工程师手工切配置还行，后期如果没有统一评估和监控，模型实验很快会变成一堆临时分支。&lt;/p&gt;
&lt;p&gt;第四，产品开始进入企业客户。客户一旦关心数据保留、审计、权限、预算和供应商风险，模型调用就变成治理问题。这个时候，路由层不只是工程优化，也会影响销售和交付。&lt;/p&gt;
&lt;p&gt;第五，你希望保留谈判空间。系统天然支持多供应商替换，就不会在价格、能力和策略变化上完全被一家模型厂商牵着走。&lt;/p&gt;
&lt;p&gt;这也是 OpenRouter 这类平台最实际的价值：它不保证每次调用都更便宜，但它给应用保留了选择权。&lt;/p&gt;
&lt;h2 id=&#34;别把中间层当成新的神&#34;&gt;别把中间层当成新的神
&lt;/h2&gt;&lt;p&gt;当然，OpenRouter 不是银弹。&lt;/p&gt;
&lt;p&gt;在应用和模型供应商之间增加第三方平台，本身也是一种新依赖。它可以降低你对单个模型的依赖，也可能让你依赖新的路由平台。&lt;/p&gt;
&lt;p&gt;这里有几个风险不能忽略。&lt;/p&gt;
&lt;p&gt;数据和合规是第一层。模型请求会经过路由平台，企业必须确认数据保留、日志、加密、访问控制和合规承诺是否符合自己的业务要求。OpenRouter 公告里提到了零数据保留等企业能力，但具体到某个行业、某个客户，仍然要一项项看。&lt;/p&gt;
&lt;p&gt;调试是第二层。多模型路由越智能，问题排查越麻烦。同一个用户问题，今天走 A 模型，明天走 B 模型，效果变化到底来自模型、prompt、路由策略，还是供应商状态？如果日志和评估没做好，所谓智能路由也可能变成黑盒。&lt;/p&gt;
&lt;p&gt;锁定是第三层。平台刚接入时很方便；调用量上来以后，你会越来越依赖它的模型列表、路由规则、账单体系和企业控制台。未来想换走，未必轻松。&lt;/p&gt;
&lt;p&gt;所以，更稳妥的态度是：把模型路由层当成架构里的一个可替换组件，而不是新的单点信仰。&lt;/p&gt;
&lt;p&gt;这也是为什么有些团队会选择 LiteLLM 或自建网关。它们未必最省事，但能把关键控制面留在自己手里。&lt;/p&gt;
&lt;h2 id=&#34;最后拼的不是模型名字而是模型管理能力&#34;&gt;最后拼的不是模型名字，而是模型管理能力
&lt;/h2&gt;&lt;p&gt;我倾向于把未来的 AI 应用调用链看成三层。&lt;/p&gt;
&lt;p&gt;底层是模型供应商。OpenAI、Anthropic、Google、Meta、DeepSeek、Mistral、Qwen 等继续竞争模型能力、价格、上下文长度和多模态能力。&lt;/p&gt;
&lt;p&gt;中间是路由和治理。OpenRouter、Vercel AI Gateway、LiteLLM、自建网关以及云厂商服务，会围绕这层继续竞争。它们解决的不是“哪个模型最聪明”，而是怎样把一堆模型变成稳定、可控、可审计的生产资源。&lt;/p&gt;
&lt;p&gt;最上层才是用户真正看到的应用。客服、编程工具、内容生成、研究助理、企业工作流，用户最终关心的是结果是否稳定、价格是否可接受、出了问题有没有兜底。&lt;/p&gt;
&lt;p&gt;普通用户以后可能越来越不关心底层用了哪个模型。就像你使用一个 SaaS 产品时，通常不会在意它跑在哪个云区域、用了哪家数据库。你只关心它快不快、稳不稳、结果好不好。&lt;/p&gt;
&lt;p&gt;但对开发者和企业来说，模型选择不会变得不重要。它会从“产品早期选一个模型”，变成“运行过程中持续调度一组模型”。&lt;/p&gt;
&lt;p&gt;这才是 OpenRouter 这轮融资最值得看的地方。&lt;/p&gt;
&lt;p&gt;它提醒我们，AI 应用开发正在从接入模型，走向管理模型。模型仍然是发动机，但当发动机越来越多，真正影响驾驶体验的，往往是变速箱、仪表盘、维修系统和整套控制链。&lt;/p&gt;
&lt;p&gt;最强模型会继续吸引注意力。可真正把 AI 做进生产系统的人，迟早都要回答另一个更朴素的问题：这些模型，谁来管？&lt;/p&gt;
&lt;h2 id=&#34;参考来源&#34;&gt;参考来源
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://openrouter.ai/announcements/series-b&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;OpenRouter：OpenRouter Raises $113M Series B&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://news.ycombinator.com/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Hacker News：首页 OpenRouter raises $113M Series B 讨论&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
