OpenRouter 完成 1.13 亿美元 B 轮融资,真正值得看的不是融资金额,而是多模型时代的应用架构变化。开发者不再只需要一个最强模型,而是需要一层能处理价格、延迟、故障切换、合规和供应商替换的模型路由基础设施。
腾讯混元 Hy-Memory 把 Agent 的长期协作问题说得很直白:第一周像思考伙伴,第三周退化成查询工具。真正需要被保存的不是聊天记录,而是判断因果、偏好变化和任务轨迹。
微软宣布 6 月 30 日前取消大多数工程师的 Claude Code 许可,六个月前他们还在大规模推广。真正的原因不是工具不好用,而恰恰是因为太好用——Token 消耗型计费和企业固定预算之间,有一道根本填不平的裂缝。
Agent Harness 之所以突然变热,不是因为又发明了一个新名词,而是 AI Agent 已经从演示阶段进入生产阶段,真正的瓶颈开始转向上下文、权限、评估、日志和回滚。
当 Agent 不再只是回答一次问题,而是连续工作数小时甚至数天时,真正限制它的可能不是上下文长度,而是缺少一种像睡眠一样整理经验、压缩状态、恢复注意力的机制。