Pager 5 - 奇诺分享 | 重在分享

GLM 5.2 击败 Claude？国产模型出海的新战场，不是聊天框

Semgrep 在 IDOR 安全基准中发现，智谱 GLM 5.2 用裸提示词跑出 39% F1，超过 Claude Code 的 32%，但仍低于 Semgrep 自家带 Harness 的多模态管线。真正值得关注的不是谁赢了榜单，而是国产开权重模型开始进入安全扫描、代码审计这类高信任工作流。

DeepSeek 开源 DSpark：投机解码不用再二选一，V4 推理提速 60–85%

DeepSeek 开源 DSpark，一个投机解码框架，用"并行骨架 + 串行小头"打破草稿模型快与准的取舍，再配合负载感知调度，让 DeepSeek-V4 在等吞吐下每用户生成提速 60–85%。本文拆解它的两个关键设计，以及和 MTP 的关系。

AI

阿里被指 2.5 万账号工业化蒸馏 Claude：蒸馏战为什么升级成了国家议题

Anthropic 给美国参议院写信，指控阿里用近 2.5 万个账号、2880 万次对话工业化蒸馏 Claude。这一次蒸馏争议和马斯克那次完全不同，它被绑上了总统令、芯片管制和 Mythos 这种被当成战略武器的能力。

终端里的 AI Agent，终于开始长出 IDE 的眼睛

GitHub Copilot CLI 接入 LSP，看起来只是一个开发工具小更新，实质上却暴露了 AI 编程工具的下一道门槛：Agent 不能只靠 grep 和上下文窗口猜代码，它需要接入语言服务器、编译器、测试和运行时这些真实的工程感官。

CHAP 出现了：AI Agent 终于开始需要“协作协议”

CHAP 不是又一个提示词技巧，而是在回答一个更麻烦的问题：当人和多个 Agent 一起做真实工作时，任务、修改、批准、上下文和责任应该如何被记录、查询和复盘。

1 … 4 5 6 … 37