Semgrep 在 IDOR 安全基准中发现,智谱 GLM 5.2 用裸提示词跑出 39% F1,超过 Claude Code 的 32%,但仍低于 Semgrep 自家带 Harness 的多模态管线。真正值得关注的不是谁赢了榜单,而是国产开权重模型开始进入安全扫描、代码审计这类高信任工作流。
DeepSeek 开源 DSpark,一个投机解码框架,用"并行骨架 + 串行小头"打破草稿模型快与准的取舍,再配合负载感知调度,让 DeepSeek-V4 在等吞吐下每用户生成提速 60–85%。本文拆解它的两个关键设计,以及和 MTP 的关系。
Anthropic 给美国参议院写信,指控阿里用近 2.5 万个账号、2880 万次对话工业化蒸馏 Claude。这一次蒸馏争议和马斯克那次完全不同,它被绑上了总统令、芯片管制和 Mythos 这种被当成战略武器的能力。
GitHub Copilot CLI 接入 LSP,看起来只是一个开发工具小更新,实质上却暴露了 AI 编程工具的下一道门槛:Agent 不能只靠 grep 和上下文窗口猜代码,它需要接入语言服务器、编译器、测试和运行时这些真实的工程感官。
CHAP 不是又一个提示词技巧,而是在回答一个更麻烦的问题:当人和多个 Agent 一起做真实工作时,任务、修改、批准、上下文和责任应该如何被记录、查询和复盘。