Featured image of post GLM 5.2 击败 Claude?国产模型出海的新战场,不是聊天框

GLM 5.2 击败 Claude?国产模型出海的新战场,不是聊天框

Semgrep 在 IDOR 安全基准中发现,智谱 GLM 5.2 用裸提示词跑出 39% F1,超过 Claude Code 的 32%,但仍低于 Semgrep 自家带 Harness 的多模态管线。真正值得关注的不是谁赢了榜单,而是国产开权重模型开始进入安全扫描、代码审计这类高信任工作流。

Featured image of post 终端里的 AI Agent,终于开始长出 IDE 的眼睛

终端里的 AI Agent,终于开始长出 IDE 的眼睛

GitHub Copilot CLI 接入 LSP,看起来只是一个开发工具小更新,实质上却暴露了 AI 编程工具的下一道门槛:Agent 不能只靠 grep 和上下文窗口猜代码,它需要接入语言服务器、编译器、测试和运行时这些真实的工程感官。