一个通用推理模型接收问题陈述,独立产出完整证明,推翻了 Erdős 1946 年猜想。它与 AlphaProof、AlphaGeometry 的本质区别在哪,这次突破到底意味着什么。
GitHub 今日热门项目 andrej-karpathy-skills 是一个单文件 CLAUDE.md,把 Karpathy 对 LLM 编程问题的观察压缩成可直接复制的 Claude Code 配置。这篇文章解释它有什么、为什么有效,以及怎么用到你自己的项目里。
OpenAI 宣布把 Google DeepMind 的 SynthID 水印接入 AI 生成图像,并继续支持 C2PA 与公开验证工具。这不是一次普通功能更新,而是 AI 内容溯源从“各家自证”走向公共基础设施的信号。
AI 生码率看起来最容易衡量,却可能是企业 AI 提效里最危险的指标。真正该被度量的不是 AI 生成了多少代码,而是交付周期、缺陷率、返工成本和知识流动有没有发生变化。
Anthropic 的长任务 Agent 实验说明,AI 编程的瓶颈正在从“怎么提示模型”转向“怎么给模型设计反馈、验证和约束系统”。