别再只写提示词了：Codex Record & Replay 把“演示一次”变成 Agent 新接口

OpenAI 最近给 Codex 加了一个新能力，叫 Record & Replay。

公开演示里的用法很直白：你在电脑或浏览器里把一个重复流程做一遍，Codex 记录下来，之后把它变成可以复用的 Skill（技能）。比如填写 YouTube Studio 元数据、上传缩略图、保存私密视频，或者处理报销单、请假申请这类后台操作。

这篇文章基于 OpenAI 的公开视频、社区转述、Reddit 讨论和 X 上的可见线索。我还没有完整实测，所以这里只把它当作一个产品方向来看，不把演示效果当成稳定性背书。

它让我在意的，不是“Codex 又多了一个自动化功能”，而是另一个变化：AI Agent（智能体）的交互入口，可能正在从 Prompt（提示词）转向 Demonstration（示范）。

有些流程，本来就不适合写成提示词

我们已经很习惯用一句话指挥 AI。

“帮我整理这篇文章。”

“把这个页面改成暗色模式。”

“根据这些资料生成一份发布稿。”

这类任务适合用文字描述，因为目标比较抽象，输入和输出也主要是文本。

但很多真实工作不是这样。

比如上传一个视频。你要打开后台，选频道，进上传页，填标题，贴简介，选封面，设置播放列表，改可见性，检查版权提示，最后保存为私密。你当然可以把这些步骤写成一大段提示词，但真实网页不是说明书。按钮位置会变，提示框有时出现有时不出现，字段内容还取决于这次素材。

人自己做的时候不觉得难，因为这些动作已经变成肌肉记忆。难的是把肌肉记忆翻译成一段完整、无歧义、下次还能复用的文字。

Record & Replay 绕开了这一步。

它不要求你先写说明书，而是让你先做一遍。

从提示词描述到演示一次

“演示一次”可能比“描述步骤”更自然

这听起来像录屏，但重点不应该只是记录鼠标点了哪里。

如果只是录点击坐标，那就是老式宏录制。页面一改，脚本就容易坏。

真正有价值的是，Agent 能不能理解你演示背后的意图：哪个字段来自当前素材，哪个步骤每次固定，哪个地方要根据任务变化，哪里需要停下来检查结果。

这也是它和传统 RPA（机器人流程自动化）不太一样的地方。RPA 更像把一套稳定后台操作固化成脚本。Record & Replay 如果做得好，更像是把一次示范变成一段可调整的工作流。下次素材不同，Agent 不是机械复刻每一个点击，而是按同一个目标完成相似任务。

这个门槛低很多。

以前你想自动化一个流程，可能要会脚本、API、浏览器自动化，至少也要懂一点 n8n、Zapier 或 Playwright。现在的入口更接近普通人的直觉：我先做一次，你以后照这个模式做。

Skill 写规则，Replay 记动作

过去半年，很多人开始讨论 Agent Skills。

Skill 的价值，是把一套流程写下来。比如文章怎么检查，公众号怎么排版，代码改完要跑哪些命令，哪些动作必须人工确认。它适合保存规则、约束、检查清单和判断标准。

Record & Replay 保存的是另一种东西：操作路径。

比如怎么进入某个后台页面，怎么上传素材，怎么在几个下拉框之间选择，怎么处理常见弹窗。这些用文字写起来很啰嗦，但演示一次很自然。

所以我更愿意把两者看成互补关系。

Skill 负责告诉 Agent “做事的规矩”，Replay 负责告诉 Agent “这件事通常怎么操作”。

拿内容创作者来说，完整流程可能是这样：用 Skill 规定文章结构、标题风格和参考来源格式；用 Record & Replay 录下后台发布流程；最后让 Agent 根据今天的素材生成文章、检查格式、进入后台、填内容、上传封面，然后等你最后确认。

这时 Prompt 不会消失，但它不再承担所有细节。你只需要说：“用昨天那个发布流程，把这篇文章存成草稿，封面用第二张，先不要群发。”

复杂部分已经沉淀在 Skill 和演示记录里。

Skill 写规则，Replay 记动作

普通人可能更需要它

开发者容易低估这件事，因为开发者本来就会写脚本。

一个流程每天重复，你可以写 CLI，可以调 API，可以用 Playwright，也可以接 GitHub Actions。多数人不会这么做。他们只是打开浏览器，一步一步点。哪怕每天都重复，也只是熟练一点，并没有自动化。

“演示一次”把自动化入口放回了普通人的操作习惯里。

自媒体发布、短视频上传、客服后台处理、发票录入、数据导出、CRM 更新、内部系统填报，这些事情单次看都不大，但重复次数多了很烦。过去它们卡在一个尴尬位置：太碎，不值得专门找工程师；太频繁，又足够消耗人。

Record & Replay 这类能力如果成熟，最先吃掉的可能就是这块灰色地带。

风险不会因为“演示过”就消失

当然，让 Agent 看你操作一次，不等于以后就可以放心交给它。

最先要看的还是权限。演示流程里可能包含账号后台、客户数据、付款页面、内部文档。哪些动作可以自动做，哪些动作必须确认，哪些字段不能外发，哪些页面不能录制，不能靠用户自己记。

误触也是问题。保存、发布、删除、提交、发送、确认付款，很多按钮长得很像。Agent 如果把“保存草稿”做成“直接发布”，就不是多跑一次脚本那么简单。

网页变化也麻烦。后台今天长这样，下周可能改版。按钮文案、页面层级、加载顺序、权限弹窗都会变。好的 Record & Replay 不应该硬点到底，而应该在不确定时停下来问人。

还有隐私。演示记录本身就是敏感资产。它可能暴露你怎么进入后台、哪些字段固定填写、哪个账号负责审核。对企业来说，这些记录需要像凭据和自动化脚本一样管理。

所以 X 上有人提到 Computer Use（电脑使用）开关和区域可用性限制，并不意外。越靠近真实电脑操作，权限、审计和合规就越不能放到后面再补。

Prompt 不会消失，只是不用再背所有细节

我不觉得 Record & Replay 会让 Prompt 过时。

临时问题、一次性任务、抽象讨论、写作推理，还是文字最快。但在重复流程里，Prompt 的位置会变。它更像任务入口，而不是一本临时写出来的操作手册。

你不会每次都对同事从头解释“怎么登录后台、怎么进入发布页、每个字段在哪里”。你只会说：“按上次那个流程发，今天标题换成这个，封面用第二张，先存草稿别发布。”

Agent 也会往这个方向走。

它不该每次都靠一段巨长提示词临时理解世界。更合理的做法，是让它记住你的流程、工具和操作习惯，同时在关键风险点停下来让你确认。

Record & Replay 真正值得关注的地方，不是它能不能替你点几下鼠标，而是它把“会做事”从文字说明里拆出来，变成一种可以录制、复用、审查和改进的资产。

结语

AI Agent 的入口正在变多。

聊天框是一种入口，命令行是一种入口，IDE 是一种入口，手机审批也是一种入口。Record & Replay 代表的是另一种入口：示范。

Prompt 负责表达目标，Demonstration 负责传递过程。

前者告诉 Agent “我要什么”，后者告诉 Agent “我通常怎么做”。

如果这条路走通，普通人使用 Agent 的方式会更像日常带新人：先做一次给它看，然后让它接手重复部分，在关键节点叫你确认。

到那时，真正有价值的可能不是某一次对话，而是你慢慢沉淀下来的流程库。里面有文字规则，也有操作示范；有检查清单，也有后台动作。

这就是 Record & Replay 值得关注的地方。它不是给 Codex 加了一个小按钮，而是在提醒我们：Agent 时代的“编程”，可能也会发生在你每一次认真完成的示范里。

参考来源

以上来源用于观察产品发布口径和社区反馈，不等同于独立功能评测。Record & Replay 的真实稳定性、权限边界和跨页面适应能力，仍需要在实际使用中验证。