Featured image of post 别再只写提示词了:Codex Record & Replay 把“演示一次”变成 Agent 新接口

别再只写提示词了:Codex Record & Replay 把“演示一次”变成 Agent 新接口

OpenAI 给 Codex 加上 Record & Replay,重点不是录宏,而是让 AI Agent 从听你描述流程,变成看你演示一次,再把这段操作沉淀成可复用 Skill。

别再只写提示词了:Codex Record & Replay 把“演示一次”变成 Agent 新接口

OpenAI 最近给 Codex 加了一个新能力,叫 Record & Replay。

公开演示里的用法很直白:你在电脑或浏览器里把一个重复流程做一遍,Codex 记录下来,之后把它变成可以复用的 Skill(技能)。比如填写 YouTube Studio 元数据、上传缩略图、保存私密视频,或者处理报销单、请假申请这类后台操作。

这篇文章基于 OpenAI 的公开视频、社区转述、Reddit 讨论和 X 上的可见线索。我还没有完整实测,所以这里只把它当作一个产品方向来看,不把演示效果当成稳定性背书。

它让我在意的,不是“Codex 又多了一个自动化功能”,而是另一个变化:AI Agent(智能体)的交互入口,可能正在从 Prompt(提示词)转向 Demonstration(示范)。

有些流程,本来就不适合写成提示词

我们已经很习惯用一句话指挥 AI。

“帮我整理这篇文章。”

“把这个页面改成暗色模式。”

“根据这些资料生成一份发布稿。”

这类任务适合用文字描述,因为目标比较抽象,输入和输出也主要是文本。

但很多真实工作不是这样。

比如上传一个视频。你要打开后台,选频道,进上传页,填标题,贴简介,选封面,设置播放列表,改可见性,检查版权提示,最后保存为私密。你当然可以把这些步骤写成一大段提示词,但真实网页不是说明书。按钮位置会变,提示框有时出现有时不出现,字段内容还取决于这次素材。

人自己做的时候不觉得难,因为这些动作已经变成肌肉记忆。难的是把肌肉记忆翻译成一段完整、无歧义、下次还能复用的文字。

Record & Replay 绕开了这一步。

它不要求你先写说明书,而是让你先做一遍。

从提示词描述到演示一次

“演示一次”可能比“描述步骤”更自然

这听起来像录屏,但重点不应该只是记录鼠标点了哪里。

如果只是录点击坐标,那就是老式宏录制。页面一改,脚本就容易坏。

真正有价值的是,Agent 能不能理解你演示背后的意图:哪个字段来自当前素材,哪个步骤每次固定,哪个地方要根据任务变化,哪里需要停下来检查结果。

这也是它和传统 RPA(机器人流程自动化)不太一样的地方。RPA 更像把一套稳定后台操作固化成脚本。Record & Replay 如果做得好,更像是把一次示范变成一段可调整的工作流。下次素材不同,Agent 不是机械复刻每一个点击,而是按同一个目标完成相似任务。

这个门槛低很多。

以前你想自动化一个流程,可能要会脚本、API、浏览器自动化,至少也要懂一点 n8n、Zapier 或 Playwright。现在的入口更接近普通人的直觉:我先做一次,你以后照这个模式做。

Skill 写规则,Replay 记动作

过去半年,很多人开始讨论 Agent Skills。

Skill 的价值,是把一套流程写下来。比如文章怎么检查,公众号怎么排版,代码改完要跑哪些命令,哪些动作必须人工确认。它适合保存规则、约束、检查清单和判断标准。

Record & Replay 保存的是另一种东西:操作路径。

比如怎么进入某个后台页面,怎么上传素材,怎么在几个下拉框之间选择,怎么处理常见弹窗。这些用文字写起来很啰嗦,但演示一次很自然。

所以我更愿意把两者看成互补关系。

Skill 负责告诉 Agent “做事的规矩”,Replay 负责告诉 Agent “这件事通常怎么操作”。

拿内容创作者来说,完整流程可能是这样:用 Skill 规定文章结构、标题风格和参考来源格式;用 Record & Replay 录下后台发布流程;最后让 Agent 根据今天的素材生成文章、检查格式、进入后台、填内容、上传封面,然后等你最后确认。

这时 Prompt 不会消失,但它不再承担所有细节。你只需要说:“用昨天那个发布流程,把这篇文章存成草稿,封面用第二张,先不要群发。”

复杂部分已经沉淀在 Skill 和演示记录里。

Skill 写规则,Replay 记动作

普通人可能更需要它

开发者容易低估这件事,因为开发者本来就会写脚本。

一个流程每天重复,你可以写 CLI,可以调 API,可以用 Playwright,也可以接 GitHub Actions。多数人不会这么做。他们只是打开浏览器,一步一步点。哪怕每天都重复,也只是熟练一点,并没有自动化。

“演示一次”把自动化入口放回了普通人的操作习惯里。

自媒体发布、短视频上传、客服后台处理、发票录入、数据导出、CRM 更新、内部系统填报,这些事情单次看都不大,但重复次数多了很烦。过去它们卡在一个尴尬位置:太碎,不值得专门找工程师;太频繁,又足够消耗人。

Record & Replay 这类能力如果成熟,最先吃掉的可能就是这块灰色地带。

风险不会因为“演示过”就消失

当然,让 Agent 看你操作一次,不等于以后就可以放心交给它。

最先要看的还是权限。演示流程里可能包含账号后台、客户数据、付款页面、内部文档。哪些动作可以自动做,哪些动作必须确认,哪些字段不能外发,哪些页面不能录制,不能靠用户自己记。

误触也是问题。保存、发布、删除、提交、发送、确认付款,很多按钮长得很像。Agent 如果把“保存草稿”做成“直接发布”,就不是多跑一次脚本那么简单。

网页变化也麻烦。后台今天长这样,下周可能改版。按钮文案、页面层级、加载顺序、权限弹窗都会变。好的 Record & Replay 不应该硬点到底,而应该在不确定时停下来问人。

还有隐私。演示记录本身就是敏感资产。它可能暴露你怎么进入后台、哪些字段固定填写、哪个账号负责审核。对企业来说,这些记录需要像凭据和自动化脚本一样管理。

所以 X 上有人提到 Computer Use(电脑使用)开关和区域可用性限制,并不意外。越靠近真实电脑操作,权限、审计和合规就越不能放到后面再补。

Prompt 不会消失,只是不用再背所有细节

我不觉得 Record & Replay 会让 Prompt 过时。

临时问题、一次性任务、抽象讨论、写作推理,还是文字最快。但在重复流程里,Prompt 的位置会变。它更像任务入口,而不是一本临时写出来的操作手册。

你不会每次都对同事从头解释“怎么登录后台、怎么进入发布页、每个字段在哪里”。你只会说:“按上次那个流程发,今天标题换成这个,封面用第二张,先存草稿别发布。”

Agent 也会往这个方向走。

它不该每次都靠一段巨长提示词临时理解世界。更合理的做法,是让它记住你的流程、工具和操作习惯,同时在关键风险点停下来让你确认。

Record & Replay 真正值得关注的地方,不是它能不能替你点几下鼠标,而是它把“会做事”从文字说明里拆出来,变成一种可以录制、复用、审查和改进的资产。

结语

AI Agent 的入口正在变多。

聊天框是一种入口,命令行是一种入口,IDE 是一种入口,手机审批也是一种入口。Record & Replay 代表的是另一种入口:示范。

Prompt 负责表达目标,Demonstration 负责传递过程。

前者告诉 Agent “我要什么”,后者告诉 Agent “我通常怎么做”。

如果这条路走通,普通人使用 Agent 的方式会更像日常带新人:先做一次给它看,然后让它接手重复部分,在关键节点叫你确认。

到那时,真正有价值的可能不是某一次对话,而是你慢慢沉淀下来的流程库。里面有文字规则,也有操作示范;有检查清单,也有后台动作。

这就是 Record & Replay 值得关注的地方。它不是给 Codex 加了一个小按钮,而是在提醒我们:Agent 时代的“编程”,可能也会发生在你每一次认真完成的示范里。

参考来源

以上来源用于观察产品发布口径和社区反馈,不等同于独立功能评测。Record & Replay 的真实稳定性、权限边界和跨页面适应能力,仍需要在实际使用中验证。

RSS Feed 使用 Hugo 构建
主题 StackJimmy 设计