Karpathy 官宣Vibe Coding时代落幕

Karpathy最近重新提出'Agentic Engineering',强调AI编程应更注重工程约束而非仅依赖AI生成代码。

--91likeyou---

如果你现在还把 AI 编程理解成“把需求丢给模型,然后等它吐出一个能跑的页面”,那我建议你先停一下。

因为它像把一个项目交给一个很会写代码、反应很快、但不一定知道业务后果的人。它能在十分钟里给你一个登录页,也能在你没看懂的地方埋下权限漏洞、状态错乱、数据丢失和后面三个月都还不完的技术债。

Karpathy 最近重新提出 “Agentic engineering” 这个说法,我更愿意把它理解成一个行业提醒:Vibe Coding 没有死在原型阶段,但它确实不再适合作为正式软件开发的主线。AI 编程真正要进入的,不是更会写 prompt 的阶段,而是更会管控 AI 产出的阶段。

这对中国移动互联网从业者尤其重要。因为我们最熟悉的工作方式就是快:快上线、快试错、快复盘、快改版。过去几年,低代码、无代码、AI 生成页面都在满足这种快。但到了今天,问题已经不是“AI 能不能帮我做出来”,而是“做出来之后,谁负责它能不能长期跑下去”。

一、Vibe Coding 到底是什么

Vibe Coding 这个词最早由 Andrej Karpathy 在 2025 年 2 月提出。Merriam-Webster 后来把它解释成一种带有 AI 辅助、但相对“careless”的写代码方式:你告诉 AI 想要什么,让它生成代码,自己不一定理解代码为什么能跑。Collins 也把 “vibe coding” 选为 2025 年年度词汇,说明它已经不只是开发者圈里的梗,而是变成了一个大众可理解的技术现象。

说白了,Vibe Coding 的核心不是“用 AI 写代码”。用 AI 写代码可以很严谨,也可以很专业。Vibe Coding 更接近另一件事:我先不管工程细节,不管架构,不管测试,不管可维护性,我只要把想法尽快变成一个能点、能看、能演示的东西。

这并不丢人。很多产品经理、运营、设计师第一次真正感受到 AI 编程的价值,就是从这里开始的。

比如你想验证一个活动页的转化链路,过去要写需求、排期、等前端,现在你可以让 AI 先搭一个页面;你想做一个内部数据小工具,过去要找研发插空,现在你可以先做出一个粗糙版本;你想把一个脑子里的想法讲给老板或客户看,AI 能让你少在 PPT 里打转,多一点实物感。

Vibe Coding 抬高了很多非技术人的起点。这个判断我不想否认。

但问题也在这里:它让很多人误以为“能跑”就等于“能用”,“能演示”就等于“能上线”,“AI 生成”就等于“少了工程成本”。

其实不是。

二、为什么说 Vibe Coding 的主舞台正在退场

我能核到的公开材料里,Karpathy 在 2026 年 2 月的一周年回顾中表达得很清楚:一年前,LLM 能力还比较低,Vibe Coding 主要适合好玩的、一次性的项目、Demo 和探索;一年后,专业开发正在越来越多地通过 LLM agents 完成,但需要更多监督和审查。他给这个新阶段起了一个自己更喜欢的名字:agentic engineering。

注意,这里有一个很关键的变化。

过去的 Vibe Coding 是“我和 AI 聊,AI 给我代码”。新的 Agentic Engineering 是“我定义目标、边界、环境、验收标准,然后让一个或多个 AI Agent 在这些约束里工作,并把它的结果拿回来审查”。

这不是换了一个更高级的英文词,而是角色关系变了。

在 Vibe Coding 里,人很容易变成许愿的人。你说“帮我做一个会员中心”,AI 就开始写。你说“这里报错了”,AI 就继续修。你不看 diff,不跑测试,不追问为什么,只要页面亮了,就觉得差不多。

在 Agentic Engineering 里,人不能这么偷懒。你要像一个产品负责人和工程负责人一样,先把事情讲清楚:这个功能服务谁?入口在哪里?异常状态怎么处理?哪些数据不能碰?生成的代码必须通过哪些测试?上线之前谁来验收?

这背后的真正分水岭,不是 AI 从不会写代码变成会写代码。

而是 AI 写代码已经快到一种程度,人类如果不补上工程约束,风险会被放大得更快。

OpenAI 在 2025 年发布 Codex 时,也没有把它包装成“你可以不用管代码”的工具。它强调的是云端软件工程 Agent,可以在独立环境里读代码、改文件、跑测试,并提供终端日志和测试输出作为可追溯证据,同时也明确说,用户仍然需要人工审查和验证 Agent 生成的代码。

Anthropic 的 Claude Code 也是同一个方向:它不是只补几行代码,而是能读代码库、改文件、运行命令、和开发工具连接,甚至支持项目级说明文件、MCP、skills、hooks 和多 Agent 协作。

GitHub Copilot coding agent 的设计也很像一个“会干活但必须被审查的实习队友”:你把 issue 指派给它,它在后台开环境、提交 draft PR、留下 session log,但进入 CI/CD 和生产之前仍然要人审。

行业头部工具的共同方向并不是“让你更随便地写代码”,而是“让 AI 进入现有研发流程,同时留下审查、测试、权限和回滚的抓手”。

这才是 Agentic Engineering。

三、AI 不是把研发变便宜,而是把需求错误变得更快

很多产品经理对 AI 编程的第一反应是兴奋:那是不是以后我可以绕过研发,自己做 MVP?

可以,但只能做一半。

如果你的目标是验证一个想法,Vibe Coding 很好用。比如做一个投票页、一个后台查询页、一个用户分群规则的可视化草稿,它能让你用更低成本拿到反馈。

但如果你的目标是进入真实业务,比如登录、支付、会员权益、优惠券核销、订单状态、客服工单、内容审核、风控策略,那就不能只靠“能跑”判断。

移动互联网产品最麻烦的地方,不是页面长什么样,而是状态和责任链。

一个按钮背后可能连着账户体系、积分体系、库存、支付回调、消息通知、埋点、风控、客服后台和财务对账。AI 当然可以写这些代码,但它不会天然知道你们公司过去三年踩过哪些坑,不会知道某个字段为什么不能改,不会知道某个老接口虽然难看但不能动。

如果产品经理只是把一句“做一个新人礼包功能”扔给 AI,AI 可能真的会做出来。

但它做出来的,可能是一个没有库存锁、没有幂等、没有补偿机制、没有灰度开关、没有异常提示的新人礼包。页面上看,它很完整。到了生产环境,它会把问题一个个还给你。

所以我的判断是:AI 编程不会让产品经理更远离工程,反而会逼产品经理更懂工程。

不是让你变成写代码的人,而是让你变成能定义边界、识别风险、判断验收证据的人。

四、从 Vibe Coding 到 Agentic Engineering的变化

1. 从“写 prompt”变成“写任务契约”

Prompt 是一句请求,任务契约是一份责任说明。

前者可能是:“帮我做一个积分商城页面。”

后者应该包括:用户入口、页面状态、接口字段、库存扣减规则、异常提示、埋点事件、权限边界、验收用例、不能修改的文件、需要跑的测试。

这两者的差别很大。一个是在求 AI 帮忙,一个是在给 Agent 分派可验证的工作。

2. 从“看结果”变成“看过程证据”

Vibe Coding 时代,很多人只看页面能不能打开。

Agentic Engineering 时代,你要看它改了哪些文件、为什么这么改、跑了哪些测试、哪些测试没跑、有没有 lint、有没有类型错误、有没有安全风险、有没有生成新的技术债。

这听起来麻烦,但正式项目本来就麻烦。AI 只是把写代码的速度提高了,没有把工程审查这件事取消。

3. 从“一个 AI 对话”变成“多个 Agent 分工”

一个复杂功能不应该丢给一个 Agent 一口吃完。

更合理的方式是拆任务:一个 Agent 做前端页面,一个 Agent 改接口,一个 Agent 补测试,一个 Agent 写迁移文档,一个 Agent 做代码审查或安全检查。人负责拆分、排序、合并和最终判断。

这和过去产品经理拆需求、研发拆模块很像,只是执行单元多了一类“AI 同事”。

4. 从“一次性生成”变成“可沉淀资产”

很多 Vibe Coding 的代码用完就扔。它适合探索,但不适合长期维护。

Agentic Engineering 更在意沉淀:项目说明文件、接口规范、测试用例、组件模板、常用 Agent 指令、代码审查清单、上线检查表。

这些东西看起来不性感,但它们会决定下一次 AI 做得更准,还是继续像第一次一样瞎摸。

5. 从“谁都会做一点”变成“谁会验收谁更值钱”

未来真正值钱的不是“我会让 AI 写代码”,因为这件事会越来越便宜。

更值钱的是:我知道什么任务适合交给 AI,什么任务必须人来控;我知道 AI 的结果错在哪里;我知道一个功能从 Demo 到上线要补哪些工程动作;我知道什么时候该停,而不是让 AI 一直改下去。

这对产品经理、技术负责人、设计负责人、运营负责人都成立。

五、 Agentic Engineering 只是一套更严格的用 AI 做事方法

我不太喜欢把这件事讲成“下一代范式革命”。这种话太大,也容易让人误以为只要换个工具,组织能力就自动升级。

更准确地说,Agentic Engineering 是把 AI 放进工程系统里,而不是把工程系统交给 AI。

这里有几条底线。

第一,需求必须可验收。不要只写“体验更顺滑”“页面更美观”“提升转化”。你要写用户从哪里来,看到什么,点了什么,系统返回什么,失败时怎么提示。

第二,权限必须被限制。Agent 不应该想改哪里就改哪里,尤其是支付、账户、风控、数据删除、权限配置这类区域。

第三,测试必须前置。不要等 AI 写完再想怎么测。你应该先把核心验收用例列出来,让 Agent 围绕这些用例工作。

第四,代码必须有人看。哪怕 AI 生成的是一个内部小工具,也要有人看关键逻辑。研究里已经反复出现一个现实:AI 代码可以功能正确,但安全并不一定正确。2025 年一篇安全基准研究里,某些 Agent 方案在功能正确率达到 61% 的情况下,安全通过率只有 10.5%。这个数字不一定能代表所有场景,但足够提醒我们:能跑和安全是两件事。

第五,AI 产物必须能回滚。你要知道这次改动影响了哪些模块,出了问题能不能快速撤回,数据有没有补救办法。

六、一套可执行方法

如果你明天就想用 Agentic Engineering 的方式工作,我建议从四步开始。

第一步:需求

不要写一句“帮我做某功能”。至少写清楚六件事:

用户是谁;他在什么入口触发;正常路径是什么;异常路径有哪些;涉及哪些数据;这次不做什么。

“不做什么”很重要。AI 最容易热心过头,把你没让它做的东西也做了。

第二步:约束

告诉 Agent 哪些文件不能动,哪些接口不能改,使用什么组件,遵守什么命名规则,必须跑哪些命令,输出时要给哪些证据。

如果团队已经有 README、接口文档、代码规范,就不要让它散落在聊天记录里,应该放进项目级说明文件,比如 AGENTS.md、CLAUDE.md 或团队自己的 Agent 工作手册。

第三步:验收

产品经理要写的不只是 PRD,还要写验收。

比如:“新用户首次进入看到 A 状态,老用户看到 B 状态;库存为 0 时按钮置灰;接口超时时保留原页面并提示重试;埋点事件包含 user_id、入口、按钮名称和结果;至少通过 5 条核心测试用例。”

这张卡的价值是把“我感觉差不多”变成“证据够不够”。

第四步:复盘

每次用 AI 做完一个任务,不要只看有没有上线。要记录三类东西:AI 哪些地方做得准,哪些地方反复错,哪些规则应该沉淀到下次。

比如某个项目里 Agent 老是忘记跑端到端测试,那就把这条写进项目说明。某个组件库经常被误用,就补一个示例。某个接口字段容易理解错,就把字段解释写清楚。

这就是资产沉淀。

七、哪些场景适合 Vibe Coding,哪些必须升级到 Agentic Engineering

我不会说 Vibe Coding 没用了。它仍然有价值。

适合 Vibe Coding 的场景包括:个人效率小工具、一次性数据清洗脚本、内部 Demo、设计原型、活动页草稿、低风险运营工具、用来沟通想法的可点击样品。

这些场景的共同点是:失败成本低,数据不敏感,生命周期短,出了问题可以重做。

但只要进入下面这些场景,就必须升级到 Agentic Engineering:

涉及真实用户数据;涉及支付和权益;涉及权限和风控;会进入生产环境;会被长期维护;会影响核心链路;会和多个系统联动;出了问题需要定位责任。

这条边界越早画清楚,团队越不容易被 AI 的速度误导。

八、这轮变化真正重构的岗位能力

未来一两年,移动互联网团队里会出现一种很明显的分层。

第一类人,只会把需求丢给 AI,拿到结果就转发给研发或老板。这类人短期看起来效率高,但很快会暴露问题:不会拆任务,不会验收,不知道风险在哪里。

第二类人,能用 AI 快速做原型,也知道原型不能直接上线。他们会把 AI 当作验证想法的工具,能节省很多沟通成本。

第三类人,会把 AI 纳入工作流。他们能写清楚需求契约,能拆 Agent 任务,能要求测试证据,能组织代码审查,能把踩过的坑沉淀成团队规则。

我更看好第三类。

这类人未必是最会写代码的人,但一定是最懂“从想法到上线中间到底要经过什么”的人。产品经理如果能走到这里,价值不会被 AI 吃掉,反而会被放大。

因为 AI 越强,越需要有人负责判断什么值得做、边界在哪里、结果能不能交付。

九、要训练会交付的团队才是重中之重

Karpathy 提出 agentic engineering,对我最大的提醒不是“Vibe Coding 已死”这几个字,而是另一件更现实的事:

AI 编程已经从玩具区走到了生产区。生产区有生产区的规矩。

在玩具区,你可以随便试,坏了就重来。在生产区,你要考虑用户、数据、权限、成本、稳定性、合规、维护和责任。

这也是为什么我认为,移动互联网从业者接下来不要只学 prompt。Prompt 当然要会,但它只是入口。更重要的是学会写清楚需求,学会拆任务,学会看结果证据,学会让研发流程容纳 AI,学会把每一次 AI 工作留下的经验变成下次更稳的规则。

信息来源与核验说明

  • Merriam-Webster 对 “vibe coding” 的解释与 Karpathy 2025 年 2 月原始表述转引:
  • Collins Dictionary 2025 年年度词汇 “vibe coding”:
  • Business Insider 对 Karpathy “agentic engineering” 公开发帖的报道:
  • Times of India 对 Karpathy 一周年回顾帖的较完整转引:
  • OpenAI Codex 发布说明:
  • Anthropic Claude Code 官方文档:
  • GitHub Copilot coding agent 官方介绍:
  • METR 早期 2025 AI 编程工具生产力实验:
  • “Vibe Coding in Practice” 灰色文献综述:
  • “Is Vibe Coding Safe?” 代码安全基准研究:
  • “Agentic Agile-V” 关于从 prompt engineering 转向 engineering process control 的论文:
  • 题图来自Unsplash,基于CC0协议

    🔥 热词:#kapital visvim · #kap官网 · #kavecom · #kapri styles · #kaspars vilcans · #kappe schiphol bv · #kappavince · #kavin spacey