从 Coding 到 Anything,Agent 正在重写工作流

从 Coding 到 Anything,Agent 正在重新定义软件开发的边界。在2015年,Coding Agent的概念首次被提出,它标志着AI技术从辅助编程向自主交付的转变。随着技术的发展,AI Coding已经走过了从代码补全、函数生成到围绕一个需求完成多文件修改和调试、测试的阶段。这一演进不仅让开发者的工作方式发生了根本变化,而且将AI的能力扩展到了更广阔的工作流程中。如今,AI Coding不再仅仅是回答问题或生成片段,而是开始承担完整的任务链路,包括理解需求、调研方案、生成代码、运行验证、修复问题,甚至完成代码评审。这一转变预示着AI Coding的瓶颈已不再是模型能否生成更好的代码,而是能否形成一套稳定、可控、可交付的任务系统。

--91likeyou---

Coding Agent 的关键变化,不只是会写代码

在第一场分享中,阿里巴巴高级技术专家左志鹏,以《从辅助编程到自主交付:Qoder Desktop 的多 Agent 协作与 Harness 实践》为题,拆解了 AI Coding 从辅助编程走向自主交付的变化。

早期的 AI Coding 更像是开发者的“副驾驶”。人知道自己要写什么,AI 负责补齐一部分代码。到了协同编程阶段,开发者可以把需求和上下文交给 AI,让它生成更完整的功能代码,但调试、测试、验证、Review 依然需要人持续介入。

而现在,变化正在发生:AI 开始进入更长的任务链路。一个任务交给 Agent 后,它可以先做方案调研,生成 SPEC,再完成编码、编译、启动、测试和验证,最后还会审视自己的代码质量。人的角色不再是时刻盯着 AI 改每一行代码,而是定义目标、判断关键方案,并对最终结果进行确认。

这背后指向一个核心判断:AI Coding 的瓶颈,已经不只是模型能不能生成更好的代码,而是能不能形成一套稳定、可控、可交付的任务系统。

Qoder Desktop 的 Experts Mode 正是围绕这个问题展开。它不是让一个 Agent 在同一个上下文里完成所有事情,而是引入“专家团”模式:Leader Agent 负责全局编排,调研专家、前端编码专家、后端编码专家、测试专家、代码评审专家等不同角色分工协作。一个复杂需求进入后,系统会先调研仓库和运行环境,再按依赖关系派发编码任务,随后调用测试和评审能力,形成端到端闭环。

这里的重点不只是“多 Agent”,而是 Harness。只有让 Agent 在可观测、可验证、可回滚、可约束的环境里工作,企业才可能把它从“能用的小工具”变成“可委派的生产力单元”。因此,Qoder 在工程知识引擎、RepoWiki、知识卡片、自动验证、安全沙箱、危险命令拦截等方面做了大量工程化设计,让 Agent 不只是跑起来,还要跑得稳、交付得出、出了问题能被定位。

从这个角度看,AI Coding 的真正变化,在于研发流程开始被重新组织。人从执行者转向任务编排者,Agent 承担越来越多执行、验证与修复工作,Harness 则成为控制质量、沉淀经验和保障安全的基础设施。

桌面 Agent 让 AI 进入真实工作的缝隙

如果说 Coding Agent 先在软件研发场景中验证了“端到端任务交付”的可能性,那么第二场分享讨论的则是:这套能力如何从 IDE 走向每个人的电脑桌面。

阿里巴巴高级技术专家赵明在《重塑本地生产力:QoderWork 桌面 Agent 的设计密码与效能突破》中提出,今天知识工作者面临的低效,并不是因为工具不够多,而是因为工具太多、协同太少、执行太碎。

一个典型知识工作者每天要在文档、表格、浏览器、IM、设计工具、内部系统等大量应用之间反复切换。每多一个工具,就多一道裂缝:数据在不同工具之间割裂,流程在应用边界处断开,人的注意力被不断切碎。AI Chatbot 可以给出建议,但真正落地时,仍然需要人复制、粘贴、整理、上传、提交,继续充当“数据搬运工”和“流程粘合剂”。

QoderWork 的定位,就是让 Agent 从聊天框走向桌面,成为一个真正能动手干活的 AI 助手。它不是只回答“应该怎么做”,而是能够操作文件、处理数据、生成文档、调用浏览器、执行本地任务,把自然语言转化为真实动作。

在能力设计上,QoderWork 覆盖了文件批量处理、Excel/CSV 数据分析、文档和 PPT 生成、网页填表、信息抓取、跨页面流程串联等常见桌面任务。比如,从浏览器抓取信息,整理成表格,再生成报告;或者根据需求文档、产品规格和报价规则,自动生成售前报价材料。这些任务过去往往分散在多个工具和多人协作之间,如今可以被组织成一条连续的 Agent 工作流。

另一个关键能力是“会进化”。一次任务完成后,Agent 不能用完即抛,而应该把过程中形成的偏好、规则、流程和经验沉淀下来,转化为记忆、Skills 或工作流模板。这样,下一次再处理类似任务时,用户不需要重新解释一切,Agent 也能更接近个人和组织的工作习惯。

这意味着,桌面 Agent 的真正价值,正在落到真实工作的缝隙里。反复切换、重复操作、跨工具同步,以及那些低价值但必须完成的任务,正在成为 Agent 接管的第一批工作流。

行业 Agent 的前提,是先读懂业务和数据

从研发流程到桌面办公之后,第三个问题自然出现:Agent 如何进入行业真实业务?尤其是零售这样数据量大、链路长、场景复杂的行业,AI 能否走出单点工具,真正参与经营决策?

慧博科技 CTO 贾世龙在《突破单点 AI 瓶颈:慧博零售全域 Agent 的数智化实践》中,给出了一个来自零售行业的一线样本。

零售企业面对的第一道难题,是数据分散。品牌的消费者数据分布在淘宝、京东、抖音、小红书、拼多多、线下门店、私域商城、企微、即时零售平台等多个渠道之中。每个平台都有自己的数据结构和业务口径,如果没有统一身份识别和数据治理,企业很难形成完整的消费者资产画像。

第二道难题,是海量数据下的 AI 处理瓶颈。头部品牌可能拥有上亿消费者记录、千万级订单和大量私域会话。如果直接把原始数据丢给大模型,不仅会遇到上下文长度和 Token 成本限制,也会因为数据噪音过高、业务口径不一致而放大幻觉问题。

慧博给出的路径是“先数字化,再数智化”,先依托零售中台和 CDP 打通 One-ID,做好底层数据治理,再让 Agent 在统一的数据和业务语义之上完成分析、诊断和策略执行。

早期的 SaaS+AI 单点赋能可以解决一些固定问题,比如单表分析、固定报表、简单 Workflow 编排,但当业务问题变得模糊时,旧方式就会遇到瓶颈。比如品牌问“最近生意怎么样”,这不是一个单一报表问题,而是需要拆解同比环比、新老客占比、客单价、交易金额、品类表现、渠道变化等多个指标,再进一步分析原因。

在慧博的实践中,OpenClaw 的底层改造,核心是把报表、查询、分析、诊断、策略和触达能力封装成可复用的 Skill,再由 Harness 统一编排。这样,Agent 不再只是调用某个固定流程,而是能够根据业务目标拆解任务、选择能力、组织链路。

例如会员运营表补全场景中,运营人员上传一张只有表头的表格,并提出“补全这个表格”的需求。系统会识别目标,调用读取和回填表格的 Skill,再调用查询报表的 Skill,判断字段对应会员、订单、复购、新客、老客等哪类指标,并将结果填回表格。这类能力不只服务于补表,还可以复用到店铺诊断、活动复盘、召回分析等更多经营场景。

在具体业务上,零售 Agent 已经覆盖核心指标波动预警与智能归因、对话式报表生成、品类连带洞察与跨品类拉新、千人千面营销、公域人群营销、全域智能挽单等多个场景。这些实践说明,行业 Agent 真正改变的是业务能力的组织方式:数据、口径、经验和执行链路,被重新封装、编排,并转化为可复用的智能能力。

托管运行时决定 Agent 能否走向生产

当 Agent 开始进入研发、办公和行业业务,问题也从“完成单次任务”推进到“承接持续流程”。在企业场景中,它需要面对长任务执行、断点续传、权限控制、环境隔离、结果验证和成本管理等一系列工程挑战。

在《面向 Loop Engineering 的 Qoder 托管运行时实践》中,阿里巴巴高级产品专家屈立威(安陈)讨论的正是这一层问题:如何让 Agent 的长循环在生产环境里长期、稳定、安全地运行。

过去几年,人使用模型的杠杆点不断外移。最初是 Prompt Engineering,重点是写好那一句话;随后进入 Context Engineering,重点是组织模型看到的信息;再往后是 Harness Engineering,重点是为 Agent 搭建工具、沙箱和护栏。到了今天,真正关键的问题变成:如何设计一个可靠的长循环,让 Agent 不只是单次跑通,而是能够在生产里反复跑、稳定跑、可诊断地跑。

长循环的难点主要集中在三个方面。

首先是验证。Agent 不能只是声称“我完成了”,而要有独立机制判断结果是否真的达标。其次是终止。长任务如果缺乏终止机制,可能会陷入死循环,不断消耗 Token 和资源。第三是上下文。任务越长,上下文越膨胀,模型注意力越容易涣散,执行质量也会下降。

Qoder Cloud Agents 的思路,是把经过 Coding 场景规模验证的 Agent 能力,以托管运行时的方式开放出来。它将 Agent 能力、执行环境和会话上下文拆成不同平面:Agent 平面声明模型、技能、工具和目标;Environment 平面提供隔离沙箱和文件系统;Session 平面负责长时会话、断点续传和运行时上下文。

这样,当用户断网、页面关闭、客户端退后台时,任务仍然可以在服务端继续执行;重新连接后,也可以从上一次进度继续,不丢失、不重复。对于企业场景,还可以通过自托管 Worker 实现“脑在云、手在客户”:云端负责规划、编排、模型、验收和观测,执行动作则发生在客户自己的 VPC 内,代码和数据不出域。

这套设计背后有一个重要判断:Coding Agent 之所以能走向 Anything,是因为 Coding 场景已经验证出一组通用能力——沙箱执行、文件系统、工具调用、MCP 连接、长任务循环、人机确认、权限控制和可观测性。一旦这层运行时成立,从 Coding 扩展到 Anything,改变的主要是技能和工具,而不是底层架构。

因此,企业级 Agent 竞争的重点,正在从“模型能不能生成”转向“运行时能不能被托管、编排和治理”。这也是 Agent 能否从玩具走向生产的关键分界线。

工作流被重构,人的位置也在改变

回看整场专题,「从 Coding 到 Anything」呈现出一条清晰的技术演进路径。

第一步,Coding Agent 在软件研发场景中验证了端到端任务交付的可能性。第二步,这套能力从 IDE 走向桌面,开始处理文件、数据、文档和跨工具流程。第三步,Agent 进入行业场景,开始与业务数据、行业知识和经营动作结合。第四步,托管运行时把 Agent 能力沉淀为可编程、可托管、可治理的基础设施,让它具备走向生产环境的条件。

在这个过程中,变化最大的并不只是工具,而是人的位置。

过去,人是流程的执行者,也是工具之间的连接器。需求要人拆,数据要人查,文档要人写,系统要人点,异常要人盯。现在,越来越多执行环节可以交给 Agent,人的工作则转向目标定义、边界设定、关键判断和结果验收。

这并不意味着人被完全移出流程。相反,越是复杂的 Agent 系统,越需要人定义清楚什么可以自动化,什么必须确认,什么需要审计,什么不能越界。Agent 负责行动,Harness 负责控制,运行时负责承载,人的价值则进一步集中到判断、责任和创造力上。

从 Coding 到 Anything,本质上不是把 AI 从一个场景复制到另一个场景,而是把“可委派、可验证、可治理”的工作方式,扩展到更多真实流程中。AI 时代的工作流重构,才刚刚开始。

🔥 热词:#Agent · #Coding · #AI · #Anything · #正在重写工作流 · #的演进 · #已经走到一个新的临界点。从最初的代码补全、函数生成 · #到围绕一个需求完成多文件修改、调试和测试