AReaL 2.0：让智能体越用越强，开源强化学习基础设施项目迎来新里程碑

让Agent越用越强：AReaL 2.0开源，给智能体装上“成长系统”

7月2日，开源强化学习基础设施项目AReaL正式发布2.0版本。该版本旨在打通基础模型训练与现代智能体应用之间的链路，为Agent应用场景提供高效的强化学习训练支撑。此次发布的AReaL2.0版本面向已经进入真实业务场景的Agent，提供了一套让Agent在使用中持续学习的系统基础设施。通过AReaL2.0，Agent在完成真实任务时产生的交互过程可以被记录、整理，并接入后续训练流程，用于持续优化底层模型，从而让Agent在安全可控的前提下越用越强。如今，Agent正在进入真实生产环境，面临从工作中真正成长的挑战。开发者不需要重新开发Agent，只需让Agent原本发给大模型的请求经过AReaL2.0的统一推理入口，就可以接入在线强化学习流程。这意味着，Agent的能力提升不再只依赖人工构造数据、离线训练和重新部署。真实任务中的多轮对话、工具调用、执行结果和反馈信号，都有机会成为模型继续学习的材料。这一点在企业场景中尤其重要。在企业工作流中的Agent面对的是真实、复杂、不断变化的任务：代码库会更新，业务流程会调整，用户需求会变化，工具和系统也可能发生改变。如果Agent的能力一旦上线就基本固定，它就很难长期适应真实环境。AReaL2.0希望补上的正是从“会使用工具”到“能从使用中学习”之间缺失的一环。同时，真实业务中的持续学习也不能只是简单地“收集数据再训练”。Agent可能接触代码、客户信息、企业知识库和内部系统，因此训练链路必须考虑权限控制、数据脱敏、隔离和审计等要求。AReaL2.0在系统设计中引入了面向Agent轨迹的数据代理机制，让真实任务数据进入训练流程时，可以在更安全、可控的前提下被管理和使用。AReaL团队在技术报告中指出，自演进Agent的关键瓶颈，不只是模型本身有多强，也不只是强化学习算法是否先进，而是缺少一套能够服务真实Agent的在线强化学习基础设施。AReaL2.0正是面向下一代智能体应用进行的架构升级：把Agent服务、真实任务轨迹、数据治理和在线强化学习训练连接起来，让Agent在部署之后继续学习具备了可落地的工程基础。从更长远的角度看，AReaL2.0指向的是下一代智能体应用的演进范式：Agent不再只是一次性训练和部署的工具，而是在真实环境中不断获得反馈，把成功和失败都转化为经验，并在安全边界内不断提升自身能力。AReaL项目由蚂蚁集团、清华大学和香港科技大学等团队于2024年发起。2026年5月，AReaL正式从蚂蚁InclusionAI孵化成为独立开源社区，并加入PyTorch Foundation Ecosystem项目，进一步融入主流强化学习基础设施生态。随着社区独立发展，AReaL也在持续获得产业和开源生态伙伴的参与和支持，包括华为云团队、MindLab等。未来，AReaL将继续围绕在线强化学习、自动化评估和多模态智能体训练等方向迭代，与社区共同推进自演进智能体生态发展。目前，AReaL2.0技术报告和代码已开源。

--91likeyou---

从更长远的角度看，AReaL 2.0 指向的是下一代智能体应用的演进范式：Agent 不再只是一次性训练和部署的工具，而是在真实环境中不断获得反馈，把成功和失败都转化为经验，并在安全边界内不断提升自身能力。

AReaL 项目由蚂蚁集团、清华大学和香港科技大学等团队于 2024 年发起。2026 年 5 月，AReaL 正式从蚂蚁 InclusionAI 孵化成为独立开源社区，并加入 PyTorch Foundation Ecosystem 项目，进一步融入主流强化学习基础设施生态。

随着社区独立发展，AReaL 也在持续获得产业和开源生态伙伴的参与和支持，包括华为云团队、MindLab 等。未来，AReaL 将继续围绕在线强化学习、自动化评估和多模态智能体训练等方向迭代，与社区共同推进自演进智能体生态发展。

目前，AReaL 2.0 技术报告和代码已开源。

GitHub 仓库：

技术报告：

🔥 热词：#Agent · #AReaL · #让Agent越用越强 · #0开源 · #给智能体装上 · #成长系统 · #开源强化学习基础设施项目 AReaL · #正式发布

AReaL 2.0：让智能体越用越强，开源强化学习基础设施项目迎来新里程碑

相关文章

启航氢能：电氢耦合技术引领行业创新

智能出行企业OMOWAY获宁德时代投资，印尼市场首月订单量第一

Claude Code 用隐写术标记中国用户：一场事先张扬的信任坍塌

亚马逊云科技推出Lambda MicroVM：无服务器计算的全新隔离式智能体解决方案