谷歌近日宣布,WebMCP已进入Chrome 149的Origin Trial阶段。WebMCP是一项新的标准提案,它允许网站向浏览器内的AI智能体暴露可调用工具,例如JavaScript函数或HTML表单。这样一来,智能体便可以通过明确的接口完成用户操作,而不再需要依赖成本高昂且可靠性有限的“猜测式”交互方式,例如读取屏幕内容或解析DOM结构。谷歌这样解释WebMCP的设计初衷:在没有WebMCP的情况下,如果AI智能体希望代表用户完成某项操作,通常需要经历一套相当复杂的流程:首先下载相关网页的DOM,然后分析页面中的按钮和控件作用,接着截取页面截图并进行图像识别。最后推断目标按钮在屏幕上的坐标位置,并模拟鼠标点击。正如业内经常提到的那样,这种方式不仅不够确定,而且Token消耗极高。一个简单的CSS布局变化,或者一个加载稍慢的广告组件,都可能导致整个自动化流程失效。与此同时,即便是低分辨率截图,其图像分析过程也会带来额外延迟和大量Token开销。与主要面向后端场景的模型上下文协议(MCP)类似,WebMCP也允许网站为AI智能体提供明确的接口,从而让其能够代表用户完成个性化任务。但两者的定位并不相同。WebMCP完全运行在客户端侧,专门为浏览器环境设计,因此省略了MCP中许多服务器端概念,例如Resources。从本质上讲,WebMCP的目标是帮助智能体更可靠地理解Web界面。开发者可以通过定义API,为智能体提供一组带有名称、类型和说明的操作菜单,让其直接调用,而不是依赖对页面结构的推测。

--91likeyou---

🔥 热词:#WebMCP · #AI · #Chrome · #Origin · #Trial · #DOM · #Token · #推出