“一个好的智能体既要有‘智慧’,又要有‘执行力’,能够深度理解用户意图并据此采取行动。”在日前的一场“AI智能体行为安全与发展”研讨会上,阿里研究院院长袁媛这样看待智能体的发展形态。

她同时强调,尽管智能体承载着AI技术变现与用户体验升级的长期期待,但其落地不应成为对既有治理界面与商业秩序的颠覆性破坏,而应当在安全可控的前提下,通过深度协作推动产业生态演进,“确保终端和应用在共生中分享模型技术的红利”。


过去一年,围绕“AI能不能替人把事办了”,市场已经出现了多种探索路径。其中,一些以“AI接管手机操作”为特征的产品形态,尝试通过“看懂屏幕、模拟操作”的方式,跨应用完成剪视频、订票、点外卖等具体任务。这类路径,通常被归类为GUI Agent。

从技术实现上看,这类产品通常采用“让模型理解屏幕内容,再模拟人类操作界面”的方式运行。但随之而来的,是一整套必须被重构的问题:谁授予它权限?谁为它的错误负责?它能调用哪些服务?又该被谁约束?

在上述研讨会上,有专家认为,这种方式的现实意义在于,它在不改变既有应用生态的前提下,让智能体得以较快进入真实使用场景,但从长期看,它在稳定性、效率和可治理性方面都存在天然局限,更像是一种阶段性方案。

中国政法大学民商经济法学院教授焦海涛表示,智能体的授权需分场景进行,关键操作应有二次确认;涉及人身属性、主观判断或社交互动等事项不可代理;双重授权规则面临困境,并非所有场景都理应由第三方平台单独授权。他建议,通过协商和行业标准逐步建立规范。

目前,手机厂商也在探索智能体的落地方案。

OPPO ColorOS智慧产品研发总监姜昱宸在一场媒体沟通会中对第一财经记者表示,产业中如豆包手机的出现“对整个行业,包括生态的促进作用是有积极作用的”,但“它不是AI手机的最终形态,它还是一个去操作原来GUI界面的一个手法”。

在OPPO看来,是否采用GUI方案,并不是理念之争,而首先是一个工程与规模问题。姜昱宸表示,“豆包作为一个工程机,它可以更激进”,但手机厂商需要面对的是更大体量的用户规模,如果“一个服务推出第二天,大部分的服务都不能用了,这个在我们这是质量事故,是没法接受的”。在这种规模下,任何不稳定的系统级能力都会被迅速放大。

在她看来,当前基于界面操作的智能体方案“多少是一个中间形态”,未来的主流形态将更多走向A2A的协作模式。而手机厂商在这一轮演进中的核心价值,并不在于模型参数本身,而在于对用户的长期理解。

“我们不觉得大模型是手机的灵魂,我们觉得‘记忆’才是灵魂。当手机真正理解你之后,你是很难迁移的。”姜昱宸说。

在上述研讨会上,在多位专家看来,智能体的真正挑战,并不只是“能不能把事做成”,而是智能体的操作边界与管理挑战。

袁媛表示,现有的GUI带来的“鲶鱼效应”可以激活整个产业,但中国AI产业不应仅局限于GUI路线,更应在此基础上探索出兼顾安全与发展的更优演进路径。“当前,苹果公司的模式提供了可借鉴的范本,它不仅建立了智能体与App基于开放接口(API)的协同机制,更通过屏幕感知在保障安全边界的同时将用户意图精准开放给App,赋能APP使其更智慧地执行指令。”

清华大学电子工程系信息系统研究所副所长王钺认为,智能体意味着AI系统开始与外部环境直接交互,开启了关键转折:智能体不仅将改变信息系统构造方式,还将改变经济运行方式。王钺认为“破坏性创新”可能带来系统可管理性被削弱和信任基础被破坏两个深层风险,故而需改进授权机制,引入A2A(人工智能体与人工智能体)的制衡机制,走向基于市场竞争的信用机制。