图源:Pixabay

撰文|刘少山、唐洁

具身智能(Embodied Artificial Intelligence,EAI)是指将人工智能系统嵌入具有物理形态的实体之中,使其能够感知环境、从经验中学习,并在与真实世界的持续交互中形成认知、决策与行动能力[1]。与以符号推理或纯计算为中心的传统人工智能不同,具身智能强调智能并非脱离物理世界而存在,而是必须通过身体进入环境,在行动与反馈的循环中不断演化。

当这一思想被系统性地引入科学发现过程时,便形成了面向科学研究的具身智能(Embodied AI for Science,EAI4S)。在这一新范式下,自主智能体直接置身于实验室等真实科研环境中,能够感知实验状态,执行实验操作,并在实践中学习和积累实验技能;同时,智能体并非只是机械地执行流程,而是通过与物理世界的持续交互,不断调整其科学推理、实验设计与决策策略。面向科学研究的具身智能的核心潜力,在于从根本上重塑科学发现的方式,通过更快的实验迭代、更稳健的实验执行,以及对因果关系和机理结构的持续探索,突破当前科研活动在效率、可重复性和知识积累方式上的结构性瓶颈。

本文将系统回顾机器人实验室的发展历程,分析现有技术体系的内在局限,并讨论迈向真正具身化科学智能所需的关键突破方向。

01 机器人实验室的发展脉络

机器人实验室最早的标志性进展,来自在物理系统中首次实现端到端自治的科学发现闭环。2004年,Ross D. King 团队在功能基因组学领域展示了一套机器人科学家系统,该系统能够在真实实验环境中自动生成科学假设,并通过实验加以验证[2]。这一工作首次证明,提出假设、设计实验、执行实验和分析结果这一完整的科学方法流程,可以被形式化并交由机器在物理世界中闭环运行。

在此基础上,2009年提出的 Adam 系统对机器人科学家的思想进行了进一步的系统化和工程化实现[3]。Adam 系统明确编码了假设生成与实验验证相结合的科学推理循环,并强调实验过程的机器可读表示、实验数据与流程的完整记录,以及结果的可追溯性和可重复性。围绕这些系统,相关研究逐步总结出机器人科学家的通用技术架构,包括科学知识表示、假设生成、实验设计、机器人执行以及基于实验结果的迭代学习等关键模块。

机器人实验室发展的第二个重要阶段,是从以科学假设为中心的系统,转向以闭环优化为核心的自驱动实验室(self-driving laboratories)。随着实验自动化平台的成熟以及机器学习方法在实验设计中的广泛应用,研究重心逐渐转向如何在资源受限的条件下,高效探索复杂、高维的实验空间。这一阶段通常采用主动学习和贝叶斯优化等方法,使系统能够根据实验反馈动态调整实验策略,从而提高探索效率[4]。

2020年提出的移动机器人化学家系统,是这一范式的重要里程碑[5]。该系统在真实的人类实验室环境中连续多天自主运行,能够独立选择实验条件、执行实验并根据结果调整后续决策,展示了自驱动实验室在长期稳定运行和复杂决策方面的可行性。进入2020年代初,综述性研究对这一范式进行了系统总结,并普遍指出,系统集成的可靠性、自动化执行的稳健性以及实验数据与流程的标准化溯源,是制约自驱动实验室进一步扩展的主要工程瓶颈。

最近,随着大语言模型和工具增强智能体架构的快速发展,机器人实验室开始引入语言模型作为科研工作流的高层组织与编排机制[6,7]。这类系统能够将研究目标转化为具体的实验计划,协调软件工具与物理仪器,并对端到端实验流程进行统一管理。已有研究表明,这种以语言模型为核心的系统在任务灵活性、跨领域泛化能力以及流程重组方面,显著优于早期针对单一任务设计的机器人系统。

02 迈向面向科学研究的具身智能

尽管机器人科学家、自驱动实验室以及基于语言模型的实验室系统取得了显著进展,但从本质上看,这些系统仍主要依赖自动化执行和数值优化,而尚未形成真正意义上的科学智能。它们在执行预定义实验流程、在参数空间内高效搜索以及组织复杂实验操作方面表现突出,但通常仍受限于人类预先设定的表示体系,在面对真实实验环境中的物理不确定性、概念抽象以及科学机理理解时能力不足。

弥合这一差距,正是迈向面向科学研究的具身智能的关键所在。在这一新阶段,自主智能体不仅能够运行实验,更能够将实验室视为一个持续变化的物理世界,通过不断的感知、推理与行动,实现对实验过程的深度理解和主动适应。实现这一转变,需要在三个彼此耦合的方向上取得突破。

首先是具身世界模型与实验技能学习。需要构建多模态的感知与动作模型,用以刻画实验环境的动力学特征,并支持实验操作技能的学习、复用与组合,使系统能够在复杂环境中实现超越人工脚本的稳健操作。

其次是因果关系与科学机理层面的推理能力。系统应从单纯追求实验结果优化,转向对因果结构和机理解释的发现,通过具有可识别性的实验设计和理论约束,形成具有解释力和迁移能力的科学知识。

第三是可验证的自主运行与科学操作系统。这要求构建具备安全约束和审计能力的智能体架构,并通过对实验动作、数据与溯源信息的统一规范,使具身化的科学智能体能够在不同实验室、不同学科之间可靠扩展,同时保持科研结果的可信性与可重复性。

03为何面向科学研究的具身智能具有现实紧迫性,以及开放为何关键

当前全球科学发现能力呈现出显著的不均衡分布。这种不均衡并非主要源于科学思想或人才储备的差异,而是深植于实验基础设施获取能力的结构性差距之中。从统计结果看,全球被主要数据库收录的科学论文中,超过85%来自高收入和中高收入国家,而低收入地区在全球科研产出中所占比例极低[8]。这一事实表明,当代科学研究越来越受到实验条件、设备成本以及系统可靠性的制约。

面向科学研究的具身智能为缓解这一结构性问题提供了一条现实可行的路径。通过将隐性的实验经验转化为可复用的具身技能,并借助稳定的闭环运行机制和标准化的实验流程,相关系统有望在有限投入条件下显著提升科研产出效率。如果这一技术体系在设计之初就坚持开放和可负担原则,科研基础相对薄弱的地区便有可能跨越传统重资产实验室建设路径,更有效地参与前沿科学研究。这一理念与联合国教科文组织提出的开放科学原则高度一致,其核心目标正是通过共享和互操作的科研基础设施,缩小全球知识生产的结构性差距[9]。

04 开源、标准化与可负担的技术路径,以及中国的角色

面向科学研究的具身智能标志着机器人实验室从自动化工具,迈向具备学习、推理和决策能力的科研主体。要使这一转变真正产生广泛而持久的影响,必须在技术路线和制度设计上坚持三项基本原则。

第一,坚持开源导向。通过开放核心系统、模型和实验技能,科研群体才能在共享与协作中持续积累能力,避免基础技术重复建设,从而加快整体创新节奏。

第二,系统推进标准化建设。实验动作、硬件接口、数据格式以及实验溯源机制的统一,是实现跨平台协作、跨实验室迁移和跨领域扩展的前提条件,也是科学结果可验证性和可复现性的制度基础。

第三,将可负担性作为核心设计目标。面向科学研究的具身智能不应仅服务于少数顶尖实验室,而应成为更多科研机构可以部署、维护并持续演进的公共技术能力。

在这一关键窗口期,中国具备在该领域发挥更大作用的现实基础。完善的制造体系、突出的工程化能力以及丰富的科研应用场景,使中国有条件将面向科学研究的具身智能从实验室原型推进为可规模化的技术体系。

未来,中国应在国家科研基础设施布局中明确支持相关平台建设,积极参与并引领国际标准制定,并通过开源技术与国际合作,将成熟的系统和经验向全球,尤其是科研资源相对不足的地区输出。通过这一方式,中国不仅能够加快自身科学发现进程,也有望在新一轮科研范式变革中,成为面向科学研究的具身智能技术与公共能力的重要全球供给者。

论文链接:

作者介绍:

刘少山,深圳人工智能与机器人研究院(AIRS)具身智能中心主任, 国际计算机学会(ACM)技术政策委员会成员。

唐洁,华南理工大学副教授,研究方向包括空间智能,机器人,计算系统等。