当前位置:首页 >> 学术资讯 >> 科研信息

获项目资助博士研究生与多个研究团队合作在具身空间智能领域取得进展

2025/06/03

获项目资助博士研究生与多个研究团队合作在具身空间智能领域取得进展

图 SpatialVLA:面向具身智能的3D空间智能通用操作模型

  在国家自然科学基金青年学生基础研究项目(博士研究生,批准号:624B2044)的资助下,复旦大学计算机科学与技术学院博士研究生屈德林与上海人工智能实验室、中国电信AI研究院、上海交通大学、浙江大学、上海科技大学等研究团队开展交叉合作,在面向具身智能的通用机器人空间智能操作研究中取得进展。研究成果“SpatialVLA: Exploring Spatial Representations for Visual-Language-Action Models”被第21届Robotics: Science and Systems(RSS 2025)会议录用,项目代码与模型权重已经全面开源,截至2025年4月已获得15K的下载量。(开源项目:https://spatialvla.github.io;论文链接:https://arxiv.org/pdf/2501.15830)

  与3D物理环境交互、适应不同机器人形态并执行复杂任务的通用操作策略,一直是机器人领域的长期追求。现有的通用操作模型局限于2D输入,缺乏鲁棒的3D感知能力,在面对单视角视差、光照变化和环境不一致等视觉外观变化时表现较差,限制了其在现实世界中的通用性。而人类本能地形成结构化的空间认知模型,轻而易举地在不同的场景中组织、操作物体。因此,当前面向具身智能的通用机器人领域的一个关键研究问题是如何有效地为视觉语言动作模型(VLA)赋予深刻的3D物理世界空间理解能力,即3D空间智能操作模型。

  开发具有3D空间智能的通用机器人操作模型面临两个关键挑战:首先,由于相机传感器和安装位置(例如腕部安装与第三方视角)不同,机器人在各个形态下的观察数据缺乏3D对齐,造成了3D观察空间未同一校准的;其次,机器人表现出多样的动作特性,源自自由度、运动控制器、工作空间配置和任务复杂性的差异,使得学习通用空间动作变得复杂。为应对以上挑战,该文创新的提出了基于百万真机数据预训练的空间具身通用操作模型SpatialVLA(图),通过探索对齐的空间表示,将VLA模型赋予3D空间智能,全面探究空间表征在具身通用操作模型中的能力,在zero-shot泛化控制、场景高效微调、空间理解等多项评估中取得了较优的性能。

  本研究成果创新地实现了具有真实3D空间智能的通用机器人操作模型,突破了视觉语言动作模型在复杂物理环境中的泛化性能瓶颈,将有效推动具身智能在工业服务、家庭助理等多样化场景的落地应用。


版权声明:
文章来源国家自然科学基金委员会,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2025生物学、环境工程与清洁能源国际会议(ICBEECE 2025)(2025-09-05)

第七届 IEEE 能源、电力与电网国际学术会议(IEEE-ICEPG 2025)(2025-09-12)

2025环境、气候变化与生物科学国际会议(ECCBS 2025)(2025-09-13)

2025年第七届先进计算机科学,信息技术与通信国际会议(CSITC2025)(2025-09-19)

第十届机械制造技术与材料工程国际学术会议(MMTME 2025)(2025-09-19)

第九届交通工程与运输系统国际学术会议(ICTETS 2025)(2025-09-26)

第六届智能计算与人机交互国际研讨会(ICHCI 2025)(2025-09-26)

第五届机电一体化技术与航空航天工程国际学术会议(ICMTAE 2025)(2025-09-26)

2025年先进制造技术、机械工程与自动化国际会议(ICAMTMEA 2025)(2025-10-01)

2025-2026年科技计划项目申报和科技创新平台建设运行科研资金全过程管理使用高级研修班(苏州)(2025-10-22)

2025创新教育、文化艺术与设计国际会议(ICIECAD 2025)(2025-10-20)

2025年绿色经济与可持续发展国际会议(ICGESD 2025)(2025-9-25)

2025年仿真模拟与天体物理国际学术会议(ICSA 2025)(2025-10-26)

2025年结构工程、抗震与城市建筑国际会议 (ICSESDU 2025)(2025-10-23)

2025交通运输、土木工程与水利国际会议(ICTCEWR 2025)(2025-10-21)

2025年公共艺术、戏剧与舞蹈国际学术会议(ICPADD 2025)(2025-10-21)

2025年风险管理、金融科技与数据科学国际会议(IRMET 2025)(2025-9-26)

2025年遥感技术、卫星通信与空间检测国际会议(RSTSCSD 2025)(2025-9-20)

2025年现代教育技术与人工智能国际学术会议(ICMETAI 2025)(2025-9-28)

2025交通运输、信息技术与土木工程国际会议(TITCE 2025)(2025-10-19)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。