获项目资助博士研究生与多个研究团队合作在具身空间智能领域取得进展_科研信息_学术资讯

当前位置：首页 >> 学术资讯 >> 科研信息

2026年第四届亚洲机器学习、算法与神经网络国际会议 (MLANN 2026)

2026年第四届亚洲计算机视觉、图像处理与模式识别国际会议(CVIPPR 2026)

2026年第五届网络、通信与信息技术国际会议(CNCIT 2026)

第五届信号处理与通信安全国际学术会议（ICSPCS 2026）

第二届新能源工程、储能与微电网技术国际学术会议（NESMT 2026）

第五届艺术设计与数字化技术国际学术会议 (ADDT 2026)

第十一届机电控制技术与交通运输国际学术会议（ICECTT 2026）

第二届大数据、物联网与智慧交通国际学术会议（BDIT 2026）

2026年智能机器人与控制技术国际会议（CIRCT 2026）

第二届大数据、人工智能与数字经济国际学术会议（BDAIE 2026）

第七届IEEE人工智能与机电自动化国际学术会议（IEEE-AIEA 2026）

2026年传感器技术、自动化与智能制造国际会议（STAIM 2026）

第三届智慧教育与计算机技术国际学术会议暨十三届第四期“麓峰”交叉科学论坛 (IECT 2026)

第六届先进算法与信号、图像处理国际学术会议（AASIP 2026）

第二届算法、机器学习、图像处理国际学术会议（AMLIP 2026）

第三届计算机应用与计算机图形学国际学术会议（CACG 2026）

2026年机械自动化与智能控制国际学术会议（IC-MAIC2026）

2026年智能医学与图像计算国际会议 (IMIC 2026)

2026年IEEE计算机通信、信息系统与网络安全国际会议(CCISC 2026)

2026年IEEE第二届电力与可持续能源技术国际会议(PSETC 2026)

获项目资助博士研究生与多个研究团队合作在具身空间智能领域取得进展

2025/06/03

图 SpatialVLA：面向具身智能的3D空间智能通用操作模型

　　在国家自然科学基金青年学生基础研究项目（博士研究生，批准号：624B2044）的资助下，复旦大学计算机科学与技术学院博士研究生屈德林与上海人工智能实验室、中国电信AI研究院、上海交通大学、浙江大学、上海科技大学等研究团队开展交叉合作，在面向具身智能的通用机器人空间智能操作研究中取得进展。研究成果“SpatialVLA: Exploring Spatial Representations for Visual-Language-Action Models”被第21届Robotics: Science and Systems（RSS 2025）会议录用，项目代码与模型权重已经全面开源，截至2025年4月已获得15K的下载量。（开源项目：https://spatialvla.github.io；论文链接：https://arxiv.org/pdf/2501.15830）

　　与3D物理环境交互、适应不同机器人形态并执行复杂任务的通用操作策略，一直是机器人领域的长期追求。现有的通用操作模型局限于2D输入，缺乏鲁棒的3D感知能力，在面对单视角视差、光照变化和环境不一致等视觉外观变化时表现较差，限制了其在现实世界中的通用性。而人类本能地形成结构化的空间认知模型，轻而易举地在不同的场景中组织、操作物体。因此，当前面向具身智能的通用机器人领域的一个关键研究问题是如何有效地为视觉语言动作模型（VLA）赋予深刻的3D物理世界空间理解能力，即3D空间智能操作模型。

　　开发具有3D空间智能的通用机器人操作模型面临两个关键挑战：首先，由于相机传感器和安装位置（例如腕部安装与第三方视角）不同，机器人在各个形态下的观察数据缺乏3D对齐，造成了3D观察空间未同一校准的；其次，机器人表现出多样的动作特性，源自自由度、运动控制器、工作空间配置和任务复杂性的差异，使得学习通用空间动作变得复杂。为应对以上挑战，该文创新的提出了基于百万真机数据预训练的空间具身通用操作模型SpatialVLA（图），通过探索对齐的空间表示，将VLA模型赋予3D空间智能，全面探究空间表征在具身通用操作模型中的能力，在zero-shot泛化控制、场景高效微调、空间理解等多项评估中取得了较优的性能。

　　本研究成果创新地实现了具有真实3D空间智能的通用机器人操作模型，突破了视觉语言动作模型在复杂物理环境中的泛化性能瓶颈，将有效推动具身智能在工业服务、家庭助理等多样化场景的落地应用。

版权声明：
文章来源国家自然科学基金委员会，分享只为学术交流，如涉及侵权问题请联系我们，我们将及时修改或删除。

相关学术资讯

清华大学药学院尹航课题组揭示代谢调控巨噬细胞焦亡的新机制

我国学者在柑橘黄龙病防控研究方面取得进展

太赫兹半导体激光器光注入锁定研究取得进展

清华大学电机系联合提出绿电直连绿氢化工的电氢协同降碳新技术

北京化工大学在活体化学发光成像方面取得进展

北京大学化学学院雷晓光课题组完成vermisporin等天然产物的首次全合成

清华大学建筑学院赵彬课题组合作揭示野火PM2.5室内暴露及干预成本的全球差异

清华大学深圳国际研究生院张锡辉团队在新型纳米催化陶瓷膜技术方向取得系列进展

城环学院朴世龙院士团队在《自然-气候变化》撰文揭示未来升温对北半球陆地植被生产力作用的变化规律