北京大学杨耀东课题组在基于认知推理的具身智能可泛化灵巧操作技术研究上取得进展
2024/03/20
近日,由北京大学杨耀东课题组牵头,朱毅鑫课题组、董豪课题组及王鹤课题组作为核心骨干参与的“基于认知推理的具身智能可泛化灵巧操作技术研究”课题在北京市科委、中关村管委会进行验收工作,并通过项目综合绩效考核。

图1.多样化的灵巧手操作方式和被操作物体
在当前全球化的大背景下,机器人技术已经逐渐成为自动化工业制造、医疗手术和家居服务等多个领域的核心技术之一,特别是在灵巧操纵方面。灵巧操纵的本质是为机器人赋予灵活处理各种物体的决策能力,提升机器人在复杂场景下的可泛化自主决策能力和自适应性,使其能够像人类双手一样应对不同的环境和任务。然而,实现机器人的灵巧操纵仍面临多重技术挑战,例如,如何处理各种不同形状的甚至没见过的物体,并在精准感知环境的基础上实现高效的运动规划,以适应多变的场景。


图2.双灵巧手仿真平台Bi-DexHands的整体框架及所包含的丰富任务类型
自2022年项目成立以来,课题组基于认知推理、强化学习和计算机视觉技术,专注于解决现有机械手抓握策略仅能处理单一类型抓取物、缺乏泛化性、安全性以及缺乏相应高度仿真平台和数据集等核心问题。
具体而言,课题组从系统构建、数据采集、面向特定任务的抓取算法以及通用可泛化的抓取操作等方面展开研究,成功开发了适用于单/多智能体学习算法研究的高效灵巧机械手仿真系统并成为灵巧操作领域的重要基准环境之一;构建了高质量、多样化的大规模灵巧机械手抓取数据集;基于认知推理技术,大幅度提升了机械手在多类型目标物、复杂手型、多样抓握姿势和抓取任务上的泛化能力;获得了通用的灵巧机械手抓取策略,最终圆满完成所有考核指标,在基于视觉的真实世界复杂机械手抓取任务中部署了所提出的解决方案并取得了突出的效果。

图3.课题组提出的可供性学习方式能够帮助机器人在真实世界中完成多样的操作任务
基于本项目所使用的技术,杨耀东课题组获得了NeurIPS 2022灵巧操作挑战赛冠军,在340个队伍中位列第1。相关研究在计算机和机器人顶级会议和期刊上发表了11篇学术论文。其中,课题组所开发的双灵巧手仿真平台Bi-DexHands能够同时并行数千个环境,在 GPU(NVIDIA RTX 3090)单卡环境下,每秒仿真帧数速率达到 65,000帧/秒以上,为双灵巧手学习提供了高效的训练系统。灵巧操作任务设计遵循精细运动测试(FMS)的原则,建立了婴儿年龄和操作任务之间的映射,为观察和评估机械手在不同成长阶段操纵物体和使用工具的能力提供了高度类人的强大基准,同时面向这些任务提供了全面的单智能体/多智能体/离线/多任务/元强化学习算法基准,相关论文“Bi-DexHands: Towards Human-Level Bimanual Dexterous Manipulation”于2023年11月被人工智能领域顶级国际期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)接收,影响因子为24.314。课题组进一步针对异构灵巧手合作困难的问题,设计了适用于异构多智能体系统的强化学习算法,且提供了策略单调递增和收敛性的理论保证,相关论文“Heterogeneous-Agent Reinforcement Learning”于2023年12月被机器学习领域顶级国际期刊Journal of Machine Learning Research(JMLR)接收。课题组在国际顶级学术会议中也同样取得优异成绩,其中一项研究工作“UniDexGrasp++: Improving Dexterous Grasping Policy Learning via Geometry-aware Curriculum and Iterative Generalist-Specialist Learning”在ICCV 2023中获得满分评审,并被ICCV 2023提名最佳论文入围奖,另一项研究工作“GAPartNet: Cross-Category Domain-Generalizable Object Perception and Manipulation via Generalizable and Actionable Parts”在CVPR 2023中获得全满分的评审成绩并被评为Highlight,位列投稿论文前2.5%。课题相关的开源代码库也已获星累计1000+。在此研究基础上,本课题组申请了2项发明专利,力求将所开发的平台和算法应用于智能假肢系统,为残疾人的安全灵巧操作提供技术保障。这些研究成果大幅度提升了我国在灵巧操作领域的学术地位和工业水平,拓展了智能机器人的实际应用范围。


图4.课题组获得NeurIPS 2022灵巧操作挑战赛冠军以及ICCV 2023最佳论文入围提名


图5.课题组开发的双灵巧手操作仿真平台和全面的多智能体强化学习算法基准库
2023年,具身智能机器人领域经历了快速的发展。与此同时,相关国家政策的逐步完善和北京市科技委等科技部门的大力支持也进一步促进了具身智能机器人的技术创新和商业应用的实现。其中,灵巧操作模块作为具身智能体的核心组件,是推动机器人技术应用于真实场景的关键之一。在这样的背景下,“基于认知推理的具身智能可泛化灵巧操作技术研究”项目的成功研发和应用验证显得尤为重要和及时,再次展现了我国在技术创新和发展方面的前瞻性和决策力。
该研究工作得到北京市科委北京市科技计划“2022年中央引导地方科技发展专项”提供的支持。
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025年11月优质学术会议推荐 16
-
2025年机器视觉、智能成像与模式识 392
-
2025年第七届控制与机器人国际会议 576
-
2025年智能光子学与应用技术国际学 1529
-
2025年机械工程,新能源与电气技术 1790
-
2025年计算机科学、图像分析与信号 2065
-
2025年材料化学与燃料电池技术国际 1861
-
2025年自动化前沿系统、智慧城市与 10-23
-
2025年信息光学、遥感技术与机器视 10-23
-
2025年数字人文、文化遗产与语言学 10-23
-
2025年神经科学、生物信息学与智能 10-23
-
2025年语言认知、人工智能与计算建 10-23
-
2025年社会科学、应用语言学与人文 10-23
-
2025年传统机械、动力学与智能装备 10-23
-
2025年图像处理、物理建模与结构设 10-23
-
2025年两院院士增选有效候选人1145
-
2025最新JCR分区及影响因子4758
-
好学术:科研网址导航|学术头条分2033
-
2025年国际期刊预警名单发布!1930
-
2025年中科院期刊分区表重磅发8447
-
中国科协《重要学术会议目录(205134
-
吉林大学校长张希:学术会议中的提2840
-
清华大学地学系阳坤课题组揭示全球10-20
-
历史时期极端干旱灾害的数据评估和10-20
-
“清华化学百年论坛:塑造化学的未10-20
-
研究揭示植物激素独脚金内酯作为跨10-20
-
清华大学联合研发的“46MW大容10-20
-
清华大学(软件学院)-九疆电力建10-20
-
中国农业大学土地学院马韫韬教授团10-20
-
电子科技大学光电学院本科生在一区10-20
-
武汉金钥匙会务服务有限公司 21100

-
中国物流与采购联合会 21419

-
西安交通大学 18243

-
北京铭世博国际展览有限公司 2188

-
SG 8170

-
北京沃玉科技发展中心 8293

-
香港维科 2138

-
上海英致商务咨询有限公司 1990

-
华南理工大学 18064

-
成都军区昆明总医院全军骨科中心 17988

-
徐州蚁行天下会议服务有限公司 17959

-
沈阳航空航天大学 8273

-
2017第二届能源工程与环境保护 24108

-
广州国龙会议策划服务有限公司 24113

-
cmo 21012

-
北京农业工程学会 18161

-
科技有限公司 17973

-
上海诗成文化发展有限公司 24227

-
浙江省转化医学学会 8170

-
NMRA 24198

















835












































