北京大学杨耀东课题组在基于认知推理的具身智能可泛化灵巧操作技术研究上取得进展
2024/03/20
近日,由北京大学杨耀东课题组牵头,朱毅鑫课题组、董豪课题组及王鹤课题组作为核心骨干参与的“基于认知推理的具身智能可泛化灵巧操作技术研究”课题在北京市科委、中关村管委会进行验收工作,并通过项目综合绩效考核。

图1.多样化的灵巧手操作方式和被操作物体
在当前全球化的大背景下,机器人技术已经逐渐成为自动化工业制造、医疗手术和家居服务等多个领域的核心技术之一,特别是在灵巧操纵方面。灵巧操纵的本质是为机器人赋予灵活处理各种物体的决策能力,提升机器人在复杂场景下的可泛化自主决策能力和自适应性,使其能够像人类双手一样应对不同的环境和任务。然而,实现机器人的灵巧操纵仍面临多重技术挑战,例如,如何处理各种不同形状的甚至没见过的物体,并在精准感知环境的基础上实现高效的运动规划,以适应多变的场景。


图2.双灵巧手仿真平台Bi-DexHands的整体框架及所包含的丰富任务类型
自2022年项目成立以来,课题组基于认知推理、强化学习和计算机视觉技术,专注于解决现有机械手抓握策略仅能处理单一类型抓取物、缺乏泛化性、安全性以及缺乏相应高度仿真平台和数据集等核心问题。
具体而言,课题组从系统构建、数据采集、面向特定任务的抓取算法以及通用可泛化的抓取操作等方面展开研究,成功开发了适用于单/多智能体学习算法研究的高效灵巧机械手仿真系统并成为灵巧操作领域的重要基准环境之一;构建了高质量、多样化的大规模灵巧机械手抓取数据集;基于认知推理技术,大幅度提升了机械手在多类型目标物、复杂手型、多样抓握姿势和抓取任务上的泛化能力;获得了通用的灵巧机械手抓取策略,最终圆满完成所有考核指标,在基于视觉的真实世界复杂机械手抓取任务中部署了所提出的解决方案并取得了突出的效果。

图3.课题组提出的可供性学习方式能够帮助机器人在真实世界中完成多样的操作任务
基于本项目所使用的技术,杨耀东课题组获得了NeurIPS 2022灵巧操作挑战赛冠军,在340个队伍中位列第1。相关研究在计算机和机器人顶级会议和期刊上发表了11篇学术论文。其中,课题组所开发的双灵巧手仿真平台Bi-DexHands能够同时并行数千个环境,在 GPU(NVIDIA RTX 3090)单卡环境下,每秒仿真帧数速率达到 65,000帧/秒以上,为双灵巧手学习提供了高效的训练系统。灵巧操作任务设计遵循精细运动测试(FMS)的原则,建立了婴儿年龄和操作任务之间的映射,为观察和评估机械手在不同成长阶段操纵物体和使用工具的能力提供了高度类人的强大基准,同时面向这些任务提供了全面的单智能体/多智能体/离线/多任务/元强化学习算法基准,相关论文“Bi-DexHands: Towards Human-Level Bimanual Dexterous Manipulation”于2023年11月被人工智能领域顶级国际期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)接收,影响因子为24.314。课题组进一步针对异构灵巧手合作困难的问题,设计了适用于异构多智能体系统的强化学习算法,且提供了策略单调递增和收敛性的理论保证,相关论文“Heterogeneous-Agent Reinforcement Learning”于2023年12月被机器学习领域顶级国际期刊Journal of Machine Learning Research(JMLR)接收。课题组在国际顶级学术会议中也同样取得优异成绩,其中一项研究工作“UniDexGrasp++: Improving Dexterous Grasping Policy Learning via Geometry-aware Curriculum and Iterative Generalist-Specialist Learning”在ICCV 2023中获得满分评审,并被ICCV 2023提名最佳论文入围奖,另一项研究工作“GAPartNet: Cross-Category Domain-Generalizable Object Perception and Manipulation via Generalizable and Actionable Parts”在CVPR 2023中获得全满分的评审成绩并被评为Highlight,位列投稿论文前2.5%。课题相关的开源代码库也已获星累计1000+。在此研究基础上,本课题组申请了2项发明专利,力求将所开发的平台和算法应用于智能假肢系统,为残疾人的安全灵巧操作提供技术保障。这些研究成果大幅度提升了我国在灵巧操作领域的学术地位和工业水平,拓展了智能机器人的实际应用范围。


图4.课题组获得NeurIPS 2022灵巧操作挑战赛冠军以及ICCV 2023最佳论文入围提名


图5.课题组开发的双灵巧手操作仿真平台和全面的多智能体强化学习算法基准库
2023年,具身智能机器人领域经历了快速的发展。与此同时,相关国家政策的逐步完善和北京市科技委等科技部门的大力支持也进一步促进了具身智能机器人的技术创新和商业应用的实现。其中,灵巧操作模块作为具身智能体的核心组件,是推动机器人技术应用于真实场景的关键之一。在这样的背景下,“基于认知推理的具身智能可泛化灵巧操作技术研究”项目的成功研发和应用验证显得尤为重要和及时,再次展现了我国在技术创新和发展方面的前瞻性和决策力。
该研究工作得到北京市科委北京市科技计划“2022年中央引导地方科技发展专项”提供的支持。
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年6月优质国际学术会议推荐 7
-
2026年第17届机械与航空航天工程 193
-
2026年先进航空航天技术与卫星应用 324
-
2026资源、化学化工与应用材料国际 1808
-
2026年图像处理与数字创意设计国际 1632
-
2026年机械工程,新能源与电气技术 6095
-
2026年材料科学、低碳技术与动力工 1819
-
2026年艺术、文化产业与数字媒体国 04-29
-
2026年智慧教育、教育研究与文化交 04-29
-
2026年数字社会、公共管理与经济学 04-29
-
2026 政务服务、数字治理与智慧城 04-28
-
2026 制冷技术、暖通设备与环境调 04-28
-
2026 轻工材料、绿色制造与循环利 04-28
-
2026 多语言智能、翻译技术与国际 04-28
-
2026 生物育种、生态种植与现代农 04-28
-
中国科协发布2025年《重要学术12
-
2026年新锐分区(原中科院期刊2595
-
2025年两院院士增选有效候选人4402
-
2025最新JCR分区及影响因子12342
-
好学术:科研网址导航|学术头条分5673
-
2025年国际期刊预警名单发布!5837
-
2025年中科院期刊分区表重磅发20812
-
吉林大学校长张希:学术会议中的提6954
-
二维超导迈斯纳效应探测研究获进展04-29
-
研究发现笼目超导体中多重范霍夫奇04-29
-
二氧化碳加氢制高碳烯烃与航煤馏分04-29
-
靶向特定蛋白互作界面抑制乙肝病毒04-29
-
研究揭示内源信使调控膜损伤与细胞04-29
-
科学家绘制大脑星形胶质细胞转录因04-29
-
上海交大Bio-X研究院石毅与合04-29
-
天津市科学技术信息研究所 18423

-
西北工业大学 2528

-
中科院合肥智能所 18346

-
上海永飞投资咨询有限公司 23320

-
全国卫生产业企业管理协会抗菌产业 23263

-
长春新吉粮大酒店 18312

-
APISE 23304

-
中金建银投资管理(北京)有限责任 21504

-
工程信息研究院 23539

-
大秦国际--新疆西部游旅行社会议 18582

-
北京企联高科高分子技术中心 24428

-
European Allianc 2688

-
上海市粘接技术协会 21253

-
中国农业大学 21447

-
国际工学技术出版协会 23333

-
厦门市厚百智库科技有限公司 24266

-
中国机械工程学会工业工程分会 21930

-
武汉金钥匙会务服务有限公司 8286

-
工业和信息化部软件与集成电路促进 21391

-
上海大学 23347





















1026






































