当前位置:首页 >> 学术资讯 >> 科研信息
小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区

【JPCS出版,EI和Scopus双检索】第八届能源技术与材料科学国际学术会议(ICETMS 2024)

【IEEE独立出版,院士报告,高校背书,快至3天录用】第五届信息科学与并行、分布式处理国际学术会议(ISPDS 2024)

【 高录用,快速见刊 | 往届均已见刊检索】第八届可再生能源与发展国际研讨会(IWRED 2024)

2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)

【河南大学主办 | 已有ISSN号丨SPIE独立出版丨录用率高丨检索快】第四届生物医学与生物信息工程国际学术会议(ICBBE 2024)

【提交ACM-ICPS出版, EI&Scopus检索稳定 | 同步提交知网,最快见刊后一个月内知网检索】第三届信息经济、数据建模与云计算国际学术会议 (ICIDC 2024)

【2024算力大会分会 | 前两届已完成EI检索!】2024云计算、性能计算与深度学习国际学术会议(CCPCDL 2024)

【JPCS出版,往届均已见刊检索,最快会后4个月EI检索】第三届智慧能源与能源物联网国际学术会议(SEEIoT 2024)

【四川省人工智能学会、中国民用航空飞行学院联合主办 | ACM出版 | EI(核心),Scopus检索】第四届大数据、人工智能与风险管理国际学术会议  (ICBAR 2024)

【ACM稳定EI检索 | 会议收录率高 | 有ISSN号】2024年智慧教育与计算机技术国际学术会议(IECT 2024)

【JPCS独立出版 (ISSN:1742-6596),往届已见刊并完成EI以及Scopus检索】第八届水动力学与能源电力系统国际学术会议(HEEPS 2024)

【CPCI,CNKI,Google scholar】第三届经济、智慧金融与当代贸易国际学术会议(ESFCT 2024)

【EI Compendex, Scopus检索】2024年图像处理、智能控制与计算机工程国际学术会议(IPICE 2024)

【JPCS出版,华中科技大学协办 | EI (核心),Scopus检索】2024年机器人前沿技术与创新国际会议(FTIR 2024)

2024年亚太计算技术、通信与网络国际会议(CTCNet 2024)

【IEEE精品会议,已确定ISBN号,见刊检索有保障!】第七届机电一体化与计算机技术工程国际学术会议(MCTE 2024)

2024年IEEE第五届控制,机器人与智能系统国际会议(CCRIS 2024)

【中南大学主办 | EI (核心) , Scopus检索】2024年智能驾驶与智慧交通国际学术会议(IDST 2024)

2024年第三届算法、数据挖掘和信息技术国际会议(ADMIT 2024)

2024年IEEE亚洲先进电气与电力工程会议(ACEPE 2024)

2024年第七届机器学习和自然语言处理国际会议(MLNLP 2024)

2024年第七届数据科学与信息技术国际会议(DSIT 2024)

会议展示区

【IEEE独立出版,院士报告,高校背书,快至3天录用!】第五届信息科学与并行、分布式处理国际学术会议(ISPDS 2024)

【高录用、快检索】【SPIE 独立出版 | ISSN: 0277-786X】第三届信号处理与通信安全国际学术会议(ICSPCS 2024)

2024年教育创新国际论坛(IEFI 2024)

【医工结合,高科技行业盛会,行业大咖,院士汇聚,ACM出版】2024年智能医疗与可穿戴智能设备国际学术会议(SHWID 2024)

【浙江工业大学主办,往届均已成功被EI、Scopus检索! EI检索稳定、快速】第五届物联网、人工智能与机械自动化国际学术会议 (IoTAIMA 2024)

【河南省科学院和河南大学联合主办 | SPIE出版 (ISSN: 0277-786X),往届已被EI收录检索】第二届遥感、测绘与地理信息系统国际学术会议(RSMG 2024)

第七届模式识别与人工智能国际会议 (PRAI 2024)

人工智能研究院朱松纯、朱毅鑫团队在机器人场景重建、使用动作信息助力机器人自主规划方向取得重要进展

2024/04/16

近日,人工智能研究院朱松纯、朱毅鑫教授团队在IJCV 2022发表论文《Scene Reconstruction with Functional Objects for Robot Autonomy》,提出了一个全新的场景重建问题和场景图表征,为机器人自主规划提供必要的信息,并为其仿真测试提供了与现实场景功能相近的可交互的虚拟场景。同时,这一工作也开发了一个完整的机器视觉系统,以实现所提出的场景重建问题。实验证明了所提出的场景重建方法的有效性,以及场景图表征在机器人自主规划方面的潜力。

感知三维环境并理解其中包含的信息是人类智能的重要体现,也是人类与环境随心交互的前提。在环境的几何特征与物体的语义信息之外,我们还能“感知”到与环境的潜在交互方式,我们称之为环境中动作信息(actionable information)。例如,当我们看到图1(a) 中的门把手时,我们脑海里会自然地出现转动门把手并拉开门的潜在动作,而在图1(b) 的场景里,我们能够轻松地观测到堆叠的茶杯和碗碟的约束关系(相互支撑),以及不同的动作对它们状态的影响(直接抽取下面的碗碟会打翻上面碗碟和茶杯,而逐一移走最上面的物体后则可以安全地拿取下面的碗碟)。理解潜在动作对场景的影响,构成了我们在场景中执行任务并与之交互的基础。相应地,智能机器人也需要类似的感知能力,才能使其在环境中自主地完成复杂的长时程(long-horizon)规划。

图1 (a) 门把手,(b) 堆叠的茶杯和碗碟(图片来源于网络,版权归原作者所有)

随着三维场景重建(3D scene reconstruction)与语义建图(semantic mapping)技术渐趋成熟,机器人已经能够有效地建立包含几何与语义信息的三维地图,例如包括物体与房间结构的语义全景地图(panoptic map),如图2(b)。然而这些传统场景重建的场景表征(scene representation)与实现机器人自主规划之间,仍然有难以逾越的鸿沟。那么问题来了,我们如何能构造一种通用于机器人感知(perception)和规划(planning)的场景表征,以提高机器人的自主规划能力呢?机器人如何能利用自身传感器输入(例如RGB-D相机)在真实场景中建立这样的场景表征?

在这篇论文[1]中,研究人员提出了一个全新的研究问题:重建与现实场景功能相同的(functionally-equivalent)、可交互的(interactive)虚拟场景,以保留原场景的潜在动作信息。重建后的虚拟场景可以被用于机器人自主规划的仿真训练与测试。为实现这一重建任务,研究人员提出了一种基于物理支撑(supporting relation)与紧邻(proximal relation)关系的场景图表征,如图2(a);它的每个节点代表场景中的一个物体或者一种房间结构(墙/地面/房顶)。这一场景图表征将重建后的场景以及其中包含的物理约束有机组织起来,以保证得到的虚拟场景是符合物理常识的。同时,它可以直接被转换成环境的树状运动链(kinematic tree),完整地描述了环境的运动学关系状态,并支持前向预测机器人动作对环境的影响,可被直接用于机器人规划任务中。这篇论文也提出了一个完整的机器视觉系统来实现这一重建任务,并为重建后的场景设计了输出接口,使其能够被无缝接入机器人仿真器(例如Gazebo)和VR环境中。这一论文的部分前期工作[2]曾发表在ICRA 2021上。

图2(a) 基于支撑与紧邻关系的场景图,(b) 体积式语义全景建图,(c) 与现实场景功能相同的、可交互的虚拟场景,可用于机器人自主规划的仿真测试

在虚拟环境中重建真实场景以支持机器人仿真并非一个简单的问题。主要的难点有三:一是如何在杂乱的真实场景中准确重建并分割出每个物体与结构的几何,并估计物体间的物理约束(比如支撑关系等);二是如何将重建出的不完整的几何形状替换成完整的、可交互的物体(例如CAD模型);三是如何将所有的这些信息有机融入某种通用的场景表达,同时帮助场景重建和机器人自主规划。

这项工作提出利用一种特殊的场景图作为连接场景重建与机器人交互的桥梁,在帮助重建出符合物理常识的虚拟场景的同时,为机器人自主规划提供必要的信息。一方面,这一场景图将场景中感知到的物体、房间结构以及它们之间的关系组织起来,如图3(a) 所示。它的每个节点代表识别并重建出的真实场景中的物体或者房间结构,包括了它的几何(例如重建出的三维网格(mesh)、三维最小包围盒、提取出的平面特征等)与语义信息(如实例与语义标签);而每条边则表示节点之间的支撑关系【见图3 (a) 中的有向边】或者紧邻关系【图3 (a)中的无向边】,代表着某些物理约束信息。比如对支撑关系来说,父节点需要包含水平的支撑面来实现对子节点的稳定支撑;再如对紧邻关系来说,相互接近的两个节点的三维几何不应该有相互的重叠等。另一方面,根据语义与几何的形似性并综合考虑节点间的约束,图3 (a) 中的节点被替换成几何完整的、可交互的CAD模型【包括多关节(articulated)的CAD模型】,进而得生成可用于机器人仿真交互的虚拟场景,如图3 (b)。这样的虚拟场景在感知能力允许的范围内尽可能保留了真实场景的功能(functionality),也就是潜在动作信息,可以有效实现对现实场景中与物体交互结果的仿真。而相应地,得到的场景图表征也包含了对环境运动学以及约束状态的完整描述,可用来预测机器人动作对运动学状态的短期定量影响并帮助机器人运动规划,以及估计机器人动作对约束关系造成的长期定性影响并支持机器人任务规划。

图3 (a) 直接重建出的场景图,(b) 替换CAD模型后的可交互场景图

图4 用于重建任务的机器视觉系统流程图

为实现上述的重建任务,论文作者设计并实现了一个多模块的机器视觉系统:一个体积式语义全景建图模块【图4 (A)】,和一个基于物理常识与几何的CAD模型替换推理模块【图4 (B)】。前者被用于鲁棒地在复杂真实环境中借助RGB-D相机识别、分割并重建出物体与房间结构的稠密几何,并估计它们之间的约束关系,以得到如图3 (a) 中的场景图;而后者聚焦于如何根据重建物体的几何特征与识别出的约束关系从CAD模型库中选择最合适的CAD模型,并估计其位姿与尺度,以达到与原物体尽可能准确的对齐,进而生成图3 (b) 所示的可交互的场景图。图5展示了论文作者借助Kinect2相机对真实办公室场景的重建结果,包括体积式全景重建【图5 (a)】、可交互虚拟场景常见【图5 (b) 】以及将虚拟场景导入机器人仿真器后机器人交互的样例【图5 (c)】。我们可以看到,即使在复杂、多遮挡的真实场景中,论文提出的重建系统能较好地建立可交互的虚拟场景。图5 (d-f) 展示了这一实验中的一些有趣的例子:图5 (d) 中,由于椅子对桌子的遮挡,同一个桌子被重建成两个相对短小的桌子;图5 (e) 展示的工位得到了比较高质量的重建,所有的物体都被替换成了外表相近的CAD模型;图5 (f) 中的椅子未能被识别出来,其对后面桌子的遮挡造成了与图5 (d) 相似的情况,而场景中的冰箱与微波炉被重建出来并替换成了多关节、可承载复杂交互的CAD模型。

图5 在真实环境中用Kinect2相机的重建结果

图6 在重建的虚拟场景中的机器人任务与动作规划

在重建得到的可交互虚拟场景里,借助场景图反映的运动链以及约束信息,机器人可以进行任务与动作规划[3,4],其仿真效果如图6所示。在最近的相关的工作[5]中,基于上文所述的场景图表征,机器人可以直接根据图编辑距离(graph editing distance)进行复杂的任务规划,并高效地生成动作。

这项工作提出了一个全新的场景重建问题和场景图表征,为机器人自主规划提供必要的信息,并为其仿真测试提供了与现实场景功能相近的可交互的虚拟场景。同时,这一工作也开发了一个完整的机器视觉系统,以实现所提出的场景重建问题。实验证明了所提出的场景重建方法的有效性,以及场景图表征在机器人自主规划方面的潜力。

未来,我们期待这项工作的进一步拓展:如何更鲁棒、更精准地实现刚体与多关节CAD模型与重建几何的匹配、如何在场景图中融合更复杂的潜在动作信息、以及如何更好地利用场景提进行机器人规划。场景图重建助力自主规划,更智能的机器人就在不远的将来。

参考文献

[1] Han, Muzhi, et al. “Scene Reconstruction with Functional Objects for Robot Autonomy.” 2022 International Journal of Computer Vision (IJCV), link.springer.com, 2022.

[2] Han, Muzhi, et al. “Reconstructing Interactive 3D Scenes by Panoptic Mapping and CAD Model Alignments.” 2021 IEEE International Conference on Robotics and Automation (ICRA), ieeexplore.ieee.org, 2021, pp. 12199–206.

[3] Jiao, Ziyuan, et al. “Consolidating Kinematic Models to Promote Coordinated Mobile Manipulations.” 2021 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), IEEE, 2021, doi:10.1109/iros51168.2021.9636351.

[4] Jiao, Ziyuan, et al. “Efficient Task Planning for Mobile Manipulation: A Virtual Kinematic Chain Perspective.” 2021 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), ieeexplore.ieee.org, 2021, pp. 8288–94.

[5] Jiao, Ziyuan, et al. “Sequential Manipulation Planning on Scene Graph.” 2022 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), ieeexplore.ieee.org, 2022.


版权声明:
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

第四届计算机图形学、图像与虚拟化研究国际会议(ICCGIV 2024)(2024-05-17)

第九届机电控制技术与交通运输国际学术会议(ICECTT 2024)(2024-05-24)

2024年教育政策与实践研讨会(ICEPP 2024)(2024-05-24)

第三届机电一体化与机械工程国际会议(ICMME2024)(2024-05-24)

2024年电子器件、传感控制技术与光学机械工程国际学术会议(EDSCTOE 2024)(2024-05-25)

第十四届地质和地球物理学国际会议(ICGG 2024)(2024-05-31)

2024年食品工程与农业科学国际会议(ICFEAS 2024)(2024-06-02)

2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)(2024-06-07)

第十届机械工程、材料和自动化技术国际会议(MMEAT 2024)(2024-06-21)

2024年先进机器人,自动化工程与机器学习国际会议(ARAEML 2024)(2024-06-28)

2024年通讯工程与信息技术国际会议(ICCEIT 2024)(2024-6-30)

2024电子科学、技术与自动化国际会议(ICESTA 2024)(2024-7-20)

2024年社会科学和科学管理国际会议(ICSSSM 2024)(2024-6-30)

2024年航空航天机械工程国际会议(CoMEA 2024)(2024-5-24)

2024年天体物理与空间科学国际会议(ICASS 2024)(2024-6-22)

2024年应用心理学、艺术与文化交流国际学术会议(IACAPACE 2024)(2024-6-20)

2024年海洋信息技术、地球科学与遥感测绘国际会议(MITESRSM 2024)(2024-7-27)

2024年复合医学与组织胚胎学国际会议(ICCMTE 2024)(2024-5-25)

2024年第十六届生物信息学和生物医学技术国际会议(ICBBT 2024)(2024-5-24)

2024年航空航天、机械工程与机电一体化国际会议(CAMME 2024)(2024-5-24)


2024年粤港澳大湾区教育数字化与计算机科学国际学术会议(EDCS 2024)
第五届机械工程与智能制造国际学术会议(MEIM 2024)
2024年计算机视觉、机器人与自动化工程国际学术会议(CRAE 2024)
第九届信息科学、计算机技术与交通运输国际学术会议(ISCTT 2024)
2024年土木工程结构与混凝土材料国际学术会议 (CESCM 2024)