当前位置:首页 >> 学术资讯 >> 科研信息
小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区

【JPCS出版,EI和Scopus双检索】第八届能源技术与材料科学国际学术会议(ICETMS 2024)

【IEEE独立出版,院士报告,高校背书,快至3天录用】第五届信息科学与并行、分布式处理国际学术会议(ISPDS 2024)

【 高录用,快速见刊 | 往届均已见刊检索】第八届可再生能源与发展国际研讨会(IWRED 2024)

2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)

【河南大学主办 | 已有ISSN号丨SPIE独立出版丨录用率高丨检索快】第四届生物医学与生物信息工程国际学术会议(ICBBE 2024)

【提交ACM-ICPS出版, EI&Scopus检索稳定 | 同步提交知网,最快见刊后一个月内知网检索】第三届信息经济、数据建模与云计算国际学术会议 (ICIDC 2024)

【2024算力大会分会 | 前两届已完成EI检索!】2024云计算、性能计算与深度学习国际学术会议(CCPCDL 2024)

【JPCS出版,往届均已见刊检索,最快会后4个月EI检索】第三届智慧能源与能源物联网国际学术会议(SEEIoT 2024)

【四川省人工智能学会、中国民用航空飞行学院联合主办 | ACM出版 | EI(核心),Scopus检索】第四届大数据、人工智能与风险管理国际学术会议  (ICBAR 2024)

【ACM稳定EI检索 | 会议收录率高 | 有ISSN号】2024年智慧教育与计算机技术国际学术会议(IECT 2024)

【JPCS独立出版 (ISSN:1742-6596),往届已见刊并完成EI以及Scopus检索】第八届水动力学与能源电力系统国际学术会议(HEEPS 2024)

【CPCI,CNKI,Google scholar】第三届经济、智慧金融与当代贸易国际学术会议(ESFCT 2024)

【EI Compendex, Scopus检索】2024年图像处理、智能控制与计算机工程国际学术会议(IPICE 2024)

【JPCS出版,华中科技大学协办 | EI (核心),Scopus检索】2024年机器人前沿技术与创新国际会议(FTIR 2024)

2024年亚太计算技术、通信与网络国际会议(CTCNet 2024)

【IEEE精品会议,已确定ISBN号,见刊检索有保障!】第七届机电一体化与计算机技术工程国际学术会议(MCTE 2024)

2024年IEEE第五届控制,机器人与智能系统国际会议(CCRIS 2024)

【中南大学主办 | EI (核心) , Scopus检索】2024年智能驾驶与智慧交通国际学术会议(IDST 2024)

2024年第三届算法、数据挖掘和信息技术国际会议(ADMIT 2024)

2024年IEEE亚洲先进电气与电力工程会议(ACEPE 2024)

2024年第七届机器学习和自然语言处理国际会议(MLNLP 2024)

2024年第七届数据科学与信息技术国际会议(DSIT 2024)

会议展示区

【IEEE独立出版,院士报告,高校背书,快至3天录用!】第五届信息科学与并行、分布式处理国际学术会议(ISPDS 2024)

【高录用、快检索】【SPIE 独立出版 | ISSN: 0277-786X】第三届信号处理与通信安全国际学术会议(ICSPCS 2024)

2024年教育创新国际论坛(IEFI 2024)

【医工结合,高科技行业盛会,行业大咖,院士汇聚,ACM出版】2024年智能医疗与可穿戴智能设备国际学术会议(SHWID 2024)

【浙江工业大学主办,往届均已成功被EI、Scopus检索! EI检索稳定、快速】第五届物联网、人工智能与机械自动化国际学术会议 (IoTAIMA 2024)

【河南省科学院和河南大学联合主办 | SPIE出版 (ISSN: 0277-786X),往届已被EI收录检索】第二届遥感、测绘与地理信息系统国际学术会议(RSMG 2024)

第七届模式识别与人工智能国际会议 (PRAI 2024)

人工智能研究院助理教授杨耀东及合作者在多机器人安全协同控制研究中取得进展

2024/04/09

近日,人工智能研究院助理教授杨耀东及合作者在Artificial Intellgence Journal发表了题为“Safe multi-agent reinforcement learning for multi-robot control”的论文,提出了基于多智能体强化学习的多机器人决策安全性问题和相关算法以及Benchmarks,旨在解决多机器人协同控制中的安全问题。该研究为多机器人系统的安全控制提供了一种全新的解决方案,并为相关领域的发展作出了重要的贡献。

图1. 多机器人协作完成焊接任务 

图2. 多车协作完成自动驾驶避让

目前,多机器人系统已经广泛应用于各种领域,包括工业自动化、物流配送、救援任务等。然而,多机器人系统的控制仍存在一些困难和挑战,如机器人之间的相互作用、动态环境变化等,这些都给多机器人系统的安全控制带来了很大的难度。安全一直是机器人系统开发中的长期追求。在本研究中,研究人员采用安全强化学习解决机器人安全控制问题。在安全强化学习中,约束马尔可夫决策过程通常用于描述安全控制问题。在每个决策步骤中,环境都会产生决策的回报和成本,每个机器人需要在最大限度地提高奖励性能的同时,避免违反安全约束。然而,在现实世界中安全地协同控制多个机器人是一个具有挑战性的问题。更具体地说,需要确保每个机器人在非稳定的环境中尽可能好地完成任务(比如,奖励值越大越好),并且保证每个机器人的安全。例如,在图1中,多个工业机器人如何安全地协作完成焊接任务;在图2中,多个自动驾驶汽车如何安全地协作完成自动驾驶避让。

针对上述问题,本研究团队研究了多机器人协同控制的安全问题,并采用了基于多智能体强化学习的方法来解决。在这个问题中,每个机器人需要满足自己的安全约束,同时最大化其奖励,还必须考虑其他机器人的安全约束以保证整个机器人集群的安全性。

为实现上述目标,研究者首先将问题描述为带安全约束的马尔可夫博弈(图3),并采用策略优化理论来实现带安全约束的策略更新。在这个方法中,所有智能体都需要协作以最大化奖励值,并同时考虑安全约束。通过带安全约束的策略优化,研究者所提出的方法能够保证在每次算法迭代时满足安全约束,同时实现奖励值的单调上升。根据研究者提出的安全引理表明,当所有智能体的策略变化都足够小时,每个智能体都可以通过只考虑其自身的代理回报和代理成本来学习更好的策略。

图3. 带安全约束的马尔可夫博弈过程示意图

其次,基于本研究提出的安全引理、多智能体强化学习优势函数分解理论和顺序更新范式(图4),作为理论解的近似,研究者提出了两种安全的多智能体策略优化算法:多智能体的约束策略优化算法和多智能体近似策略优化的拉格朗日算法。我们利用神经网络来参数化智能体的策略,并分别基于线性搜索和拉格朗日优化算法来搜索安全策略,以此作为理论解的近似。

图4. 多智能体优势分解引理以及顺序更新范式示意图

第三,为了实现基于强化学习的多机器人安全协同控制,研究者开发了三个多智能体强化学习基准测试(benchmarks),它们都考虑了安全要素。这三个基准测试分别是:

Safe Multi-Agent MuJoCo(如图5、图6和图7所示),每一种颜色代表一个智能体,它们需要协作完成任务,例如向前移动,并且确保安全,即不碰撞到图中的红色墙壁;

Safe Multi-Agent Robosuite(图8、图9所示),多个机器人需要完成抓取或插入等任务,同时不能碰到图中的红色障碍物;

Safe Multi-Agent Isaac Gym(图10、图11所示),机器手需要将物体从一个手中抛到另外一个手中,并满足安全约束,如手指自由度约束等。

最后,研究者在以上三个考虑安全性的基准测试上进行实验,结果表明,与目前前沿的算法相比,本研究的方法可以在提高奖励和满足安全约束之间取得很好的性能。

图5. Safe 4x2-Ant task

图6. Safe 2x3-Manyagent Ant task

图7. Safe p1p-couple HalfCheetah task

图8. Safe 14x1-TwoArmPegInHole task

图9. Safe 4x2-Lift task

图10. Safe 2x6-ShadowHandOver tasks

图11.  Safe 2x6-ShadowHandOver2Uderarm task

综上所述,本研究通过引入安全性约束条件和多智能体强化学习技术,提出了一种新的解决方案。该方法通过引入多个机器人之间带约束的策略优化理论,使得每个机器人都可以在与其他机器人协同工作的同时,保持自身的安全性。在实验中,研究者验证了该方法的有效性和可行性。

该研究的贡献在于为多机器人系统提供了一种全新的安全控制技术,使机器人之间可以更加协同高效地工作。此外,该工作也为人工智能领域的研究提供了更多的思路和启示。未来,该研究团队将继续深入研究多机器人系统的安全控制技术,为智能制造和智慧物流等领域的发展作出更大的贡献。

北京大学人工智能研究院研究助理、慕尼黑工业大学计算机学院博士生顾尚定,牛津大学Kuba Grudzień为该论文的共同第一作者,杨耀东为通讯作者。合作者包括伦敦国王大学助理教授杜雅丽、慕尼黑工业大学Alois Knoll教授。


版权声明:
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

第四届计算机图形学、图像与虚拟化研究国际会议(ICCGIV 2024)(2024-05-17)

第九届机电控制技术与交通运输国际学术会议(ICECTT 2024)(2024-05-24)

2024年教育政策与实践研讨会(ICEPP 2024)(2024-05-24)

第三届机电一体化与机械工程国际会议(ICMME2024)(2024-05-24)

2024年电子器件、传感控制技术与光学机械工程国际学术会议(EDSCTOE 2024)(2024-05-25)

第十四届地质和地球物理学国际会议(ICGG 2024)(2024-05-31)

2024年食品工程与农业科学国际会议(ICFEAS 2024)(2024-06-02)

2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)(2024-06-07)

第十届机械工程、材料和自动化技术国际会议(MMEAT 2024)(2024-06-21)

2024年先进机器人,自动化工程与机器学习国际会议(ARAEML 2024)(2024-06-28)

2024年深度学习,人工智能与信息技术国际会议(DLAIIT 2024)(2024-5-22)

2024年交通工程、动力与能源国际会议 (TEPE 2024)(2024-6-25)

2024年兽医学与生物医用材料国际会议(ICVMBM 2024)(2024-6-29)

2024年船舶、机械制造与海洋科学国际会议(ICSEMMS2024)(2024-7-21)

2024年大数据与教育科学国际学术会议 (ICBDES 2024)(2024-5-26)

2024通信技术、密码学与网络安全国际学术会议(ICCTCNS 2024)(2024-6-24)

2024年计算机应用与智能控制国际学术会议(ICCAIC 2024)(2024-5-29)

2024实验室安全管理及应急处置专题培训提升班(2024-5-24)

2024年智能电网、大数据无线通信国际会议(SGBDWC 2024)(2024-5-25)

2024年公共卫生与现代医学国际会议(ICPHMM 2024)(2024-5-26)


2024年粤港澳大湾区教育数字化与计算机科学国际学术会议(EDCS 2024)
第五届机械工程与智能制造国际学术会议(MEIM 2024)
2024年计算机视觉、机器人与自动化工程国际学术会议(CRAE 2024)
第九届信息科学、计算机技术与交通运输国际学术会议(ISCTT 2024)
2024年土木工程结构与混凝土材料国际学术会议 (CESCM 2024)