自动化系封硕与密西根大学学者合作实现基于密集强化学习的自动驾驶汽车安全性测试
2024/04/12
随着自动驾驶技术的快速发展,交通系统正面临着前所未有的革命。过去20年里,自动驾驶技术取得了巨大进步,然而截至目前,L4级别自动驾驶汽车尚未实现商业化落地。造成这种情况的原因有很多,最重要的是自动驾驶汽车的安全性能仍未能达到大规模落地应用的要求,而自动驾驶汽车安全性测试的低效率难题成为了阻碍安全性提升的关键障碍。据测算,要可靠地测试评估高水平自动驾驶汽车的安全性能,需要完成数百亿公里的测试里程,这严重滞缓了自动驾驶汽车测试研发的迭代过程。
为解决这一问题,清华大学自动化系智能交通研究团队封硕助理教授与美国密西根大学Mcity主任刘向宏(Henry Liu)教授等科研人员合作提出了基于密集强化学习的自动驾驶汽车加速测试方法,通过密集学习生成了专注安全关键场景的智能测试环境,解决了自动驾驶所面临的“稀疏度灾难”全新挑战,实现了只需智能测试环境中的少量测试里程即可等效于自然测试环境中的海量测试里程,加速了自动驾驶汽车安全性测试评估过程103~105倍。
具体而言,自动驾驶汽车安全性测试问题的本质是超高维空间小概率事件期望估计问题,其核心挑战来自“维度灾难”和“稀疏度灾难”的复合效应。“维度灾难”是指驾驶环境的时空复杂性导致环境变量超高维,使得算法计算复杂度指数增加;而“稀疏度灾难”是指安全关键事件的稀疏性使得变量空间中的多数样本无法为学习提供有效信息,导致了传统学习方法的失效。面对上述挑战,研究提出了密集强化学习方法(Dense Deep Reinforcement Learning,D2RL),通过识别和删除非安全关键状态、连接安全关键状态,并在编辑后的马尔科夫过程中训练神经网络,解决了上述“稀疏度灾难”(图1)。利用密集强化学习方法训练交通环境中背景车辆使其学习何时执行何种对抗性策略,可以构建一个智能测试环境,减少所需测试里程多个数量级,同时确保测试结果等效性。基于增强现实测试平台,研究团队在美国密西根大学Mcity和美国交通中心的测试场中使用上述方法对L4级自动驾驶汽车进行了安全性测试(图2)。结果表明上述方法可以有效学习生成智能测试环境,与直接在自然驾驶环境中测试自动驾驶汽车相比,智能测试环境可以加快评估过程多个数量级(约103~105)。

图1.密集学习方法通过删除非关键状态、连接关键状态来编辑马尔可夫过程,然后通过编辑后的马尔可夫过程训练神经网络

图2.增强现实测试平台可以通过虚拟背景车辆增强现实世界,为自动驾驶汽车提供更安全、更可控、更高效的测试环境
近日,相关研究成果以“基于密集强化学习的自动驾驶汽车安全性测试”(Dense Reinforcement Learning for Safety Validation of Autonomous Vehicles)为题发表在《自然》(Nature)正刊上,被选为该期封面论文,并获得《自然·新闻与观点》(Nature News and Views)、《自然·播客》(Nature Podcast)、《自然·视频》(Nature Videos)等的同步报道。

图3.《自然》(Nature)封面
该论文第一作者为清华大学自动化系封硕助理教授,通讯作者为美国密西根大学Mcity主任刘向宏(Henry Liu)教授。其他主要合作者包括美国密西根大学孙昊葳(Haowei Sun)、严鑫涛(Xintao Yan)、朱昊杰(Haojie Zhu)、邹征夏(Zhengxia Zou)和沈晟印(Shengyin Shen)。
文章来源清华大学新闻,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年4月高录用检索快国际学术会 32
-
2026年第六届计算机、控制和机器人 102
-
2026资源、化学化工与应用材料国际 1529
-
2026年人工智能教育技术与数据科学 535
-
2026年图像处理与数字创意设计国际 1294
-
2026年机械工程,新能源与电气技术 5759
-
2026年材料科学、低碳技术与动力工 1546
-
2026年第二届无线与光通信国际会议 2307
-
2026年增材制造、3D打印与创新设 03-13
-
2026年车辆工程与新能源汽车国际会 03-13
-
2026年精密机械、仪器仪表与传感技 03-13
-
2026年机器人技术、智能装备与自动 03-13
-
2026年通信系统、网络与信号处理国 03-13
-
2026年智能制造、工业互联网与数字 03-13
-
2026年环境治理、生态修复与碳中和 03-13
-
2026年中科院期刊分区表(新锐10
-
2025年两院院士增选有效候选人4281
-
2025最新JCR分区及影响因子11266
-
好学术:科研网址导航|学术头条分5427
-
2025年国际期刊预警名单发布!5541
-
2025年中科院期刊分区表重磅发18728
-
中国科协《重要学术会议目录(2011157
-
吉林大学校长张希:学术会议中的提6696
-
中国科大研制出机器人灵巧手指尖六03-11
-
研究揭示遗传多样性如何重塑微生物03-11
-
研究发现双酰胺类杀虫剂影响蜜蜂蜂03-11
-
研究揭示聚焦光场中内禀自旋纹理03-11
-
新型磁流体机器人破解临床难题03-11
-
南京大学物理学院温锦生课题组在亚03-11
-
南京大学物理学院高力波、袁国文团03-11
-
International As 8284

-
成夏 23283

-
第4届IEEE灰色系统与智能服务 21450

-
武汉华联帕博文化传播有限公司 2260

-
星河系教育 2254

-
北京艾尚国际展览有限公司 2255

-
山东视联风行信息科技发展有限公司 2841

-
SHDIF 8305

-
西安华线石油科技有限公司 21301

-
北京中农智汇投资咨询有限公司 8352

-
湖南国贸大酒店 18733

-
荣羿(北京)医学技术有限公司 8208

-
南开大学商学院 21329

-
杭州师范大学 2116

-
浙江工业大学经贸管理学院 21195

-
北京现代华清材料科技发展中心 8191

-
厦门东南馨都会展服务有限公司 18202

-
WILL 8394

-
北京泛地能源咨询 21341

-
科严文化发展有限公司 2181

















614













































