北理工团队在激光雷达点云数据3D目标检测领域取得新突破
2023/12/26

该研究成果以题为“MsSVT++: Mixed-scale Sparse Voxel Transformer with Center Voting for 3D Object Detection”的论文形式发表在国际顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》上。IEEE TPAMI作为人工智能、模式识别和图像处理等领域的顶级权威期刊,其影响因子为23.6,是中国计算机协会(CCF)推荐的人工智能领域A类期刊。论文的第一作者为北京理工大学李佳男副研究员,通讯作者为许廷发教授。
针对真实大规模场景中存在的远距离目标误检漏检和3D检测模型在精度和计算效率之间难以平衡的瓶颈问题,科研团队提出了一种全稀疏体素Transformer点云特征提取网络架构(MsSVT),如图1所示。该网络架构引入了混合尺度注意力机制,捕获感兴趣目标的局部细粒度几何信息与长程上下文信息;运用三维空间中非空体素的稀疏特性,仅对非空体素位置执行混合尺度注意力操作,从而提升了计算效率,实现了高效的激光雷达点云3D目标检测。

图1. MsSVT点云特征提取网络架构图
该方法基于混合尺度注意力机制的强大多尺度特征捕获能力(见图2(a)-(d)),在大规模Waymo数据集上的检测精度超过了同期性能最优的双阶段检测器。图2(e)-(f)展示了部分在Waymo数据集上的部分检测结果,该方法可以精确检测仅具有极度稀疏点云表示的远距离车辆目标,并在处理带有巨大尺度变化的密集行人时也表现出优异的性能。

图2. 注意力图(a)-(d)及目标检测结果可视化(e)-(f)
该研究成功克服了三维场景中由于远距离目标点云极度稀疏而导致的目标定位困难以及漏检等问题,实现了精度与计算效率的平衡,为真实大规模场景下基于激光雷达点云数据的3D目标检测及应用提供了方法和关键技术支持。
论文详情:J. Li, S. Cong, L. Ding and T. Xu, MsSVT++: Mixed-scale Sparse Voxel Transformer with Center Voting for 3D Object Detection, in IEEE Transactions on Pattern Analysis and Machine Intelligence, doi: 10.1109/TPAMI.2023.3345880.
论文链接:https://ieeexplore.ieee.org/document/10371785
附作者简介:
李佳男,博士,北京理工大学光电学院预聘助理教授(特别副研究员),新加坡国立大学博士后。主要从事光电成像目标探测与识别等方面的研究,主持国家自然科学基金等项目 5 项。以第一/共一作者发表IEEE TPAMI 4篇,IEEE TNNLS、CVPR等论文11篇,ESI高被引论文1篇;以通讯作者发表论文40余篇;谷歌学术总引4000余次。入选中国科协及北京市科协“青年人才托举工程”项目,获得中国图象图形学学会优秀博士学位论文,王大珩光学奖等荣誉。指导学生获得 ICCV 2021“反无人机跟踪”挑战赛国际冠军及最佳论文奖、第四届“空天杯”创新创意大赛二等奖、中国高等教育博览会“校企合作 双百计划”典型案例等。
许廷发,博士,国家一级重点学科“光学工程”学科责任教授,博士研究生导师。光电成像技术与系统教育部重点实验室主任,北京理工大学重庆创新中心智能化和大数据技术实验室主任。近年来带领其科研团队围绕光电成像探测与识别、计算成像和人工智能等领域不断深化研究。主持承担国家自然科学基金委重大科研仪器研制项目等50多项。在国际、国内等系列期刊发表学术论文190余篇,其中被SCI/EI收录100余篇。以第一发明人申请国家发明专利87项,已授权和公示35项。获省部级科技进步二等奖等奖项3项。指导研究生获得中国图象图形学学会优秀博士学位论文,二人次获得王大珩高校学生光学奖,二人次获得全国光学与光学工程博士生学术联赛全国百强,获得中国高等教育博览会“校企合作 双百计划”典型案例和重庆英才创新创业示范团队等荣誉称号。
文章来源北京理工大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年4月高录用检索快国际学术会 32
-
2026年第六届计算机、控制和机器人 102
-
2026资源、化学化工与应用材料国际 1529
-
2026年人工智能教育技术与数据科学 535
-
2026年图像处理与数字创意设计国际 1294
-
2026年机械工程,新能源与电气技术 5759
-
2026年材料科学、低碳技术与动力工 1546
-
2026年第二届无线与光通信国际会议 2307
-
2026年增材制造、3D打印与创新设 03-13
-
2026年车辆工程与新能源汽车国际会 03-13
-
2026年精密机械、仪器仪表与传感技 03-13
-
2026年机器人技术、智能装备与自动 03-13
-
2026年通信系统、网络与信号处理国 03-13
-
2026年智能制造、工业互联网与数字 03-13
-
2026年环境治理、生态修复与碳中和 03-13
-
2026年中科院期刊分区表(新锐10
-
2025年两院院士增选有效候选人4281
-
2025最新JCR分区及影响因子11266
-
好学术:科研网址导航|学术头条分5427
-
2025年国际期刊预警名单发布!5541
-
2025年中科院期刊分区表重磅发18728
-
中国科协《重要学术会议目录(2011157
-
吉林大学校长张希:学术会议中的提6696
-
中国科大研制出机器人灵巧手指尖六03-11
-
研究揭示遗传多样性如何重塑微生物03-11
-
研究发现双酰胺类杀虫剂影响蜜蜂蜂03-11
-
研究揭示聚焦光场中内禀自旋纹理03-11
-
新型磁流体机器人破解临床难题03-11
-
南京大学物理学院温锦生课题组在亚03-11
-
南京大学物理学院高力波、袁国文团03-11
-
杭州宝盛水博园大酒店有限公司 2269

-
兰州理工大学 18532

-
高等教育出版社 2264

-
香港科技大学霍英东研究院 21252

-
河南纳智博研会议服务有限公司 24486

-
中国商品学会-广东联络办 18378

-
上海筱虞文化传播有限公司 2247

-
西北工业大学 21432

-
上海领行展览服务有限公司 18431

-
第四军医大学组织工程研发中心 18648

-
中国灾害防御协会风险分析专业委员 21733

-
受不鸟会展公司 23259

-
河源职业技术学院 18349

-
北京爱德迈德广告有限公司 8330

-
北京弛寰商务服务有限公司 18318

-
国际市民体育联盟中国总部(CVA 21307

-
清华大学 24243

-
清华设计院文化遗产保护中心洞天福 24394

-
北京青春足迹保健会所 24343

-
中国稀土学会 21764

















992













































