清华大学精仪系杨原牧课题组报道基于衍射与偏振深度线索融合的拓展场景单目三维成像
2025/06/19
三维视觉对于机器和人工智能对世界的感知与交互十分关键。主流三维成像技术路线,包括结构光、飞行时间法和双/多目立体视觉,尽管近年来进展显著,但仍普遍具有远超二维相机的体积、成本、功耗以及有限的三维点云分辨率。近年来受到广泛关注的单目三维视觉虽可以部分解决上述问题,但仍具有易在弱纹理场景失效、难以重建复杂三维面型等问题。此外,现有的三维成像方案还具有共性的易失效场景,包括近乎透明、高度镜面反射等场景。
针对以上难题,清华大学精密仪器系杨原牧副教授课题组提出了一种新型拓展单目三维(Extended Monocular 3D,EM3D)成像框架,该框架使用配备易于量产的折衍混合透镜及商用分焦面偏振CMOS的紧凑单目相机,可以快照式地同时获取衍射和偏振两种深度线索,结合多阶段融合两种深度线索的计算成像算法,实验实现了对传统挑战性场景(包括弱纹理、高复杂度、高反射或近乎透明的场景)的百万像素级精确三维点云快照式采集,且无需先验数据。此外,通过深度与偏振信息的结合可以通过材料属性实现进一步的物体辨识,这可能进一步扩展机器视觉在目标识别、活体检测等应用中的能力。
北京时间6月13日,相关研究成果以“基于衍射与偏振深度线索融合的拓展场景单目三维成像”(Extended monocular 3D imaging via the fusion of diffraction- and polarization-based depth cues)为题,发表于《光学》(Optica)。
图1.基于衍射与偏振深度线索融合拓展单目三维成像系统框架
EM3D的系统框架如图1所示。基于衍射(点扩散函数工程)的深度线索的优点为具备较高精度绝对深度,无需主动激光照明;缺点为依赖物体纹理计算深度,难以重建三维形貌细节。基于偏振物体法线测量的深度线索优点为不需要物体纹理,可获取三维形貌的细节信息;缺点为其获取的物体表面法线方向存在歧义和材料误差,且无法获取绝对深度信息。两种深度线索的优缺点具有高度互补性。EM3D框架中的单目相机配备了点扩散函数调制衍射光学元件(DOE)与分焦面偏振CMOS,可以快照式同时获取两种深度线索,从而可以在后续算法中结合两种深度线索的优点。
图2.传统易失效场景的三维成像实验结果(a)弱纹理纸箱(b)高度反光金属罐(c)近乎透明玻璃烧杯(d)复杂面型活体人脸(e) 多个复杂物体
EM3D系统对多种传统易失效场景的三维成像结果图2所示。这些场景包括弱纹理的纸箱、高度反光的金属罐、近乎透明的玻璃烧杯、具备复杂面型的活体人脸以及多个复杂物体。结果显示单一基于衍射或偏振深度线索获取的三维结果是不准确而粗糙的,而EM3D系统融合获得了精细的(百万像素)三维点云,所有场景的绝对深度误差均在0.2%以内。
图3.基于材料特性实现物体辨识实验结果(a)场景示意图(b)-(c)传统成像系统成像结果(d)-(f)EM3D系统成像结果
除获取高质量三维点云之外,EM3D系统还具备超出传统二维或偏振成像系统的物体辨识能力。如图3所示,当机器人需要从桌上的三个不同材料的物体中抓取其中一个时,使用传统的彩色成像、近红外成像或偏振成像均难以分辨三个物体;而ED3D系统不仅可以提供准确的三维点云以帮助空间定位,还能通过偏振与三维信息结合获得的材料参数清晰辨识不同材料的物体。这一集成于单目相机中的多模态成像功能有望显著拓展空间受限机器视觉系统的能力。
该相机采用可大规模生产的DOE结合单个折射透镜进行成像,通过多片衍射折射混合透镜优化,可以进一步提高图像质量。通过增加成像透镜的孔径,深度测量范围可以扩展至百米。通过标准镜头模组工艺或晶圆级封装,可以大幅缩小相机的外形尺寸。
本工作的完成单位为清华大学精密仪器系、精密测试技术与仪器全国重点实验室。清华大学精密仪器系2021级博士生沈子程和博士后赵峰为论文共同第一作者,清华大学精密仪器系副教授杨原牧和赵峰博士为论文共同通讯作者。清华大学精密仪器系博士毕业生倪一博为本工作作出了重要贡献。研究得到北京市科技计划、国家重点研发计划、国家自然科学基金、博士后面上基金的资助
文章来源清华大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025年11月优质学术会议推荐 16
-
2025年机器视觉、智能成像与模式识 392
-
2025年第七届控制与机器人国际会议 576
-
2025年智能光子学与应用技术国际学 1529
-
2025年机械工程,新能源与电气技术 1790
-
2025年计算机科学、图像分析与信号 2065
-
2025年材料化学与燃料电池技术国际 1861
-
2025年自动化前沿系统、智慧城市与 10-23
-
2025年信息光学、遥感技术与机器视 10-23
-
2025年数字人文、文化遗产与语言学 10-23
-
2025年神经科学、生物信息学与智能 10-23
-
2025年语言认知、人工智能与计算建 10-23
-
2025年社会科学、应用语言学与人文 10-23
-
2025年传统机械、动力学与智能装备 10-23
-
2025年图像处理、物理建模与结构设 10-23
-
2025年两院院士增选有效候选人1145
-
2025最新JCR分区及影响因子4758
-
好学术:科研网址导航|学术头条分2033
-
2025年国际期刊预警名单发布!1930
-
2025年中科院期刊分区表重磅发8447
-
中国科协《重要学术会议目录(205134
-
吉林大学校长张希:学术会议中的提2840
-
清华大学地学系阳坤课题组揭示全球10-20
-
历史时期极端干旱灾害的数据评估和10-20
-
“清华化学百年论坛:塑造化学的未10-20
-
研究揭示植物激素独脚金内酯作为跨10-20
-
清华大学联合研发的“46MW大容10-20
-
清华大学(软件学院)-九疆电力建10-20
-
中国农业大学土地学院马韫韬教授团10-20
-
电子科技大学光电学院本科生在一区10-20
-
北京中仪雄鹰国际会展有限公司 23198

-
上海联合非常规能源研究中心 24236

-
云南大学 18150

-
中华联合财产保险公司 17891

-
北京贝拓会展 18134

-
2016年创新材料科学与技术国际 2191

-
东都国际展览(北京)有限公司 7961

-
科技有限公司 17975

-
中国科学院研究生院工程教育学院 17999

-
内蒙古大学化学化工学院 21184

-
中国交通企业管理协会 23065

-
纳智博研 24003

-
山西大学 18031

-
同济大学地下系 21008

-
西安市人民政府下属的... 18180

-
大连中联旅行社 17970

-
香港维科信息产业研究中心 22961

-
hksme 23136

-
北京礼瑞文化 21351

-
北京瑞广胜康医药生物科技有限公司 21331

















401














































