清华大学精仪系杨原牧课题组报道基于衍射与偏振深度线索融合的拓展场景单目三维成像_科研信息_学术资讯

当前位置：首页 >> 学术资讯 >> 科研信息

第二届智能医疗与可穿戴智能设备国际学术会议（SHWID 2025）

第五届信号处理与通信技术国际学术会议（SPCT 2025）

第五届文化、设计与社会发展国际学术会议(CDSD 2025)

2025电子信息、计算机与空天遥感国际会议（EICARS 2025）

第六届材料化学与复合材料国际学术会议（MCCM 2025）

第六届新能源与电气科技国际学术研讨会 (ISNEET 2025)

第七届国际科技创新学术交流大会暨新能源科学与电力工程国际学术会议（NESEE 2025）

第五届高性能计算、大数据与通信工程国际学术会议(ICHBC 2025)

第五届计算机、物联网与控制工程国际学术会议（CITCE 2025)

第七届国际科技创新学术交流大会（IAECST 2025）

2025年艺术、教育和管理国际学术会议（ICAEM 2025）- 第七期

2025年具身智能与大模型国际学术会议（EILM 2025）

2025第二届模式识别与图像分析国际学术会议（PRIA 2025）

第二届无人系统与自动化控制国际学术会议（ICUSAC 2025）

第二届光电科学与智能传感国际学术会议 (ICOIS 2026)

第五届电子信息与通信工程国际学术会议(EICE 2026)

清华大学精仪系杨原牧课题组报道基于衍射与偏振深度线索融合的拓展场景单目三维成像

2025/06/19

三维视觉对于机器和人工智能对世界的感知与交互十分关键。主流三维成像技术路线，包括结构光、飞行时间法和双/多目立体视觉，尽管近年来进展显著，但仍普遍具有远超二维相机的体积、成本、功耗以及有限的三维点云分辨率。近年来受到广泛关注的单目三维视觉虽可以部分解决上述问题，但仍具有易在弱纹理场景失效、难以重建复杂三维面型等问题。此外，现有的三维成像方案还具有共性的易失效场景，包括近乎透明、高度镜面反射等场景。

针对以上难题，清华大学精密仪器系杨原牧副教授课题组提出了一种新型拓展单目三维（Extended Monocular 3D,EM3D）成像框架，该框架使用配备易于量产的折衍混合透镜及商用分焦面偏振CMOS的紧凑单目相机，可以快照式地同时获取衍射和偏振两种深度线索，结合多阶段融合两种深度线索的计算成像算法，实验实现了对传统挑战性场景（包括弱纹理、高复杂度、高反射或近乎透明的场景）的百万像素级精确三维点云快照式采集，且无需先验数据。此外，通过深度与偏振信息的结合可以通过材料属性实现进一步的物体辨识，这可能进一步扩展机器视觉在目标识别、活体检测等应用中的能力。

北京时间6月13日，相关研究成果以“基于衍射与偏振深度线索融合的拓展场景单目三维成像”（Extended monocular 3D imaging via the fusion of diffraction- and polarization-based depth cues）为题，发表于《光学》（Optica）。

图1.基于衍射与偏振深度线索融合拓展单目三维成像系统框架

EM3D的系统框架如图1所示。基于衍射（点扩散函数工程）的深度线索的优点为具备较高精度绝对深度，无需主动激光照明；缺点为依赖物体纹理计算深度，难以重建三维形貌细节。基于偏振物体法线测量的深度线索优点为不需要物体纹理，可获取三维形貌的细节信息；缺点为其获取的物体表面法线方向存在歧义和材料误差，且无法获取绝对深度信息。两种深度线索的优缺点具有高度互补性。EM3D框架中的单目相机配备了点扩散函数调制衍射光学元件（DOE）与分焦面偏振CMOS，可以快照式同时获取两种深度线索，从而可以在后续算法中结合两种深度线索的优点。

图2.传统易失效场景的三维成像实验结果（a）弱纹理纸箱（b）高度反光金属罐（c）近乎透明玻璃烧杯（d）复杂面型活体人脸（e）多个复杂物体

EM3D系统对多种传统易失效场景的三维成像结果图2所示。这些场景包括弱纹理的纸箱、高度反光的金属罐、近乎透明的玻璃烧杯、具备复杂面型的活体人脸以及多个复杂物体。结果显示单一基于衍射或偏振深度线索获取的三维结果是不准确而粗糙的，而EM3D系统融合获得了精细的（百万像素）三维点云，所有场景的绝对深度误差均在0.2%以内。

图3.基于材料特性实现物体辨识实验结果（a）场景示意图（b）-（c）传统成像系统成像结果（d）-（f）EM3D系统成像结果

除获取高质量三维点云之外，EM3D系统还具备超出传统二维或偏振成像系统的物体辨识能力。如图3所示，当机器人需要从桌上的三个不同材料的物体中抓取其中一个时，使用传统的彩色成像、近红外成像或偏振成像均难以分辨三个物体；而ED3D系统不仅可以提供准确的三维点云以帮助空间定位，还能通过偏振与三维信息结合获得的材料参数清晰辨识不同材料的物体。这一集成于单目相机中的多模态成像功能有望显著拓展空间受限机器视觉系统的能力。

该相机采用可大规模生产的DOE结合单个折射透镜进行成像，通过多片衍射折射混合透镜优化，可以进一步提高图像质量。通过增加成像透镜的孔径，深度测量范围可以扩展至百米。通过标准镜头模组工艺或晶圆级封装，可以大幅缩小相机的外形尺寸。

本工作的完成单位为清华大学精密仪器系、精密测试技术与仪器全国重点实验室。清华大学精密仪器系2021级博士生沈子程和博士后赵峰为论文共同第一作者，清华大学精密仪器系副教授杨原牧和赵峰博士为论文共同通讯作者。清华大学精密仪器系博士毕业生倪一博为本工作作出了重要贡献。研究得到北京市科技计划、国家重点研发计划、国家自然科学基金、博士后面上基金的资助

版权声明：
文章来源清华大学，分享只为学术交流，如涉及侵权问题请联系我们，我们将及时修改或删除。

相关学术资讯

北京大学地球与空间科学学院宋晓东、杨翼揭示地球内核差速旋转模式变化

北京大学地球与空间科学学院黄清华团队与美国学者合作在地幔过渡带水含量探测方面取得新进展

清华大学自动化系汪小我团队提出知识引导与数据驱动相融合的合成启动子AI设计方法

清华大学计算机系存储实验室蝉联超算存储500强（IO500）榜单全球第一

中国科学院长春应用化学研究所陶友华研究员课题组在可循环塑料研究方面取得进展

我国学者在支气管扩张症患者“肠-肺轴”研究方面取得进展

清华大学生命科学学院团队合作发现调控胆固醇稳态的新激素

我国学者在细胞磷酸代谢与稳态调节机制研究方面取得进展

我国学者在罕见病模型与机制研究方面取得进展

物理学院李婧课题组与合作者基于红外长波辐射实现夜间气溶胶光学厚度反演