当前位置:首页 >> 学术资讯 >> 科研信息

清华大学深圳国际研究生院李星辉团队在数字光栅深度学习三维感知领域取得进展

2025/06/18

近日,清华大学深圳国际研究生院李星辉副教授团队在数字光栅结构光三维(Structured light 3D reconstruction technology,SL3D)重建领域实现进展。针对高质量三维重建所依赖的真实数据资源少,构建策略效率低和前沿数据缺乏问题提出了创新性的解决方案。团队深入研究了场景背景稳定性对网络前景预测精度的影响,并首次系统性探讨了样本空间分布频率与模型性能之间的关系,从根本上提升了数据集构建的科学性与效率。在此策略指导下,团队开发了SL3D-BF(Structuredlight 3D dataset with background-to-foreground enhancement,一个面向开放工业环境的结构光三维点云数据集。数据集涵盖超过2000多个复杂工业场景,包含10万多帧高精度光栅图像,支持对真实物体如雕塑、法兰、轮毂、电池板、电机、齿轮和不锈钢管等物体的高精度重建,全面展现了材质多样性和工业实际挑战。该成果为深度学习驱动的结构光三维重建技术提供了全流程的数据支撑和构建范式,有望显著推动智能制造、精密检测等关键领域的三维感知能力。

清华大学深圳国际研究生院李星辉团队在数字光栅深度学习三维感知领域取得进展

图1.数据集组成,特征数据和其在现代工业中的应用场景示意

SL3D-BF不仅是一个大规模数据集,更是一项具备系统设计理念的数据工程创新。李星辉团队自研的高精度结构光点云采集系统,其标准球半径测量误差控制在十几微米级别,为数据集的精度基准提供了强有力保障。团队提出的背景增强与空间频率分布优化策略,有效降低了数据构建成本,同时显著提升了网络的预测性能。实验证明,在统一网络架构下,白板背景下的前景物体预测误差相比黑色背景下降了高达82%(从0.45rad降至0.08rad),凸显背景稳定性在三维重建中的关键作用。SL3D-BF是国内外为数不多的覆盖全过程数据链条的高精度数据集,提供从光栅到高密度3D点云的完整闭环信息,支持阴影抑制、前景显著性增强等高级研究。数据集中还包含标准球子集,为3D点云重建精度的定量评估提供了客观基准。

清华大学深圳国际研究生院李星辉团队在数字光栅深度学习三维感知领域取得进展

图2.数据集场景背景对目标前景预测精度的影响。SF-AP代表端到端技术路线,SF-4ND代表分子分母技术路线

SL3D-BF已在多个新系统上完成迁移学习验证,显示出良好的泛化能力与广泛适用性。该研究作为为计算机视觉与智能制造领域的重要公共资源,将推动结构光三维重建技术在缺陷检测、深度估计、语义分割等领域的跨界融合,并为深度学习模型在真实场景中的稳健泛化提供坚实的实验平台。该数据集为结构光三维技术的标准化与应用奠定了基础,助力我国在高端制造与智能感知领域走在国际前沿。

同时,尽管基于深度学习的SL3D技术近几年来飞速发展,通过单帧输入端到端预测的方式获得高精度的3D点云仍然是一个尚未解决的挑战。团队提出了多路物理监督辅助的单帧端到端绝对相位预测网络(Multi-path branch auxiliary supervision network, MPS_XNet)。具体来说,MPS_XNet基于绝对相位时间展开物理模型的三个关键阶段,分子、分母和包裹相位,作为辅助分支来帮助绝对相位主路进行长距离非线性预测。此外,基于此模型设计了专属多路损失函数,促使网络沿着模型定义的方向学习最优路径。MPS_XNet不仅弥补了单帧输入信息的不足,而且通过将单个长距离预测难题转换为多个短距离子任务,以可解释的方式指导网络训练,大幅提升了网络预测精度。

清华大学深圳国际研究生院李星辉团队在数字光栅深度学习三维感知领域取得进展

图3.MPS_XNet网络模型

实验表明,MPS_XNet在五个数据集(金属工件和复杂轮廓)和研究提出的测量系统上均优于现有的先进回归网络范式,此策略通过物理模型设计和20毫秒内的任务分解消耗,在相位计算中平均误差突破性的降低了90%。此策略可以用在通用的回归网络中,以加强单分支网络的鲁棒性和可解释性,可以在工业和科学应用中实现实时、高精度的3D测量。

清华大学深圳国际研究生院李星辉团队在数字光栅深度学习三维感知领域取得进展

图4.MPS_XNet网络在泛化数据集上的单帧输入点云输出

数据集相关研究成果以“SL3D-BF:一个具有背景到前景增强的真实世界结构光3D数据集”(SL3D-BF: A Real-World Structured Light 3D Dataset with Background-to-Foreground Enhancement为题,于5月19日发表于《IEEE电路与系统视频技术汇刊》(IEEE Transactions on Circuits and Systems for VideoTechnology, TCSVT

物理监督模型机制研究成果以“可靠的三维重建与单次数字光栅和物理模型监督机器学习”(Reliable 3D Reconstruction with Single-Shot Digital Grating and Physical Model-Supervised Machine Learning)为题,于6月5日发表于《IEEE仪器与测量汇刊》(IEEE Transactions on Instrument and Measurement)。

两篇的论文第一作者为清华大学深圳国际研究生院2021级博士生李一鸣,通讯作者为清华大学深圳国际研究生院副教授李星辉和鹏城实验室副研究员梁骁俊。其他合作者包括清华大学深圳国际研究生院2023级硕士生陈伟康、李梓楠,2023级博士生王浩;鹏城实验室高文院士、桂卫华院士,助理研究员张超波;清华大学深圳国际研究生院研究员王晓浩。研究得到深圳市稳定支持计划项目、鹏城实验室重大攻关项目的资助。


版权声明:
文章来源清华大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2025年清洁能源、电力系统与可持续发展国际会议(CEPSSD 2025)(2025-10-28)

2025年电力系统与电器工程国际会议(ICPSEE 2025)(2025-10-29)

2025年第四届计算与人工智能国际会议(ISCAI 2025)(2025-11-14)

2025年设计、数字媒体与多媒体技术国际会议(DDMMT 2025)(2025-11-20)

2025年IEEE电路与系统前沿技术国际会议(FTCS 2025)(2025-11-21)

第一届光电材料与电子信息工程国际学术会议 (OMEIE 2025)(2025-11-21)

2025年船舶、海洋工程与应用技术国际会议(ICSOEAT 2025)(2025-11-24)

第二届自动化、电气控制系统与设备国际学术会议(AECSE 2025)(2025-11-28)

第五届肿瘤治疗与转化医学国际研讨会(CTTM 2025)(2025-11-28)

2025年机械电子与自动化国际研讨会(ISMA 2025)(2025-11-28)

2025年人工智能、商务智能和电子商务国际学术会议(AIBIEC2025)(2025-12-26)

2025年生物工程、智能医疗与精细化工国际学术会议(BIHFC 2025)(2025-11-28)

2025年文化遗产与数字媒体传播国际会议(ICCHDMC 2025)(2025-11-7)

2025年医疗、图像处理与人工智能国际会议(HIPAI 2025)(2025-11-23)

第六届IEEE信息科学与教育国际学术会议(ICISE-IE 2025)(2025-12-26)

2025年人工智能、自动化与设计工程国际会议(AIADE 2025)(2025-12-5)

2025年人工智能与数字媒体国际会议(ICDMAI 2025)(2025-11-14)

2025水动力学、流体力学与能源电力国际会议(HFDEE 2025)(2025-11-27)

2025数字信号、计算机前沿技术与机械电气工程国际会议(DSCFMEE 2025)(2025-11-11)

2025年储能、新能源与电力工程国际会议(ESNEPE 2025)(2025-12-30)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。