清华大学深圳国际研究生院李星辉团队在数字光栅深度学习三维感知领域取得进展_科研信息_学术资讯

当前位置：首页 >> 学术资讯 >> 科研信息

第五届智能交通系统与智慧城市国际学术会议（ITSSC 2025）

2025年气候韧性与低碳城市国际学术会议（iCCRLCC 2025）

第十届现代管理、教育与社会科学国际学术会议（MMET 2025）

2025年激光、光学技术与应用国际学术会议（LOTA 2025）

第十一届能源材料与电力工程学术会议（ICEMEE 2025)

第四届信息经济、数据建模与云计算国际学术会议（ICIDC 2025）

2025年人工智能与计算工程国际学术会议（AICE 2025）

第四届可再生能源与电气科技国际学术会议（ICREET 2025）

第七届光电科学与材料国际学术会议 (ICOSM 2025)

2025年计算智能与机器人国际学术会议（CIR 2025)

2025年智能计算与系统仿真国际会议(ICSS 2025)

第五届电子材料与信息工程国际学术会议 (EMIE 2025)

第二届教育人工智能国际学术会议（ISAIE 2025）

2025年先进半导体器件与集成技术国际学术会议（ASDIT 2025）

2025年地质、能源与油气勘探国际学术会议（GEOGE 2025）

2025年人工智能、虚拟现实与交互设计国际学术会议(AIVRID 2025)

清华大学深圳国际研究生院李星辉团队在数字光栅深度学习三维感知领域取得进展

2025/06/18

近日，清华大学深圳国际研究生院李星辉副教授团队在数字光栅结构光三维（Structured light 3D reconstruction technology，SL3D）重建领域实现进展。针对高质量三维重建所依赖的真实数据资源少，构建策略效率低和前沿数据缺乏问题提出了创新性的解决方案。团队深入研究了场景背景稳定性对网络前景预测精度的影响，并首次系统性探讨了样本空间分布频率与模型性能之间的关系，从根本上提升了数据集构建的科学性与效率。在此策略指导下，团队开发了SL3D-BF（Structuredlight 3D dataset with background-to-foreground enhancement），一个面向开放工业环境的结构光三维点云数据集。数据集涵盖超过2000多个复杂工业场景，包含10万多帧高精度光栅图像，支持对真实物体如雕塑、法兰、轮毂、电池板、电机、齿轮和不锈钢管等物体的高精度重建，全面展现了材质多样性和工业实际挑战。该成果为深度学习驱动的结构光三维重建技术提供了全流程的数据支撑和构建范式，有望显著推动智能制造、精密检测等关键领域的三维感知能力。

图1.数据集组成，特征数据和其在现代工业中的应用场景示意

SL3D-BF不仅是一个大规模数据集，更是一项具备系统设计理念的数据工程创新。李星辉团队自研的高精度结构光点云采集系统，其标准球半径测量误差控制在十几微米级别，为数据集的精度基准提供了强有力保障。团队提出的背景增强与空间频率分布优化策略，有效降低了数据构建成本，同时显著提升了网络的预测性能。实验证明，在统一网络架构下，白板背景下的前景物体预测误差相比黑色背景下降了高达82%（从0.45rad降至0.08rad），凸显背景稳定性在三维重建中的关键作用。SL3D-BF是国内外为数不多的覆盖全过程数据链条的高精度数据集，提供从光栅到高密度3D点云的完整闭环信息，支持阴影抑制、前景显著性增强等高级研究。数据集中还包含标准球子集，为3D点云重建精度的定量评估提供了客观基准。

图2.数据集场景背景对目标前景预测精度的影响。SF-AP代表端到端技术路线，SF-4ND代表分子分母技术路线

SL3D-BF已在多个新系统上完成迁移学习验证，显示出良好的泛化能力与广泛适用性。该研究作为为计算机视觉与智能制造领域的重要公共资源，将推动结构光三维重建技术在缺陷检测、深度估计、语义分割等领域的跨界融合，并为深度学习模型在真实场景中的稳健泛化提供坚实的实验平台。该数据集为结构光三维技术的标准化与应用奠定了基础，助力我国在高端制造与智能感知领域走在国际前沿。

同时，尽管基于深度学习的SL3D技术近几年来飞速发展，通过单帧输入端到端预测的方式获得高精度的3D点云仍然是一个尚未解决的挑战。团队提出了多路物理监督辅助的单帧端到端绝对相位预测网络（Multi-path branch auxiliary supervision network, MPS_XNet）。具体来说，MPS_XNet基于绝对相位时间展开物理模型的三个关键阶段，分子、分母和包裹相位，作为辅助分支来帮助绝对相位主路进行长距离非线性预测。此外，基于此模型设计了专属多路损失函数，促使网络沿着模型定义的方向学习最优路径。MPS_XNet不仅弥补了单帧输入信息的不足，而且通过将单个长距离预测难题转换为多个短距离子任务，以可解释的方式指导网络训练，大幅提升了网络预测精度。

图3.MPS_XNet网络模型

实验表明，MPS_XNet在五个数据集（金属工件和复杂轮廓）和研究提出的测量系统上均优于现有的先进回归网络范式，此策略通过物理模型设计和20毫秒内的任务分解消耗，在相位计算中平均误差突破性的降低了90%。此策略可以用在通用的回归网络中，以加强单分支网络的鲁棒性和可解释性，可以在工业和科学应用中实现实时、高精度的3D测量。

图4.MPS_XNet网络在泛化数据集上的单帧输入点云输出

数据集相关研究成果以“SL3D-BF：一个具有背景到前景增强的真实世界结构光3D数据集”（SL3D-BF: A Real-World Structured Light 3D Dataset with Background-to-Foreground Enhancement）为题，于5月19日发表于《IEEE电路与系统视频技术汇刊》（IEEE Transactions on Circuits and Systems for VideoTechnology, TCSVT）。

物理监督模型机制研究成果以“可靠的三维重建与单次数字光栅和物理模型监督机器学习”（Reliable 3D Reconstruction with Single-Shot Digital Grating and Physical Model-Supervised Machine Learning）为题，于6月5日发表于《IEEE仪器与测量汇刊》（IEEE Transactions on Instrument and Measurement）。

两篇的论文第一作者为清华大学深圳国际研究生院2021级博士生李一鸣，通讯作者为清华大学深圳国际研究生院副教授李星辉和鹏城实验室副研究员梁骁俊。其他合作者包括清华大学深圳国际研究生院2023级硕士生陈伟康、李梓楠，2023级博士生王浩；鹏城实验室高文院士、桂卫华院士，助理研究员张超波；清华大学深圳国际研究生院研究员王晓浩。研究得到深圳市稳定支持计划项目、鹏城实验室重大攻关项目的资助。

版权声明：
文章来源清华大学，分享只为学术交流，如涉及侵权问题请联系我们，我们将及时修改或删除。

福州大学谭理课题组与复旦大学刘智攀课题组在单原子催化CO2加氢合成甲醇领域取得进展

生命学院魏迪明课题组开发基于几何构型匹配的核酸粘性末端识别机制

中国科学院北京生命科学研究院在环形RNA全长转录本解析技术方面取得进展

工学院李阿明课题组在群体博弈研究中取得重要进展

西安交大费强教授团队提出一碳生物制造可持续发展新路径

环境学院团队建立疫情下环境介质中消毒副产物检测方法

我国学者与海外合作者在骤旱对植被影响研究中取得进展

中山大学何晓顺团队联合邝栋明团队揭示乙肝相关慢加急性肝衰竭进展的新机制

中山大学物理学院发现高压下液氮温区镍氧化物超导体

近期会议

2025艺术、服装设计与纺织科学国际会议（FDTS 2025）（2025-07-26）