清华大学深圳国际研究生院李星辉团队在数字光栅深度学习三维感知领域取得进展_科研信息_学术资讯

当前位置：首页 >> 学术资讯 >> 科研信息

2026年传感器技术、自动化与智能制造国际会议（STAIM 2026）

第十一届材料科学与工程国际学术会议(ISAMSE 2026）

第二届导航、检测与控制国际学术会议（CNDC 2026)

第三届图像处理、多媒体技术与机器学习国际学术会议（IPMML 2026）

2026年智能医学与图像计算国际会议 (IMIC 2026)

第三届虚拟现实、图像和信号处理国际学术会议（VRISP 2026）

2026年具身智能、机器人与控制系统国际学术会议（EIRCS 2026）

第五届信息经济、数据建模与云计算国际学术会议（ICIDC 2026）

第三届数字媒体、通信与信息系统国际学术会议（DMCIS 2026）

2026年智能机器人与控制技术国际会议（CIRCT 2026）

第五届机械电子工程与人工智能国际学术会议（MEAI 2026）

第六届先进制造技术与电子信息国际学术会议（AMTEI 2026）

第十一届计算机与信息处理技术国际学术研讨会（ISCIPT 2026）

第三届大数据、神经网络与深度学习研讨会（BDNNDL 2026）

第六届计算机视觉、应用与算法国际学术会议（CVAA 2026）

2026年IEEE计算机通信、信息系统与网络安全国际会议(CCISC 2026)

2026年第五届算法、数据挖掘和信息技术国际会议(ADMIT 2026)

2026年人工智能与机器人系统国际会议(ICAIRS 2026)

2026年IEEE人工智能、大数据与云计算国际会议 (AIBDCC 2026)

2026年IEEE第二届电力与可持续能源技术国际会议(PSETC 2026)

清华大学深圳国际研究生院李星辉团队在数字光栅深度学习三维感知领域取得进展

2025/06/18

近日，清华大学深圳国际研究生院李星辉副教授团队在数字光栅结构光三维（Structured light 3D reconstruction technology，SL3D）重建领域实现进展。针对高质量三维重建所依赖的真实数据资源少，构建策略效率低和前沿数据缺乏问题提出了创新性的解决方案。团队深入研究了场景背景稳定性对网络前景预测精度的影响，并首次系统性探讨了样本空间分布频率与模型性能之间的关系，从根本上提升了数据集构建的科学性与效率。在此策略指导下，团队开发了SL3D-BF（Structuredlight 3D dataset with background-to-foreground enhancement），一个面向开放工业环境的结构光三维点云数据集。数据集涵盖超过2000多个复杂工业场景，包含10万多帧高精度光栅图像，支持对真实物体如雕塑、法兰、轮毂、电池板、电机、齿轮和不锈钢管等物体的高精度重建，全面展现了材质多样性和工业实际挑战。该成果为深度学习驱动的结构光三维重建技术提供了全流程的数据支撑和构建范式，有望显著推动智能制造、精密检测等关键领域的三维感知能力。

图1.数据集组成，特征数据和其在现代工业中的应用场景示意

SL3D-BF不仅是一个大规模数据集，更是一项具备系统设计理念的数据工程创新。李星辉团队自研的高精度结构光点云采集系统，其标准球半径测量误差控制在十几微米级别，为数据集的精度基准提供了强有力保障。团队提出的背景增强与空间频率分布优化策略，有效降低了数据构建成本，同时显著提升了网络的预测性能。实验证明，在统一网络架构下，白板背景下的前景物体预测误差相比黑色背景下降了高达82%（从0.45rad降至0.08rad），凸显背景稳定性在三维重建中的关键作用。SL3D-BF是国内外为数不多的覆盖全过程数据链条的高精度数据集，提供从光栅到高密度3D点云的完整闭环信息，支持阴影抑制、前景显著性增强等高级研究。数据集中还包含标准球子集，为3D点云重建精度的定量评估提供了客观基准。

图2.数据集场景背景对目标前景预测精度的影响。SF-AP代表端到端技术路线，SF-4ND代表分子分母技术路线

SL3D-BF已在多个新系统上完成迁移学习验证，显示出良好的泛化能力与广泛适用性。该研究作为为计算机视觉与智能制造领域的重要公共资源，将推动结构光三维重建技术在缺陷检测、深度估计、语义分割等领域的跨界融合，并为深度学习模型在真实场景中的稳健泛化提供坚实的实验平台。该数据集为结构光三维技术的标准化与应用奠定了基础，助力我国在高端制造与智能感知领域走在国际前沿。

同时，尽管基于深度学习的SL3D技术近几年来飞速发展，通过单帧输入端到端预测的方式获得高精度的3D点云仍然是一个尚未解决的挑战。团队提出了多路物理监督辅助的单帧端到端绝对相位预测网络（Multi-path branch auxiliary supervision network, MPS_XNet）。具体来说，MPS_XNet基于绝对相位时间展开物理模型的三个关键阶段，分子、分母和包裹相位，作为辅助分支来帮助绝对相位主路进行长距离非线性预测。此外，基于此模型设计了专属多路损失函数，促使网络沿着模型定义的方向学习最优路径。MPS_XNet不仅弥补了单帧输入信息的不足，而且通过将单个长距离预测难题转换为多个短距离子任务，以可解释的方式指导网络训练，大幅提升了网络预测精度。

图3.MPS_XNet网络模型

实验表明，MPS_XNet在五个数据集（金属工件和复杂轮廓）和研究提出的测量系统上均优于现有的先进回归网络范式，此策略通过物理模型设计和20毫秒内的任务分解消耗，在相位计算中平均误差突破性的降低了90%。此策略可以用在通用的回归网络中，以加强单分支网络的鲁棒性和可解释性，可以在工业和科学应用中实现实时、高精度的3D测量。

图4.MPS_XNet网络在泛化数据集上的单帧输入点云输出

数据集相关研究成果以“SL3D-BF：一个具有背景到前景增强的真实世界结构光3D数据集”（SL3D-BF: A Real-World Structured Light 3D Dataset with Background-to-Foreground Enhancement）为题，于5月19日发表于《IEEE电路与系统视频技术汇刊》（IEEE Transactions on Circuits and Systems for VideoTechnology, TCSVT）。

物理监督模型机制研究成果以“可靠的三维重建与单次数字光栅和物理模型监督机器学习”（Reliable 3D Reconstruction with Single-Shot Digital Grating and Physical Model-Supervised Machine Learning）为题，于6月5日发表于《IEEE仪器与测量汇刊》（IEEE Transactions on Instrument and Measurement）。

两篇的论文第一作者为清华大学深圳国际研究生院2021级博士生李一鸣，通讯作者为清华大学深圳国际研究生院副教授李星辉和鹏城实验室副研究员梁骁俊。其他合作者包括清华大学深圳国际研究生院2023级硕士生陈伟康、李梓楠，2023级博士生王浩；鹏城实验室高文院士、桂卫华院士，助理研究员张超波；清华大学深圳国际研究生院研究员王晓浩。研究得到深圳市稳定支持计划项目、鹏城实验室重大攻关项目的资助。

版权声明：
文章来源清华大学，分享只为学术交流，如涉及侵权问题请联系我们，我们将及时修改或删除。

相关学术资讯

清华大学航院郑泉水院士团队设计全自动结构超滑材料转移测试系统

体育期刊杂志,体育期刊杂志有哪些

深圳国际研究生院范远超团队合作在全球变暖与致命热应激研究方面取得新进展

我国学者在动态动力学不对称酮的烯（炔）丙基化研究方面取得进展

电子科技大学计算机（网安）学院在计算机体系结构领域顶会SC发表论文

研究阐明苜蓿共生固氮的氨基酸交换机制

北京大学材料科学与工程学院邹如强团队与合作者发表可穿戴体温调温相变纤维研究成果

化学科学与工程学院刘明贤团队提出磷激活羧基小分子策略设计高性能铁离子电池，成果发表于《自然·通讯》

清华大学生命学院和电子系合作开发冷冻电子断层成像多层重建方法

中国农业大学中国农大王祥/汪杰团队在微塑料介导的土壤碳循环研究中取得进展：揭示可降解塑料对土壤碳循环过程的“双刃剑”作用