清华大学深圳国际研究生院李星辉团队在数字光栅深度学习三维感知领域取得进展
2025/06/18
近日,清华大学深圳国际研究生院李星辉副教授团队在数字光栅结构光三维(Structured light 3D reconstruction technology,SL3D)重建领域实现进展。针对高质量三维重建所依赖的真实数据资源少,构建策略效率低和前沿数据缺乏问题提出了创新性的解决方案。团队深入研究了场景背景稳定性对网络前景预测精度的影响,并首次系统性探讨了样本空间分布频率与模型性能之间的关系,从根本上提升了数据集构建的科学性与效率。在此策略指导下,团队开发了SL3D-BF(Structuredlight 3D dataset with background-to-foreground enhancement),一个面向开放工业环境的结构光三维点云数据集。数据集涵盖超过2000多个复杂工业场景,包含10万多帧高精度光栅图像,支持对真实物体如雕塑、法兰、轮毂、电池板、电机、齿轮和不锈钢管等物体的高精度重建,全面展现了材质多样性和工业实际挑战。该成果为深度学习驱动的结构光三维重建技术提供了全流程的数据支撑和构建范式,有望显著推动智能制造、精密检测等关键领域的三维感知能力。
图1.数据集组成,特征数据和其在现代工业中的应用场景示意
SL3D-BF不仅是一个大规模数据集,更是一项具备系统设计理念的数据工程创新。李星辉团队自研的高精度结构光点云采集系统,其标准球半径测量误差控制在十几微米级别,为数据集的精度基准提供了强有力保障。团队提出的背景增强与空间频率分布优化策略,有效降低了数据构建成本,同时显著提升了网络的预测性能。实验证明,在统一网络架构下,白板背景下的前景物体预测误差相比黑色背景下降了高达82%(从0.45rad降至0.08rad),凸显背景稳定性在三维重建中的关键作用。SL3D-BF是国内外为数不多的覆盖全过程数据链条的高精度数据集,提供从光栅到高密度3D点云的完整闭环信息,支持阴影抑制、前景显著性增强等高级研究。数据集中还包含标准球子集,为3D点云重建精度的定量评估提供了客观基准。
图2.数据集场景背景对目标前景预测精度的影响。SF-AP代表端到端技术路线,SF-4ND代表分子分母技术路线
SL3D-BF已在多个新系统上完成迁移学习验证,显示出良好的泛化能力与广泛适用性。该研究作为为计算机视觉与智能制造领域的重要公共资源,将推动结构光三维重建技术在缺陷检测、深度估计、语义分割等领域的跨界融合,并为深度学习模型在真实场景中的稳健泛化提供坚实的实验平台。该数据集为结构光三维技术的标准化与应用奠定了基础,助力我国在高端制造与智能感知领域走在国际前沿。
同时,尽管基于深度学习的SL3D技术近几年来飞速发展,通过单帧输入端到端预测的方式获得高精度的3D点云仍然是一个尚未解决的挑战。团队提出了多路物理监督辅助的单帧端到端绝对相位预测网络(Multi-path branch auxiliary supervision network, MPS_XNet)。具体来说,MPS_XNet基于绝对相位时间展开物理模型的三个关键阶段,分子、分母和包裹相位,作为辅助分支来帮助绝对相位主路进行长距离非线性预测。此外,基于此模型设计了专属多路损失函数,促使网络沿着模型定义的方向学习最优路径。MPS_XNet不仅弥补了单帧输入信息的不足,而且通过将单个长距离预测难题转换为多个短距离子任务,以可解释的方式指导网络训练,大幅提升了网络预测精度。
图3.MPS_XNet网络模型
实验表明,MPS_XNet在五个数据集(金属工件和复杂轮廓)和研究提出的测量系统上均优于现有的先进回归网络范式,此策略通过物理模型设计和20毫秒内的任务分解消耗,在相位计算中平均误差突破性的降低了90%。此策略可以用在通用的回归网络中,以加强单分支网络的鲁棒性和可解释性,可以在工业和科学应用中实现实时、高精度的3D测量。
图4.MPS_XNet网络在泛化数据集上的单帧输入点云输出
数据集相关研究成果以“SL3D-BF:一个具有背景到前景增强的真实世界结构光3D数据集”(SL3D-BF: A Real-World Structured Light 3D Dataset with Background-to-Foreground Enhancement)为题,于5月19日发表于《IEEE电路与系统视频技术汇刊》(IEEE Transactions on Circuits and Systems for VideoTechnology, TCSVT)。
物理监督模型机制研究成果以“可靠的三维重建与单次数字光栅和物理模型监督机器学习”(Reliable 3D Reconstruction with Single-Shot Digital Grating and Physical Model-Supervised Machine Learning)为题,于6月5日发表于《IEEE仪器与测量汇刊》(IEEE Transactions on Instrument and Measurement)。
两篇的论文第一作者为清华大学深圳国际研究生院2021级博士生李一鸣,通讯作者为清华大学深圳国际研究生院副教授李星辉和鹏城实验室副研究员梁骁俊。其他合作者包括清华大学深圳国际研究生院2023级硕士生陈伟康、李梓楠,2023级博士生王浩;鹏城实验室高文院士、桂卫华院士,助理研究员张超波;清华大学深圳国际研究生院研究员王晓浩。研究得到深圳市稳定支持计划项目、鹏城实验室重大攻关项目的资助。
文章来源清华大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年第八届计算机科学与技术在教 109
-
2026年3月高含金量国际学术会议合 88
-
2026资源、化学化工与应用材料国际 1265
-
2026年人工智能教育技术与数据科学 246
-
2026年图像处理与数字创意设计国际 1041
-
2026年机械工程,新能源与电气技术 5524
-
2026年材料科学、低碳技术与动力工 1312
-
2026年第二届无线与光通信国际会议 2080
-
第七届多组学科研与临床应用大会 02-05
-
2026年制药学、生物技术与植物学国 02-04
-
2026年节能技术、低碳发展与可持续 02-04
-
2026年导航控制、传感技术与卫星应 02-04
-
2026年经济转型与商业文化国际学术 02-04
-
2026年体育科学、运动健康与创新管 02-04
-
2026创意城市、设计与社区建设国际 02-04
-
2025年两院院士增选有效候选人4066
-
2025最新JCR分区及影响因子10070
-
好学术:科研网址导航|学术头条分5098
-
2025年国际期刊预警名单发布!5129
-
2025年中科院期刊分区表重磅发16711
-
中国科协《重要学术会议目录(2010250
-
吉林大学校长张希:学术会议中的提6245
-
bbrc期刊,bbrc期刊处于S02-03
-
siam期刊,siam期刊发的最02-03
-
了望期刊,瞭望期刊02-03
-
共享经济期刊,共享经济学术论文02-03
-
期刊代理网,从哪里找期刊代理02-03
-
light期刊,Light期刊综02-03
-
传承 期刊,传承期刊投稿点评02-03
-
期刊勘误,期刊勘误时会索要原始数02-03
-
International As 8172

-
上海电子信息学院 23199

-
光环国际管理咨询集团 23315

-
上海英致商务咨询有限公司 2205

-
闽江学院 23267

-
中国汽车工程学会 21228

-
上海品珅商务咨询有限公司 2137

-
宝安中旅大厦 21412

-
中国机械工程学会工业工程分会 21813

-
湖南红塬文化传播有限公司 21180

-
湖南长沙市碧桂园凤凰酒店(原威尼 23162

-
上海永飞会务 23335

-
中国自然资源学会土地资源研究专业 21278

-
东都国际展览(北京)有限公司 8103

-
武汉青博盛学术服务有限公司 2209

-
宁夏大学人文学院 23298

-
HKSME 24311

-
MNCYR 8236

-
中国医药教育协会 24166

-
上海意凡森医药科技发展有限责任公 24214

















295
















































