清华大学深圳国际研究生院李星辉团队在深度学习工业智能应用上取得系列进展
2024/07/02
随着深度学习技术的快速发展,人工智能在诸多领域取得了显著突破,如自然语言处理、图像识别和语音识别等。深度学习模型以其出色的性能和广泛的应用前景在工业界引起了高度关注。要使深度学习模型在实际应用中表现出色,首先要解决的就是高质量数据集的获取问题,但当前工业界在数据的收集方面仍面临挑战,例如由隐私和安全等因素导致数据获取和处理复杂且昂贵;数据采集和标注对人员和设备专业度要求高、数据收集成本高;大规模的数据采集和处理对时间和资源的消耗量大等。基于此,迁移学习技术逐渐成为了工业缺陷检测的一种有效解决方案,即一种将在一个领域中学到的知识和经验应用到另一个领域的机器学习方法,通过利用源域中已有的大规模数据和模型,在目标领域标注数据不足情况下仍能达到良好的性能指标。
近日,清华大学深圳国际研究生院李星辉副教授团队以“只需要看一次”(You Only Look Once,YOLO)系列目标检测算法为例,提出了基于领域自适应的可嵌入模块,可以有效克服不同域之间的域偏移(domain shift)问题,高效利用不同来源的数据支持目标域任务训练,极大程度缓解了深度学习模型对数据集规模的高要求,有效降低了搜集目标域数据所需的昂贵时间及人工成本。
模块主要部署在检测网络的特征提取部分,使用特征网络中不同深度的特征图,将其线性组合作为对应源域或者目标域的特征表征。在获取两个领域各自的特征表征后,度量两个领域的差异,将其作为损失项加入模型的损失函数,使之可以随着训练迭代最小化(拉近源域和目标域的距离),以达到利用源域数据集指导模型在目标域数据集上训练的目的。
研究提出的第一个模块为“领域自适应”(Domain Adaptation,DA)模块,该模块使用特征提取网络不同深度特征图作为输出,通过通道数调整、降维以及多分支加权组合得到对应领域的域表征(Domain representation)。

图1.DA模块的使用方式
通过观察数据集不同域之间的差异,研究团队针对应用场景提出了一种新的领域自适应方法,回答了迁移学习中的核心问题——任务中“知识的迁移”指的是什么知识、“领域自适应”指的是什么领域。在工业检测应用场景中,源域和目标域为同类型但不同来源的数据,故团队选择定义风格作为其要自适应的领域,并将该方法命名为“风格自适应”(Style Adaptation,SA)。

图2.SA模块的使用方式
SA模块仍然使用DA类似方法,通道数调整之后提取各分支的风格特征,最后使用注意力机制将各分支融合得到各领域对应的风格表征(style representation)。相较于DA方法,SA方法可解释性更高、超参数更少、更轻量且能更有效消除域偏移现象。

图3.SA模块的具体细节
经实验证实,该工作提出的DA和SA模型在小样本的磁瓦表面缺陷检测领域具有较好精度表现。同时在保持较高检测精度的同时,DA和SA作为两个可插入模块对base网络增加的代价并不高,SA在使得检测精度更高的同时保证了增加代价更少(表1)。此外,可插入模块的设计使得检测模型收敛更快(表2)。

表1.不同目标域上的模型泛化性验证。表中“+”表示该方法可以作为一个可插入模块进行集成。“+”后面的值表示与原始基础网络相比,嵌入模块所产生的额外成本

表2.检测模型随训练迭代的精度变化
近日,相关研究以“风格自适应模块:在表面缺陷检测中增强检测器对不同制造商间差异的鲁棒性”(Style Adaptation Module: Enhancing Detector Robustness to Inter-Manufacturer Variability in Surface Defect Detection)为题,发表于《工业计算机》(Computers in Industry, COMIND)。李星辉为论文通讯作者,清华大学深圳国际研究生院2021级硕士生李晨为论文第一作者,2021级硕士生潘夏凯为第二作者。论文作者还包括深圳至汉装备有限公司朱培源,桂林汉璟智能仪器有限公司廖呈玮,广西桂华智能制造有限公司田昊洋,深圳国际研究生院副教授钱翔、教授李秀以及研究员王晓浩。项目得到了深圳稳定支持项目、国家重点研发计划基金以及清华大学深圳国际研究生院交叉学科基金的支持。
模块DA以“面向工业缺陷检测的领域自适应YOLOv5模型”(A domain adaptation YOLOv5 model for industrial defect inspection)为题,发表于《测量》(Measurement, MEAS)。李星辉为论文通讯作者,钱翔为共同通讯作者,李晨、深圳国际研究生院2019级硕士闫昊昕为论文共同第一作者。论文作者还包括朱培源、廖呈玮、田昊洋、李秀以及王晓浩。项目得到了深圳稳定支持项目、国家重点研发计划基金以及清华大学深圳国际研究生院交叉学科基金的支持。
文章来源 清华大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年6月优质国际学术会议推荐 7
-
2026年第17届机械与航空航天工程 193
-
2026年先进航空航天技术与卫星应用 324
-
2026资源、化学化工与应用材料国际 1808
-
2026年图像处理与数字创意设计国际 1632
-
2026年机械工程,新能源与电气技术 6095
-
2026年材料科学、低碳技术与动力工 1819
-
2026年艺术、文化产业与数字媒体国 04-29
-
2026年智慧教育、教育研究与文化交 04-29
-
2026年数字社会、公共管理与经济学 04-29
-
2026 政务服务、数字治理与智慧城 04-28
-
2026 制冷技术、暖通设备与环境调 04-28
-
2026 轻工材料、绿色制造与循环利 04-28
-
2026 多语言智能、翻译技术与国际 04-28
-
2026 生物育种、生态种植与现代农 04-28
-
中国科协发布2025年《重要学术12
-
2026年新锐分区(原中科院期刊2595
-
2025年两院院士增选有效候选人4402
-
2025最新JCR分区及影响因子12342
-
好学术:科研网址导航|学术头条分5673
-
2025年国际期刊预警名单发布!5837
-
2025年中科院期刊分区表重磅发20812
-
吉林大学校长张希:学术会议中的提6954
-
二维超导迈斯纳效应探测研究获进展04-29
-
研究发现笼目超导体中多重范霍夫奇04-29
-
二氧化碳加氢制高碳烯烃与航煤馏分04-29
-
靶向特定蛋白互作界面抑制乙肝病毒04-29
-
研究揭示内源信使调控膜损伤与细胞04-29
-
科学家绘制大脑星形胶质细胞转录因04-29
-
上海交大Bio-X研究院石毅与合04-29
-
云南大学 18300

-
武汉青博盛学术服务有限公司 2391

-
百奥泰国际会议(大连)有限公司 21296

-
武汉玄牝文化发展有限公司 8822

-
长江师范学院中文系 18347

-
西安交通大学 18571

-
苏州抗衰老学会 21319

-
北海世博商务会议服务有限公司 23360

-
常州武进假日酒店 21368

-
中纤网 24637

-
QWE 2371

-
WILL 8307

-
武汉志明文化传播有限公司 8344

-
中国石油大学 18351

-
中国热处理行业协会 24444

-
上海唐朝酒店 2366

-
扬州大学信息工程学院 18385

-
个体 2341

-
无锡华美达广场酒店 18321

-
昆明兴达会议服务有限公司 18532





















1054






































