当前位置:首页 >> 学术资讯 >> 科研信息

清华大学深圳国际研究生院李星辉团队在深度学习工业智能应用上取得系列进展

2024/07/02

随着深度学习技术的快速发展,人工智能在诸多领域取得了显著突破,如自然语言处理、图像识别和语音识别等。深度学习模型以其出色的性能和广泛的应用前景在工业界引起了高度关注。要使深度学习模型在实际应用中表现出色,首先要解决的就是高质量数据集的获取问题,但当前工业界在数据的收集方面仍面临挑战,例如由隐私和安全等因素导致数据获取和处理复杂且昂贵;数据采集和标注对人员和设备专业度要求高、数据收集成本高;大规模的数据采集和处理对时间和资源的消耗量大等。基于此,迁移学习技术逐渐成为了工业缺陷检测的一种有效解决方案,即一种将在一个领域中学到的知识和经验应用到另一个领域的机器学习方法,通过利用源域中已有的大规模数据和模型,在目标领域标注数据不足情况下仍能达到良好的性能指标。

近日,清华大学深圳国际研究生院李星辉副教授团队以“只需要看一次”(You Only Look Once,YOLO)系列目标检测算法为例,提出了基于领域自适应的可嵌入模块,可以有效克服不同域之间的域偏移(domain shift)问题,高效利用不同来源的数据支持目标域任务训练,极大程度缓解了深度学习模型对数据集规模的高要求,有效降低了搜集目标域数据所需的昂贵时间及人工成本。

模块主要部署在检测网络的特征提取部分,使用特征网络中不同深度的特征图,将其线性组合作为对应源域或者目标域的特征表征。在获取两个领域各自的特征表征后,度量两个领域的差异,将其作为损失项加入模型的损失函数,使之可以随着训练迭代最小化(拉近源域和目标域的距离),以达到利用源域数据集指导模型在目标域数据集上训练的目的。

研究提出的第一个模块为“领域自适应”(Domain Adaptation,DA)模块,该模块使用特征提取网络不同深度特征图作为输出,通过通道数调整、降维以及多分支加权组合得到对应领域的域表征(Domain representation)。

图1.DA模块的使用方式

通过观察数据集不同域之间的差异,研究团队针对应用场景提出了一种新的领域自适应方法,回答了迁移学习中的核心问题——任务中“知识的迁移”指的是什么知识、“领域自适应”指的是什么领域。在工业检测应用场景中,源域和目标域为同类型但不同来源的数据,故团队选择定义风格作为其要自适应的领域,并将该方法命名为“风格自适应”(Style Adaptation,SA)。

图2.SA模块的使用方式

SA模块仍然使用DA类似方法,通道数调整之后提取各分支的风格特征,最后使用注意力机制将各分支融合得到各领域对应的风格表征(style representation)。相较于DA方法,SA方法可解释性更高、超参数更少、更轻量且能更有效消除域偏移现象。

图3.SA模块的具体细节

经实验证实,该工作提出的DA和SA模型在小样本的磁瓦表面缺陷检测领域具有较好精度表现。同时在保持较高检测精度的同时,DA和SA作为两个可插入模块对base网络增加的代价并不高,SA在使得检测精度更高的同时保证了增加代价更少(表1)。此外,可插入模块的设计使得检测模型收敛更快(表2)。

表1.不同目标域上的模型泛化性验证。表中“+”表示该方法可以作为一个可插入模块进行集成。“+”后面的值表示与原始基础网络相比,嵌入模块所产生的额外成本

表2.检测模型随训练迭代的精度变化

近日,相关研究以“风格自适应模块:在表面缺陷检测中增强检测器对不同制造商间差异的鲁棒性”(Style Adaptation Module: Enhancing Detector Robustness to Inter-Manufacturer Variability in Surface Defect Detection)为题,发表于《工业计算机》(Computers in Industry, COMIND)。李星辉为论文通讯作者,清华大学深圳国际研究生院2021级硕士生李晨为论文第一作者,2021级硕士生潘夏凯为第二作者。论文作者还包括深圳至汉装备有限公司朱培源,桂林汉璟智能仪器有限公司廖呈玮,广西桂华智能制造有限公司田昊洋,深圳国际研究生院副教授钱翔、教授李秀以及研究员王晓浩。项目得到了深圳稳定支持项目、国家重点研发计划基金以及清华大学深圳国际研究生院交叉学科基金的支持。

模块DA以“面向工业缺陷检测的领域自适应YOLOv5模型”(A domain adaptation YOLOv5 model for industrial defect inspection)为题,发表于《测量》(Measurement, MEAS)。李星辉为论文通讯作者,钱翔为共同通讯作者,李晨、深圳国际研究生院2019级硕士闫昊昕为论文共同第一作者。论文作者还包括朱培源、廖呈玮、田昊洋、李秀以及王晓浩。项目得到了深圳稳定支持项目、国家重点研发计划基金以及清华大学深圳国际研究生院交叉学科基金的支持。


版权声明:
文章来源 清华大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2025年第四届人工智能与机器学习国际会议(FAIML 2025)(2025-04-25)

2025年无线与光通信国际会议(CWOC 2025)(2025-04-25)

2025年计算机科学与神经网络国际会议(ICCSNN 2025)(2025-05-10)

SPIE出版|2025年遥感与信息技术学术会议(RSIT2025)(2025-05-18)

2025年电子信息、计算机技术与通信工程国际会议(EICTCE 2025)(2025-05-22)

2025年计算机游戏、仿真与建模国际会议(2025-05-22)

第十届组合数学与图论国际研讨会(CGT 2025)(2025-05-23)

2025年第三届亚洲计算机视觉、图像处理和模式识别国际会议(CVIPPR 2025)(2025-05-23)

第四届机器视觉、自动识别与检测国际学术会议(MVAID 2025)(2025-05-23)

第九届能源技术与材料科学国际学术会议(ICETMS 2025)(2025-05-23)

2025年光电科学、信息技术与数据安全国际学术会议(OSITDS 2025)(2025-6-11)

第十届网络安全与信息工程国际会议(ICCSIE 2025)(2025-7-25)

2025年数字经济、区块链与网络安全国际会议(IDEBC 2025)(2025-6-13)

2025语言、创新教育与艺术设计国际会议(ICLIEAD 2025)(2025-5-28)

2025年英语、教育学与文化交流国际会议(ICEECE 2025)(2025-6-26)

2025车辆工程、交通运输与无人驾驶技术国际会议(VETADT 2025)(2025-6-10)

2025传统文化、非遗学与文物修复技术国际学术会议(TCICHCRRT 2025)(2025-5-10)

2025机械工程、材料科学与自动化技术国际学术会议(MEMSAT 2025)(2025-6-12)

2025年石油化工、资源勘探与测量工程国际会议(IPRES 2025)(2025-5-20)

2025年岩土工程、隧道与地下工程国际学术会议(GETUE 2025)(2025-6-15)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。