当前位置:首页 >> 学术资讯 >> 科研信息

深圳研究生院张健课题组在图像重建领域取得重要进展

2024/12/18

近年来,以图像压缩感知、恶劣环境(如低光照)图像增强为代表的底层视觉任务因其实用性,受到学术界和工业界的广泛关注。深圳研究生院信息工程学院张健助理教授课题组近期在图像重建领域取得重要进展,其相关工作发表在IEEE Transactions on Pattern Analysis and Machine Intelligence(简称TPAMI)和International Journal of Computer Vision(简称IJCV)上。TPAMI是模式分析和机器智能领域国际公认的顶级期刊,其最新影响因子为20.8;IJCV是人工智能和计算机视觉领域国际公认的顶级期刊,其最新影响因子为11.6,2022—2023年度发文量198篇。两者均为中国计算机学会(CCF)推荐的A类学术期刊。

文章截图

图像压缩感知(Compressed Sensing,CS)旨在从少量线性观测值中重建原始图像信号,以突破奈奎斯特采样极限、极大地降低信号获取成本,其应用包括但不限于单像素相机、医疗成像(如CT和MRI)以及视频快照和光谱压缩成像等。目前,CS面临两个具有挑战性的问题:(1)如何设计高效的采样矩阵和采样方式,以尽可能多地保留图像信息;(2)如何设计高效的重建算法,以快速、精确地复原图像信号。课题组针对这两个问题,提出一种实用的紧凑深度压缩感知算法,相关成果发表在TPAMI上(论文地址:https://ieeexplore.ieee.org/document/10763443)。

图1 课题组提出的协同采样算子设计方案

针对采样矩阵与采样方式设计问题,课题组研究发现,大多数传统方法对高分辨率图像进行以块为单位的不重叠均匀采样,且传统采样矩阵的自适应能力弱、存储效率低下。如图1所示,课题组提出了一种新的协同采样算子(Collaborative Sampling Operator,COSO),通过深度条件滤波和双分支快速采样,实现了高效的全局采样。

在重建算法设计方面,课题组提出了一个实用、紧致的深度网络(Practical Compact Network,PCNet),通过设计新的协同采样算子和现代化的重建骨干网络,实现了高效的全局采样和可解释的重建。在高分辨率图像上,PCNet展示了显著的性能提升和扩展潜力。

图2 课题组提出的实用、紧致的图像压缩感知神经网络架构图

得益于各模块间良好的兼容性,如图2所示,课题组提出了一个实用、紧致的图像压缩感知神经网络,对所有组件进行端到端的联合训练。该方法在多个图像基准数据集上均取得了领先的性能。

文章截图

低光照增强(Low-light Image Enhancement,LLIE)旨在从受黑夜、阴影等恶劣环境破坏的低光照图像中重建高清图像信号,以求有效识别黑暗中的图像内容,在军事(如夜视仪)、民生(如自动驾驶)等领域存在广泛应用。目前,LLIE面临一个具有挑战性的问题:低光照图像的数据集是有限的,但实际应用时可能面对的低光照退化类型是无限的,在有限的低光照数据集上训练出的算法如何应用于实际场景无限可能的退化是亟需解决的问题。为此,课题组提出一种基于扩散先验的算法,提升增强算法在实际应用中的普适性,相关成果发表在IJCV期刊上(论文地址:https://link.springer.com/article/10.1007/s11263-024-02292-4)。

图3:提出的方法与当前最先进算法在真实手机拍摄图像及基准数据集上的结果对比

针对有限低光照图像数据集和实际应用中无限可能的退化之间的冲突问题,课题组研究发现,在大规模自然图像上训练的生成模型(如DDPM)具有非常丰富的自然图像先验,这在一定程度上可弥补有限的低光照图像数据。

如图4所示,一方面,基于DDPM的图像生成模型,课题组提出了一个退化域矫正模块(Degradation Domain Calibration, DDC)。对于真实场景中的低光照图像,先通过DDPM的加噪-去噪采样,在一定程度上将多样的低光照退化统一到一个特定的分布上(即DDPM的生成分布),使后续的低光照增强模型(HWEM)能永远接收到类似的低光照退化输入,降低增强的难度。

图4:课题组提出的实用、高效的低光照图像增强神经网络

另一方面,如图4所示,对于模型增强后的结果,课题组采用了知识蒸馏的策略,引入细粒度目标域蒸馏操作(Fine-grained Target Domain Distillation, FTD),通过将增强结果再次使用DDPM的加噪-去噪采样进行细粒度优化,进一步提升增强图像的质量。在真实世界捕获的低光照图像上,FTD展现出了显著的性能提升和鲁棒性。

得益于各模块间良好的兼容性,课题组提出了一个实用、高效的低光照图像增强神经网络,可应用于真实场景多变的低光退化。该方法在多个图像基准数据集上均取得了领先的性能。

两项工作均由张健课题组独立完成,论文通讯作者为张健,北京大学信息工程学院为第一作者单位。研究得到国家自然科学基金重点项目以及面上项目支持。


版权声明:
文章来源北京大学网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2025年第四届人工智能与机器学习国际会议(FAIML 2025)(2025-04-25)

2025年无线与光通信国际会议(CWOC 2025)(2025-04-25)

2025年计算机科学与神经网络国际会议(ICCSNN 2025)(2025-05-10)

SPIE出版|2025年遥感与信息技术学术会议(RSIT2025)(2025-05-18)

2025年电子信息、计算机技术与通信工程国际会议(EICTCE 2025)(2025-05-22)

2025年计算机游戏、仿真与建模国际会议(2025-05-22)

第十届组合数学与图论国际研讨会(CGT 2025)(2025-05-23)

2025年第三届亚洲计算机视觉、图像处理和模式识别国际会议(CVIPPR 2025)(2025-05-23)

第四届机器视觉、自动识别与检测国际学术会议(MVAID 2025)(2025-05-23)

第九届能源技术与材料科学国际学术会议(ICETMS 2025)(2025-05-23)

2025年历史建筑与人文社会国际会议(ICHAHS 2025)(2025-5-28)

2025年计算机通信、网络安全与智能系统国际会议(ICCNSIS 2025)(2025-6-14)

2025文化、艺术与经济管理国际会议(ICCAEM 2025)(2025-6-5)

2025年图像处理、计算机视觉与机器学习国际会议(IPCVML 2025)(2025-5-29)

2025年应用物理、固体力学与材料科学国际会议(IAPSM 2025)(2025-5-15)

2025年电子信息工程与机械仪表国际会议(EIEMI 2025)(2025-6-23)

第二届微机电系统制造与材料技术国际学术会议(MSMMT 2025)(2025-7-11)

2025年元宇宙、虚拟现实与人机交互国际会议(MVRHCI 2025)(2025-5-25)

2025计算机信息、数字通讯与人工智能国际会议(CIDCAI 2025)(2025-5-15)

2025年经济管理与模式识别国际会议(ICEMPR 2025)(2025-6-9)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。