深圳研究生院张健课题组在图像重建领域取得重要进展
2024/12/18
近年来,以图像压缩感知、恶劣环境(如低光照)图像增强为代表的底层视觉任务因其实用性,受到学术界和工业界的广泛关注。深圳研究生院信息工程学院张健助理教授课题组近期在图像重建领域取得重要进展,其相关工作发表在IEEE Transactions on Pattern Analysis and Machine Intelligence(简称TPAMI)和International Journal of Computer Vision(简称IJCV)上。TPAMI是模式分析和机器智能领域国际公认的顶级期刊,其最新影响因子为20.8;IJCV是人工智能和计算机视觉领域国际公认的顶级期刊,其最新影响因子为11.6,2022—2023年度发文量198篇。两者均为中国计算机学会(CCF)推荐的A类学术期刊。

文章截图
图像压缩感知(Compressed Sensing,CS)旨在从少量线性观测值中重建原始图像信号,以突破奈奎斯特采样极限、极大地降低信号获取成本,其应用包括但不限于单像素相机、医疗成像(如CT和MRI)以及视频快照和光谱压缩成像等。目前,CS面临两个具有挑战性的问题:(1)如何设计高效的采样矩阵和采样方式,以尽可能多地保留图像信息;(2)如何设计高效的重建算法,以快速、精确地复原图像信号。课题组针对这两个问题,提出一种实用的紧凑深度压缩感知算法,相关成果发表在TPAMI上(论文地址:https://ieeexplore.ieee.org/document/10763443)。

图1 课题组提出的协同采样算子设计方案
针对采样矩阵与采样方式设计问题,课题组研究发现,大多数传统方法对高分辨率图像进行以块为单位的不重叠均匀采样,且传统采样矩阵的自适应能力弱、存储效率低下。如图1所示,课题组提出了一种新的协同采样算子(Collaborative Sampling Operator,COSO),通过深度条件滤波和双分支快速采样,实现了高效的全局采样。
在重建算法设计方面,课题组提出了一个实用、紧致的深度网络(Practical Compact Network,PCNet),通过设计新的协同采样算子和现代化的重建骨干网络,实现了高效的全局采样和可解释的重建。在高分辨率图像上,PCNet展示了显著的性能提升和扩展潜力。

图2 课题组提出的实用、紧致的图像压缩感知神经网络架构图
得益于各模块间良好的兼容性,如图2所示,课题组提出了一个实用、紧致的图像压缩感知神经网络,对所有组件进行端到端的联合训练。该方法在多个图像基准数据集上均取得了领先的性能。

文章截图
低光照增强(Low-light Image Enhancement,LLIE)旨在从受黑夜、阴影等恶劣环境破坏的低光照图像中重建高清图像信号,以求有效识别黑暗中的图像内容,在军事(如夜视仪)、民生(如自动驾驶)等领域存在广泛应用。目前,LLIE面临一个具有挑战性的问题:低光照图像的数据集是有限的,但实际应用时可能面对的低光照退化类型是无限的,在有限的低光照数据集上训练出的算法如何应用于实际场景无限可能的退化是亟需解决的问题。为此,课题组提出一种基于扩散先验的算法,提升增强算法在实际应用中的普适性,相关成果发表在IJCV期刊上(论文地址:https://link.springer.com/article/10.1007/s11263-024-02292-4)。

图3:提出的方法与当前最先进算法在真实手机拍摄图像及基准数据集上的结果对比
针对有限低光照图像数据集和实际应用中无限可能的退化之间的冲突问题,课题组研究发现,在大规模自然图像上训练的生成模型(如DDPM)具有非常丰富的自然图像先验,这在一定程度上可弥补有限的低光照图像数据。
如图4所示,一方面,基于DDPM的图像生成模型,课题组提出了一个退化域矫正模块(Degradation Domain Calibration, DDC)。对于真实场景中的低光照图像,先通过DDPM的加噪-去噪采样,在一定程度上将多样的低光照退化统一到一个特定的分布上(即DDPM的生成分布),使后续的低光照增强模型(HWEM)能永远接收到类似的低光照退化输入,降低增强的难度。

图4:课题组提出的实用、高效的低光照图像增强神经网络
另一方面,如图4所示,对于模型增强后的结果,课题组采用了知识蒸馏的策略,引入细粒度目标域蒸馏操作(Fine-grained Target Domain Distillation, FTD),通过将增强结果再次使用DDPM的加噪-去噪采样进行细粒度优化,进一步提升增强图像的质量。在真实世界捕获的低光照图像上,FTD展现出了显著的性能提升和鲁棒性。
得益于各模块间良好的兼容性,课题组提出了一个实用、高效的低光照图像增强神经网络,可应用于真实场景多变的低光退化。该方法在多个图像基准数据集上均取得了领先的性能。
两项工作均由张健课题组独立完成,论文通讯作者为张健,北京大学信息工程学院为第一作者单位。研究得到国家自然科学基金重点项目以及面上项目支持。
文章来源北京大学网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年1月高含金量国际学术会议合 12-12
-
第四届金融科技与商业分析国际学术会议 686
-
2026年第十一届复合材料与材料工程 1453
-
2025年机器视觉、智能成像与模式识 2126
-
2025年智能光子学与应用技术国际学 3284
-
2026年机械工程,新能源与电气技术 3476
-
2025年计算机科学、图像分析与信号 3917
-
2025年材料化学与燃料电池技术国际 3633
-
2026年交通数字化、人工智能与韧性 12-19
-
2026年社会文化与公共管理国际会议 12-19
-
2026年人文地理与语言研究国际会议 12-19
-
2026年社会发展与经济发展国际会议 12-19
-
2026年光伏材料、光电转换与可再生 12-19
-
2026年可持续发展与数字化社会国际 12-19
-
2026年管理科学、语言与教育国际会 12-19
-
2025年两院院士增选有效候选人2672
-
2025最新JCR分区及影响因子7552
-
好学术:科研网址导航|学术头条分3540
-
2025年国际期刊预警名单发布!3510
-
2025年中科院期刊分区表重磅发13412
-
中国科协《重要学术会议目录(207866
-
吉林大学校长张希:学术会议中的提4517
-
中国科大提出电化学一体化驱动策12-19
-
中国科大实现电泵浦片上集成高亮度12-19
-
西北农林科技大学【陕西新闻联播】12-19
-
中国科大实现片上非相干泵浦高品质12-19
-
中国科大中性原子量子计算研究成果12-19
-
炔烃远端C-O键的不对称活化转化12-19
-
研究揭示叶片内生真菌分子功能多样12-19
-
科研人员提出柑橘黄龙病防控新策略12-19
-
BIT 24133

-
广州国龙会议策划服务有限公司 24179

-
中国人民大学统计学院 21230

-
武汉布洛克斯玛热交换器公司 21071

-
亚洲商业协会有限公司 18166

-
第一届中国上市公司年会组委会 18201

-
上海兆畅会展有限公司 8352

-
中国地质大学 2228

-
百奥泰国际会议(大连)有限公司 24161

-
东北师范大学信息学院 2121

-
苏州经贸职业技术学院 18388

-
北京联合大学 24203

-
Hong Kong Societ 24134

-
美国科研出版社 2226

-
河南理工大学 23193

-
上海交通大学安泰经管学院 21322

-
北京外国语大学 18230

-
中国农业发展研究协会 2327

-
北京似野文化传播有限公司 23041

-
WILL 8132

















451









































