科普:图像复原之图像去噪技术

科普:图像复原之图像去噪技术

随着电子信息与仪器科学的发展,以摄影仪、CT 扫描仪等为代表的多种成像设备相继问世,每天数以亿计的数字视频和图像不断涌入人类社会,影响着现代社会的文化生活、工业生产、前沿探索等多个方面,带来巨大的经济和社会效益:一方面,多媒体视频图像促进了人类社会的信息交流,极大丰富了人类的精神生活:另一方面,集成像分析为一体的现代化视觉智能感知技术有力推动了工业制造、生物医疗、深空探测等领域向更智能、更高效、更精确的方向发展,促进相关领域研究取得了前所未有的突破性进展。数字化视频和图像已成为人类生产生活不可或缺的重要组成。

然而,受环境光照、量化误差、设备约束等因素限制,视频图像在采集传输、存储等过程中不可避免地引入不同形式的噪声,致使视频图像清晰度和保真度受到影响,该现象被称为视频图像退化。视频图像退化不仅阻碍了信息交流,也给智能感知分析带来了严峻挑战。如在交通监测领域,噪声严重影响监控系统对车辆的正确识别,不利于智能化管理;在医学诊断领域,噪声会使医疗影像信息模糊,可能导致医生误诊;在遥感分析领域,噪声可能导致高光谱图像信号失真,不利于后续数据分析。因此,去除视频图像噪声并恢复视频图像退化信息具有重要意义。

图像去噪是解决图像退化问题的关键技术之一,该技术通过预定义图像退化模型,求解逆问题实现噪声去除。一种典型退化模型是将成像噪声建模为加性高斯白噪声,通过引入相应图像先验实现视频和图像噪声的有效去除。下图展示了几种典型噪声导致的图像退化,可以看出不同噪声类型引起的退化形式差异极大,给去噪算法的适用性带来巨大挑战。


Image

早期去噪算法针对不同退化形式设计相应滤波器,通过空域滤波(如高斯滤波、中值滤波等)实现视频图像去噪。然而,该方法易使去噪图像变模糊,导致纹理细节严重丢失。为进一步提升去噪算法性能,基于先验的视频图像去噪方法将模型分为先验项和保真项,通过精心设计图像先验,如非局部自相似性先验、全变分先验 、稀疏性先验等,使得传统去噪模型的泛化性和保真性显著提升。然而,该类算法的良好性能依赖复杂的先验设计,其约束求解过程需要大量计算开销,且为提升算法的适用性,该类方法需针对具体退化图像手动调整去噪模型超参数,不利于模型在工业自动化场景的应用。

近年来,得益于硬件图形处理单元(GPU)的发展基于卷积神经网络(Convolutional Neural Networks, CNN)的视频图像去噪方法迈入新的里程碑该类方法利用卷积层、池化层、激活函数和批归一化层等构建非线性模型,通过基于梯度下降方法的端到端训练实现模型优化,学习样本数据中潜在的噪声分布。相比于传统去噪模型,基于卷积神经网络的视频图像去噪模型具有以下优势: 1)大量数据驱动的深度特征先验相比与精细设计的人工先验更具表征能力,可以帮助去噪模型取得更好的去噪性能: 2)通过扩充样本数据,单个去噪模型可对多种退化形式同时建模,学习潜在的泛化特征,使模型对不同噪声都具备适用性,3) 预训练好的去噪模型在实际应用中无需调整任何超参数,有利于实现自动化和智能化。

上述优势使得基于卷积神经网络的图像去噪模型逐渐成为主流并取得巨大成功。然而,面向实际应用场景,图像去噪仍面临以下挑战:首先,不同场景对去噪模型的计算量、参数量、去噪质量等各方面性能要求不同,去噪模型无法同时在这些方面均取得最优表现,如何设计去噪模型框架使其能调节去噪模型性能偏好,是去噪模型灵活适应不同任务的一个重要挑战,其次,视频数据存在大量时间冗余,该冗余带来自相似性的同时也对去噪效率提出更高要求,如何利用视频连续帧间的时空冗余,使去噪模型在保证去噪视频与原有视频时间一致的同时更加高效地去除噪声是视频去噪呱需解决的难题。最后,由于噪声分布存在差异,公共数据集训练的去噪模型可能无法直接迁移到实际任务中,需要利用实际场景数据进行微调或重新训练,而实际场景往往难以获取理想配对的有噪和清晰图像,如何利用非理想配对图像提升去噪模型在实际场景中的性能表现是吸待突破的瓶颈。

 

 

滚动至顶部
Review Your Cart
0
Add Coupon Code
Subtotal