简读分享 | 陈兴民 编辑 | 乔剑博
论文题目
Uformer: A General U-Shaped Transformer for Image Restoration
论文摘要
本文提出了一种有效的基于Transformer的图像恢复体系结构Uformer,在该结构中,作者使用Transformer块构建了一个分层的编解码网络。在Uformer中,有两个核心设计。首先,文章介绍了一种新的局部增强窗口(Lewin)转换块,它的执行是基于非重叠窗口的自注意力,而不是全局自注意力。该算法在捕捉局部背景的同时,显著降低了高分辨率特征图的计算复杂度。其次,作者以多尺度空间偏差的形式提出了一种可学习的多尺度恢复调制器来调整Uformer解码器的多层特征。文中的调制器展示了在各种图像恢复任务中恢复细节的优越能力,同时引入了边际额外参数和计算成本。在这两种设计的支持下,Uformer具有捕获本地和全局依赖关系上有着出色的能力,可用于图像恢复。为了评估文中的方法,作者在几个图像恢复任务上进行了大量的实验,包括图像去噪、运动去模糊、离焦去模糊和去模糊。在没有花里胡哨的情况下,Uformer能够达到甚至超过SOTA。
论文链接
https://openaccess.thecvf.com/content/CVPR2022/html/Wang_Uformer_A_General_U-Shaped_Transformer_for_Image_Restoration_CVPR_2022_paper.html