SwinIR Image Restoration Using Swin Transformer

TL;DR

为Image Restoration 任务提供了一种Baseline 的 Transformer Based 方法

Method

Untitled

  • 主要由三部分构成:shallow feature extraction / deep feature extraction and highquality (HQ) image reconstruction
  • shallown feature extraction 由 3X3 的conv 构成
  • deep feature feature由若干RSTB模块构成,RSTB模块其实就是若干组Swin Transformer Blocks 和 Conv。外围有一个大的Residue
  • 最后一个模块则是把高频和低频feature整合到一块
  • Swin Transformer Layer:给定 H x W x C 的输入,把它reshape 成若干 M x M 的block。然后对每一个window 计算self-attention, 其中 query, key, value等三个vector的计算方式如下

Untitled

  • MLP / MSA之前有LayerNorm层

Untitled

Experiment

Ablation Study

Untitled

Untitled

Untitled