論文閱讀 CVPR 2021 — Multi-Stage Progressive Image Restoration

CVPR 2021

莊涵宇
5 min readMar 26, 2022

論文連結:《Multi-Stage Progressive Image Restoration

Introduction

影像常因環境影響,導致灰階分布集中、影像中含有雜訊,進而影響內容資訊的判讀,若能盡量恢復影像品質,則有助於使用者理解圖像資訊,像是監視攝像機的圖像雜訊回復,背景清晰化

模糊影像的回復

Contributions

  1. 利用 Multistage 的方法可以讓語意(背景)豐富,而且空間準確度高
  2. 利用 Supervised attention module 證明他們是有效的
  3. 利用 Muliti-scale features across stages,stage跟stage之間增加特徵豐富度,解決不同resolution比較有效的還原結果
  4. 不管是合成還是真實世界的10組資料庫他們表現都是最好的

Multi-scale feature

三張不同大小的輸入,獲得多種不同的 Feature map,淺層獲取邊緣特徵,深層獲取器官特徵,獲取多種特徵

Single-scale V.S Multi-scale

Single-scale (未經過 Down-up Sampling process)

  1. 優點 : 精細的空間細節
  2. 缺點 : 沒有較豐富的 Feature

Multi-scale (經過 Down-up sampling process)

  1. 優點 : 增加語意豐富度,因為擁有不同解析度的 Feature map
  2. 缺點 : 在來回 Down-up sampling(經過 Encoder、Decoder) ,犧牲空間瘩細節

MSPNet

MSPNet中,一開始的兩個 Stage 中他們使用 Multi-scale feature,為了在一開始,獲取比較豐富的語意資訊,在最後一個 Stage使用 Single-scale feature,是為了重建回影像原來大小,並保持空間細節的完整,所以它同時保留了兩種優點

階層式影像回復

CAB( Channel Attention Block )

在這裡的 CAB 指的是 Channel Attention Block,主要功能是要獲得不同尺度的 Feature map,其架構是標準的 Attention 架構,Attention mechanism 的機制是模仿人類視覺的注意力機制,學習出一個對圖像特徵的權重分布,再把這個權重分布施加在原來的特徵上,為後面任務的圖像分類、圖像識別等提供不同的特徵影響,使得任務主要關注在一些重點特徵,忽略不重要特徵

CSFF(Cross-Stage Feature Fusion)

讓網路比較不會受到資訊丟失的影響,並能增加語意豐富度到傳到下一層

SAM ( Supervised Attention Module )

功能是將少量的特徵較重要的資訊通過,分成四等分傳到下一個 Stage ,因此不需要那麼多的細節,在恢復圖像的每階段中,提供有用的 Ground truth信號,由圖上來看模型其實要生成的是,能與原圖的雜訊互相抵消的雜訊,Fin 是模型訓練出來的 Feature Map,Fin跟原圖抵銷會生成乾淨的無雜訊圖

( ORSNet )Original Resolution Subnetwork

沒沒採用任何的 Down-sampling 方法,保留空間資訊,內含多個 Original resolution block (ORB),一個 ORB 裡面會有 8 個CAB,總共有 3 個 ORB,瘋狂 fusion,讓深層跟淺層結合出夠更多相關性,關注到全部channel的資訊

Loss Function

Total Loss

● Charbonnier loss
更能處理離群值並改善其效能。

Charbonnier Loss

● Edge Loss
圖片作拉普拉斯後,比較有噪聲的圖片,以及 Ground truth 找到邊點,邊緣銳利化後相減的 Loss 值

Edge Loss

衡量指標名詞解釋
PSNR峰值訊噪比
(Peak signal-to-noise ratio ),數值越低代表越能被肉眼看出被壓縮後的圖像

SSIM結構相似性(structural similarity index )是一種用以衡量兩張數位影像相似程度的指標,對樣本及ground truth 的亮度 ( luminance )、對比度(contrast ) 和結構 (structure)差異

--

--

莊涵宇
莊涵宇

Written by 莊涵宇

畢業國立台灣科技大學資工所,主要研究方向為 AI 視覺領域以及 AOI 檢測,目前從事 AOI 開發等相關工作,聯絡信箱 levihanyu1016@gmail.com