論文閱讀 CVPR 2021 — Multi-Stage Progressive Image Restoration

CVPR 2021

莊涵宇
5 min readMar 26, 2022

論文連結:《Multi-Stage Progressive Image Restoration

Introduction

影像常因環境影響,導致灰階分布集中、影像中含有雜訊,進而影響內容資訊的判讀,若能盡量恢復影像品質,則有助於使用者理解圖像資訊,像是監視攝像機的圖像雜訊回復,背景清晰化

模糊影像的回復

Contributions

  1. 利用 Multistage 的方法可以讓語意(背景)豐富,而且空間準確度高
  2. 利用 Supervised attention module 證明他們是有效的
  3. 利用 Muliti-scale features across stages,stage跟stage之間增加特徵豐富度,解決不同resolution比較有效的還原結果
  4. 不管是合成還是真實世界的10組資料庫他們表現都是最好的

Multi-scale feature

三張不同大小的輸入,獲得多種不同的 Feature map,淺層獲取邊緣特徵,深層獲取器官特徵,獲取多種特徵

Single-scale V.S Multi-scale

Single-scale (未經過 Down-up Sampling process)

  1. 優點 : 精細的空間細節
  2. 缺點 : 沒有較豐富的 Feature

Multi-scale (經過 Down-up sampling process)

  1. 優點 : 增加語意豐富度,因為擁有不同解析度的 Feature map
  2. 缺點 : 在來回 Down-up sampling(經過 Encoder、Decoder) ,犧牲空間瘩細節

MSPNet

MSPNet中,一開始的兩個 Stage 中他們使用 Multi-scale feature,為了在一開始,獲取比較豐富的語意資訊,在最後一個 Stage使用 Single-scale feature,是為了重建回影像原來大小,並保持空間細節的完整,所以它同時保留了兩種優點

階層式影像回復

CAB( Channel Attention Block )

在這裡的 CAB 指的是 Channel Attention Block,主要功能是要獲得不同尺度的 Feature map,其架構是標準的 Attention 架構,Attention mechanism 的機制是模仿人類視覺的注意力機制,學習出一個對圖像特徵的權重分布,再把這個權重分布施加在原來的特徵上,為後面任務的圖像分類、圖像識別等提供不同的特徵影響,使得任務主要關注在一些重點特徵,忽略不重要特徵

CSFF(Cross-Stage Feature Fusion)

讓網路比較不會受到資訊丟失的影響,並能增加語意豐富度到傳到下一層

SAM ( Supervised Attention Module )

功能是將少量的特徵較重要的資訊通過,分成四等分傳到下一個 Stage ,因此不需要那麼多的細節,在恢復圖像的每階段中,提供有用的 Ground truth信號,由圖上來看模型其實要生成的是,能與原圖的雜訊互相抵消的雜訊,Fin 是模型訓練出來的 Feature Map,Fin跟原圖抵銷會生成乾淨的無雜訊圖

( ORSNet )Original Resolution Subnetwork

沒沒採用任何的 Down-sampling 方法,保留空間資訊,內含多個 Original resolution block (ORB),一個 ORB 裡面會有 8 個CAB,總共有 3 個 ORB,瘋狂 fusion,讓深層跟淺層結合出夠更多相關性,關注到全部channel的資訊

Loss Function

Total Loss

● Charbonnier loss
更能處理離群值並改善其效能。

Charbonnier Loss

● Edge Loss
圖片作拉普拉斯後,比較有噪聲的圖片,以及 Ground truth 找到邊點,邊緣銳利化後相減的 Loss 值

Edge Loss

衡量指標名詞解釋
PSNR峰值訊噪比
(Peak signal-to-noise ratio ),數值越低代表越能被肉眼看出被壓縮後的圖像

SSIM結構相似性(structural similarity index )是一種用以衡量兩張數位影像相似程度的指標,對樣本及ground truth 的亮度 ( luminance )、對比度(contrast ) 和結構 (structure)差異

Sign up to discover human stories that deepen your understanding of the world.

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

莊涵宇
莊涵宇

Written by 莊涵宇

畢業國立台灣科技大學資工所,主要研究方向為 AI 視覺領域以及 AOI 檢測,目前從事 AOI 開發等相關工作,聯絡信箱 levihanyu1016@gmail.com

No responses yet

Write a response