SRResNet : 画像を高品質に拡大する機械学習モデル

Published in

axinc

6 min readOct 8, 2020

ailia SDKで使用できる機械学習モデルである「SRResNet」のご紹介です。エッジ向け推論フレームワークであるailia SDKとailia MODELSに公開されている機械学習モデルを使用することで、簡単にAIの機能をアプリケーションに実装することができます。

SRResNetの概要

SRResNetは高品質に画像を拡大する超解像モデルです。(1,3,64,64)のサイズの画像を入力として、4倍に拡大した(1,3,256,256)のサイズの画像を出力します。

従来のbilinearやbicubicによる拡大では、斜め線にジャギーが発生したり、ぼやっとした出力になるという問題があります。AI超解像を使用することで、解像感を保ったまま、シャープに画像を拡大することができます。

SRResNetはPixelShufflerを使用することで、従来のDeconvolutionを使用したAI超解像よりもノイズが少ない画像を生成します。

Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network

Despite the breakthroughs in accuracy and speed of single image super-resolution using faster and deeper convolutional…

arxiv.org

AI超解像の歴史

SRCNN

Image Super-Resolution Using Deep Convolutional Networksで提案されたのがSRCNNです。Waifu2xでも使用されているアーキテクチャです。最初に解像度を上げた後に、複数の畳み込みを行う高精度画像を出力します。

FSRCNN

SRCNNの高速化のために提案されたのがFSRCNNです。Deconvolutionを使用して最後に解像度をあげることで、高速処理を実現しています。

ESPCN

Deconvolutionはチェッカーボードノイズが発生するという問題があり、この問題を解決したのがESPCN（SRResNet）です。PixelShuffler（Sub Pixel Convolutino）を使用することで、チェッカーボードノイズを抑制します。

出典：https://nuit-blanche.blogspot.com/2016/09/real-time-single-image-and-video-super.html

SRGAN

SRResNetのモデルアーキテクチャを使用した学習時の最適化の方法として、PSNRやSSIMを基準に学習を行なう方法と、GANを使って行う方法があります。PSNRやSSIMを基準にすると、数値的な性能は高いものの、解像感が出ないと言う問題があります。SRResNetのモデルを使用して、AIが生成した画像か、オリジナルの画像かをAIに判定させながら学習を行うことで、解像感を保ったまま超解像処理を行うモデルを構築することができます。この方式をSRGANと呼びます。

出典：https://openaccess.thecvf.com/content_cvpr_2017/papers/Ledig_Photo-Realistic_Single_Image_CVPR_2017_paper.pdf

SRResNetの使用方法

ailia SDKでSRResNet（SRGAN）を使用するには、下記のコマンドを使用します。-pオプションを使用することで、入力画像を64x64画素単位でタイリングして4倍の解像度に拡大することができます。

python3 srresnet.py -i input.jpg -o output.jpg -p

axinc-ai/ailia-models

Ailia input shape : (1,3,64,64) Range : [0.0, 1.0] Ailia output shape : (1,3,256,256) Range : [0, 1.0] Automatically…

github.com

SRResNet : 画像を高品質に拡大する機械学習モデル

SRResNetの概要

Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network

Despite the breakthroughs in accuracy and speed of single image super-resolution using faster and deeper convolutional…

AI超解像の歴史

SRCNN

FSRCNN

ESPCN

SRGAN

SRResNetの使用方法

axinc-ai/ailia-models

Ailia input shape : (1,3,64,64) Range : [0.0, 1.0] Ailia output shape : (1,3,256,256) Range : [0, 1.0] Automatically…

関連製品（ailia AI refiner）

実写映像やアニメをAIで高画質化するailia AI Refiner | cre8tiveAI

ailia AI Refiner とは？ Adobe社が提供するソフトウェアであるAfter Effects® で使用できるプラグインです。写真やイラストを世界最高水準で美しく高画質化します。エッジでの推論に特化したailia SDK…

Written by Kazuki Kyakuno

SRResNet : 画像を高品質に拡大する機械学習モデル

SRResNetの概要

Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network

Despite the breakthroughs in accuracy and speed of single image super-resolution using faster and deeper convolutional…

AI超解像の歴史

SRCNN

FSRCNN

ESPCN

SRGAN

SRResNetの使用方法

axinc-ai/ailia-models

Ailia input shape : (1,3,64,64) Range : [0.0, 1.0] Ailia output shape : (1,3,256,256) Range : [0, 1.0] Automatically…

関連製品（ailia AI refiner）

実写映像やアニメをAIで高画質化するailia AI Refiner | cre8tiveAI

ailia AI Refiner とは？ Adobe社が提供するソフトウェアであるAfter Effects® で使用できるプラグインです。 写真やイラストを世界最高水準で美しく高画質化します。 エッジでの推論に特化したailia SDK…

Written by Kazuki Kyakuno

ailia AI Refiner とは？ Adobe社が提供するソフトウェアであるAfter Effects® で使用できるプラグインです。写真やイラストを世界最高水準で美しく高画質化します。エッジでの推論に特化したailia SDK…