Super-resolution From Unregistered Aliased Images With Unknown Scalings And Shifts

Jack Pan
電腦視覺 (Computer Vision)
3 min readSep 2, 2014

基本上把圖片當做一個信號來處理,論文中理論部分都是用1D的訊號來解說,可擴充到2D。

目標是將多張有輕微位移和輕微Scale的大小變化的低解析度圖,算出一張高解析度圖出來。

以下講解我理解的大略概念:

根據
Super-resolution from unregistered and totally aliased signals using subspace methods
經過鏡頭後的訊號是bandlimited,然後可以表示成上式形式,也就是如傅立葉級數。

然而實際上不知道g(t)是什麼,只能知道經過sampling後的y[n],而且sample rate低於應有的速率,所以需使用多張圖片,將多張圖看成multichannel同時對g(t)做sampling,多個channel的資訊結合就可達到應有的sample rate。

多張圖片之間,論文規定只能有位移和縮放。原本g(t)的訊號經過位移和縮放後會變成:

a subscript m代表縮放
t subscript m代表位移
m表示第幾張照片,M表示最大照片數。
g(t)的period=1。每張照片的sample數量為N。

代入第一個式子:

就可以寫出如上式表示照片的式子。目標是透過上式求得beta,如此就可以再代回去第一個式子,得到g(t)。

然而上式中beta, a subscript m, t subscript m皆為未知,無法有直接解。但是兩者可分開交互計算,故使用Separable nonlinear least squares: The variable projection method and its applications這篇的方法。iteratively解beta,解a subscript m, t subscript m。

如此可算出最接近beta,得到g(t)即高解析度影像。(以上分析在1D中,2D在論文中有式子無分析)

--

--