<圖學玩家 第031篇 原創文>
Score Function: Another Perspective of Diffusion Models
透過Tweedie's Formula,我們可以將參數估計范化為:
其中 z ∼ N(z; µz, Σz)。
而Diffusion Model中,q(xt|x0)可以表示為:
將上述兩式結合,我們可以得到
而在Tweedie’s Formula中,Mean的最佳估計就是我們實際Encoder中的Mean,也就是
由此我們可以得到x0:
將該x0代入我們在Part I中所得到的Denoising Transition Mean:
接著我們透過下式假設一個Denoising Transition Mean:
因此根據Diffusion Model,最終對Denoising Transition的推導可寫為
這邊讀者可以比對一下Part I的部分:
因此,整個Optimization的工作就變成是去訓練一個Neural Network sθ,使其接近∇log p(xt),這個∇log p(xt)即稱為Score Function。
利用Tweedie’s Formula以及我們在Part I得到的初始Image x0
我們可以發現Score Function,其實與Source Noise相關。
而Score Function的意義,也就是我們如何在Data Space中移動,去Maximize Log Probability。直覺上來說,與加雜訊反向即是一種Denoise的行為,也因此最能增加Log Probability。
intuitively, since the source noise is added to a natural image to corrupt it, moving in its opposite direction “denoises” the image and would be the best update to increase the subsequent log probability.
系列文章
- 3D生成:DreamFusion Part 1: Diffusion Model
- 3D生成:DreamFusion Part 3: Score Distillation Sampling
- 3D生成:DreamFusion Part 4: Algorithm