3D生成:DreamFusion Part 2: Score Function

圖學玩家
Dec 7, 2023

--

<圖學玩家 第031篇 原創文>

Demo of DreamFusion

Score Function: Another Perspective of Diffusion Models

透過Tweedie's Formula,我們可以將參數估計范化為:

其中 z ∼ N(z; µz, Σz)。

Diffusion Model中,q(xt|x0)可以表示為:

將上述兩式結合,我們可以得到

而在Tweedie’s Formula中,Mean的最佳估計就是我們實際Encoder中的Mean,也就是

由此我們可以得到x0:

將該x0代入我們在Part I中所得到的Denoising Transition Mean:

接著我們透過下式假設一個Denoising Transition Mean:

因此根據Diffusion Model,最終對Denoising Transition的推導可寫為

這邊讀者可以比對一下Part I的部分:

因此,整個Optimization的工作就變成是去訓練一個Neural Network sθ,使其接近∇log p(xt),這個∇log p(xt)即稱為Score Function

利用Tweedie’s Formula以及我們在Part I得到的初始Image x0

我們可以發現Score Function,其實與Source Noise相關。

而Score Function的意義,也就是我們如何在Data Space中移動,去Maximize Log Probability。直覺上來說,與加雜訊反向即是一種Denoise的行為,也因此最能增加Log Probability。

intuitively, since the source noise is added to a natural image to corrupt it, moving in its opposite direction “denoises” the image and would be the best update to increase the subsequent log probability.

系列文章

  1. 3D生成:DreamFusion Part 1: Diffusion Model
  2. 3D生成:DreamFusion Part 3: Score Distillation Sampling
  3. 3D生成:DreamFusion Part 4: Algorithm

Ref

  1. DreamFusion
  2. Understanding Diffusion Models: A Unified Perspective

--

--