XAI| 透過 LIME 解釋複雜難懂的模型

Local Interpretable Model-agnostic Explanations (LIME)

Sherry Su

Published in

Sherry.AI

7 min readJun 30, 2021

一、背景介紹

為了理解模型，2016年 “Why Should I Trust You?” 論文中，提出了局部可解釋性模型 – LIME（Local Interpretable Model-agnostic Explanations）的概念，為 XAI 的研究提供了一些啟發。這篇文章就來大家了解 LIME 是如何解釋模型的吧！

> 想瞭解更多模型可解釋性的重要，可參考以下的文章：

XAI| 模型可解釋性的重要

人工智慧所面臨的挑戰，如何打開黑盒子？

medium.com

假設我們利用特徵 x₁ 與 x₂ 建立了一個複雜且準確的模型 f (x)去預測個體是 ★（黃色區域）還是 ▲（綠色區域）。從下圖可以發現，若我們想要解釋為什麼這個個體（instance）會被分類至 ★（黃色區域）是非常困難的。

而 LIME 方法就是為了解決上述問題，在該個體的附近建立一個簡單可解釋的模型 g(𝑧′) （下圖中的虛線；例如：線性模型或是決策樹），作為此個體的解釋模型。而可解釋模型 g(𝑧′) 在該個體附近的預測準確度必須與原模型 f(x) 相當，但在離該個體較遠的區域其預測力就會大幅下降，這就是所謂的「局部（local）」忠實性。

LIME 的目標主要是針對一個複雜難解釋的模型，根據欲解釋的個體提供一個局部可解釋的模型，其主要的概念為針對某個體在局部區域找出一個簡單可理解的模型，用以回答「為什麼模型會將某個體分類到特定的類別」。

如果你也想嘗試著用LIME解釋模型，下面提供了 python 的程式碼讓大家練習與參考：
💻 Python code：Google Colab Python code

二、方法與原理

假設我們建立了一個大眼仔與樹蛙的分類器 f(x)，若想直接從解釋這個模型為什麼會這樣子分類是非常困難的。

根據LIME的做法，或許我們能選定一個欲解釋的個體資料(如下圖中的星星-玩具樹蛙)，並且用一個簡單的線性迴歸來fit這條決策邊界，試圖解釋模型f(x)在這個邊界上是怎麼做決策的。

備註: 黃色區域（星星）為樹蛙，綠色區域（三角形）為大眼仔。

．LIME 的分析步驟如下：

Step1: 將資料分割成小區塊，隨機擾動預解釋的個體的小區塊 (Perturbed Instance) 產生新樣本，丟進模型預測結果。

將玩具樹蛙的圖片丟入此模型預測出來為樹蛙的機率為 0.54。為了瞭解模型所做的決策，將此圖片根據「超像素分割算法」切割成 M 個 Super Pixel（SP₁, SP₂,…,SPᴍ）。

原始圖片(Original Image)進行辨識時，丟入分類器的話，特徵會是一個三維的向量 (RGB)，而每個維度代表所對應 pixel 在該 channel 的數值；而 super pixel Image，則是以二元向量 {0, 1} 來表示第 i 個 super pixel是否有存在於這張圖片之中。

接著根據所選定的個體資料進行擾動產生新的資料集 z (Pertubed Instances;)，擾動的方式為隨機指派 super pixel 為 0 或 1，若第 i 個 super pixel 為 0，代表將第 i 個 super pixel 以灰色覆蓋；若第 i 個 super pixel 為 1，則是保留該 super pixel。

將新產生出來的資料集以RGB的資料型態丟回原先的分類模型 f，就能得出產出結果 y (這裡的 y 代表的是樹蛙的機率)，就能了解到此新資料集在分類模型的分布狀況。