DiCE-問題排除與補充

Raven
隨筆趣事
Published in
Jun 22, 2023
Photo by Sigmund on Unsplash

如題,本章節將補充在上一篇文章沒提到的內容,同時,分享筆者在實作時,遇到的問題,以及如何解決。

產生反事實的超參數,是有條件限制的:

  • proximity_weight(default=0.2), 只適用於genetic方法
  • diversity_weight (default=5),只適用於genetic, kdtree方法
  • desired_range(限制預測範圍),只適用於regression問題

官方參考(104行–140行)

Local and Global feature importance 分數跟我們想像的不一樣:

在DiCE中,Local and Global feature importance 分數計算方式是變動欄位/全部欄位:

  • age = 10/10 = 1.0
  • embarked = 2 / 10 = 0.2

有時候跑不出反事實,是正常的:

  • 不要超參數,設置太多,反而找不出該案例的反事實
  • 換別的案例,有可能真的沒有反事實
  • 訓練的模型效果太差,或改用別的DiCE method(kdtree, genetic, random)

Genetic方法跑好久:

沒錯,因為他是genetic sampling,所以執行很久! 換個方法,或提升硬體設備!

--

--

Raven
隨筆趣事

熱愛寫code,平時遇到有趣的事情,也會上來寫寫,抒發自己的心情。