Makine Öğrenmesinin Kapalı Kutusu: Yorumlanabilirlik (Interpretability) ve Açıklanabilirlik (Explainability)
Interpretability yani yorumlanabilirlik, bir Makine Öğrenmesi Modeli’nin ne kadar kesinlik/doğruluk ile bir sonucu bir sebeble ilişkilendirebildiğidir.
Explainability yani Açıklanabilirlik ise, genellikle Derin Ağlarda gizli olan parametrelerin sonuçları gerekçelendirme kabiliyeti ile ilgilidir.
Bu makalede şu konuları kavrayacağız:
- Yorumlanabilirlik, Açıklanabilirlikten ne kadar farklıdır
- Neden bir modelin Açıklanabilir ve/ya da Yorumlanabilir olması gerekebilir
- Black Box sorununu kim ve nasıl çözer/çözülür.
Yorumlanabilirlik: Bir makine öğrenimi modelinin nedeni ve sonucu belirleme becerisi
Açıklanabilirlik: Bir düğümün ne temsil ettiği ve onun model performansına etkisi/önemi.
Yorumlanabilirlik (Interpretability) Nedir?
Kadınlar erkeklerden daha az mı stresli? Yüksek ses sağırlığı hızlandıır mı? Eğer bir Makine Öğrenimi Modeli bu ilişkiler etrafında bir model oluşturabiliyorsa yorumlanabilirdir.
Daha öncedende bahsedildiği gibi, neden ve sonuç arasında bir ilişki kurma yeteneğidir. Yüksek yorumlanabilirlik her zaman gerekli değildir. Örneğin bir insana X filmi izlediyse Y filmini de seveceğini düşünüp önermek; seçim sonuçlarının açıklanabilirliği kadar önemli değildir. Muhafazakaların oranı fazla ise sağ eğilimli partilerin daha fazla oy alacağı tahmin edilir, işte bu gibi örnekler açıklanabilirliğin yüksek olması gereken durumlardır.
Açıklanabilirlik (Explainability) Nedir?
Bir veri seti düşünelim, Sonucunda diyabet olup olmadığımızı döndüren. Featurelarıda yaş, vücut kitle indexi, ne kadardır sigara içtiği, hayatındaki stres düzeyi… Bir Feature’ın sonucu ne kadar etkiledği-ne kadar önemli olduğu- korelasyonunun ne olduğunu- söylemesidir açıklanabilirlik.
BMI, diyabet olmasıyla %40 ilişkili, yaş %30 ilişkili gibi cümleler açıklanabilirlik örnekleridir. Çünkü birer, sonucu etkileyen featureların oranlarıdır.
ML modellerin en büyük sorunu Black Box olması. Bunun sebebi; boş parametrelere daha önceden ayarlanan değerlerin atılmasını sağlayan ML algoritmalarıdır. Örnek olarakta meşhur BackPropagation Algoritmasının Error Fonksiyonu.
Neden Black Box Model Veri Bilimciler ve Makine Öğrenimi Mühendisleri için Bu Kadar Sıkıntılı?
Sizin bir bankada kredi risk oranını ölçtüğünüzü farzedelim. Bu oranı ölçerken bir kaç adet özelliğe (Feature) ihtiyacınız olacak. Mesela müşterinizin çalıştığı iş, sigorta süresi, zimmetli mal-mülk kaydı, bankadaki para miktarı, kredi kartı borçları…
Peki bu özelliklere yaş eklemek istersek sizce mantıklı olur mu? Ya da ailedeki çocuk sayısı, sigortalı gözüken insan sayısı? Bankanızın ne kadar kredi vermesinin yeterli olacağı, bazen de verilip-verilmeyeceği, hakkında en çok hangi özellik daha etkili (yani korelasyonu fazla) olacak? Belki de bir kaç adet özellik çıkartılabilir, modelinizin daha hızlı eğitilmesi için. Peki neye göre çıkartılacak özellikleri seçeceksiniz? Ben size çıkartmaktan bahsediyorum ama ya çıkartmamanız gerekirse?
Modelin yorumlanabilirliği, bize parametrelerin ne kadar etkili olduğunu gösterirken açıklanabilirlik bize kredi verilecek müşterilerin ihtiyaç kredisi, yatrım kredisi gibi farklı neden-sonuçlara dayalı kredi türleri vermemizi sağlayabilir. Yukarıdaki güzel bir real-world use-case’i. Bunun gibi çokça örnek verilebilir.
Önemli durumlarda karar almamızı sağlayan Makine Öğrenmeleri modelleri elbette Black Box olmamalıdır. Kararımızı verirken nelerin, ne kadar etkilediği, bu kararları verirken sonuçlara nelerin etki ettiği durumları bir firmanın bilmek isteyeceği durumlardır. Bir satın alma operasyonlarının kararlaştırılması, indirim stratejilerinin belirlenmesi bir firmaya yararlı olup olmayacağını modelin tutarlılığı ile doğru sonuçlar döndürtebiliriz. Modelin tutarlılığı içinde bilmemiz gereken iki konu: Açıklanabilirlik ve Yorumlanabilirliktir.
Aklınıza takılan her soru için: