Makine Öğrenmesinde Sınıflandırma Modellerinin Performansı

Confusion Matrix

Burada Logistic Regression, SVM, Decision Tree, LDA, QDA, Random Forrest vb… supervised learning eğittiğimiz bir sınıflandırıcının/sınıflandırma modelinin performanını ölçmeye çalışıyoruz.

  • Toplam tahminleme = x+y+k+j
  • Modelin toplam 0 tahminlemesi = x + k
  • Modelin toplam 1 tahminlemesi = j + y
  • Gerçek verinin kaç tanesini 0 = x + j
  • Gerçek verinin kaç tanesi 1 = k + y
  • Toplam Doğru Tahminleme = x + y
  • Toplam Yanlış Tahminleme = k + j

Makine Öğrenmesi Sınıflandırma Performans Terminolojisi

  • TP (True Positive): y (gerçekte 1 ve model 1 tahmin etmiş)
  • TN (True Negative): x (gerçekte 0 ve model 0 tahmin etmiş)
  • FP (False Positive) : k (gerçekte 0 ve model 1 tahmin etmiş )
  • FN (False Negative) : j (gerçekte 0 ve model 1 tahmin etmiş )
  • Accuracy — Doğru Tahmin Toplamı / Toplam (x +y) / (x+y+k+j) : Genel olarak sistemimiz sınıflandırma doğruluğu.
  • Sensitivity/Recall — Doğru (1) Tahminlerinin / Toplam Gerçek (1) ( y / (k +y) : 1 leri ne kadar doğru sınıflandırıyor
  • Specificity— Doğru (0) Tahminlerinin / Toplam Gerçek (0) ( x / (x +j) : 0 leri ne kadar doğru sınıflandırıyor
  • Precision/Positive Predictive Value — Doğru (1) Tahminlerinin / Modelin Toplamda (1) tahminlemesi (y/(j+y) : Bu sefer tahminleme tarafından bakıyoruz.
  • Negative Prediction Value — Doğru (0) Tahminlerinin / Modelin Toplamda (0) tahminlenmesi (x/k+x) :Bu sefer tahminleme tarafından bakıyoruz.

Okumaya Devam Et 😃

Bu yazının devamı veya yazı grubundaki diğer yazılara erişmek için bu linke tıklayabilirsiniz.

--

--