Cross Validation(Çapraz Doğrulama)

Makine Öğrenmesinde supervised learning ile sınıflandırma konusunda eğittiğimiz bir sisteminiz olsun, sınıflandırmayı gerçekleştiren istatiksel modelinizin doğruluk oranınını nasıl hesaplarız.

Elinizde bulunan veri kümesini belli bir sayıda eşit parçaya bölüyorsunuz. Genelde bu sayı 10 oluyor. Yukarıdaki resimde bu sayı 5 . Bunun içerisinden 4 tanesi eğitim verisi olurken, 1 tanesi test verisi oluyor.

Her seferinde farklı test kümesi alacak şekilde eğitim ve sınıflandırma işlemini 5 kere gerçekleştiriyoruz. Sonunda her fazda elde ettiğimiz doğruluk değerinin ortalamasını alıyoruz. Sonuç bize sınıflandırma algoritmamızın doğruluk oranını verecektir.