Yapay Zeka’da Hold-out & Cross validation Nedir?

Hold-out

Hold-out, verisetini “eğitim” ve “test” kümesi olarak ikiye ayırma yöntemidir. Eğitim seti, modelin eğitildiği verilerken test seti, modelin eğitilmeyen veriler üzerinde ne kadar iyi performans gösterdiğini görmek için kullanılan verierldir. Hold-out yöntemini kullanırken yaygın olarak, eğitim için verilerin% 80'ini ve test için kalan verilerin% 20'sini kullanmaktadır. Tabi bu oran veri setinin boyutu ile değişmektedir. Eğer çok büyük verisetiniz var ise %20 test yerine %1 bile yeterli olacaktır.

Cross-validation

Cross-validation veya “k-fold cross validation”, veri kümesinin rastgele ‘k’ tane gruba ayrılması işlemidir. Gruplardan biri test seti olarak kullanılırken ve geri kalanlar eğitim seti olarak kullanılır. Her bir grup bu şekilde tekrarlanarak model eğitilir ve diğer grup ile test edilir. Bu şekilde model tüm veriler ile eğitilmişolacaktır ki bu modelin doğruluğu için oldukça gereklidir.

Örneğin, 5-fold cross validation için, veri kümesi 5 gruba ayrılır ve model 5 kez eğitilip test edilecektir, böylece her grup test seti olma şansı elde edecektir.

5-fold cross validation (resim kaynağı)

Hold-out vs. Cross-validation

Cross validation genellikle tercih edilen yöntemdir, çünkü modelinize birden fazla eğitim-test grubu ile eğitim olanağı verir. Bu, modelinizin görünmeyen veriler üzerinde ne kadar iyi performans göstereceğine dair daha iyi bir fikir verir. Öte yandan, hold-out sadece bir eğitim-test bölünmesine bağlıdır. Bu nedenle, modelin başarım oranı, verilerin eğitim ve test kümelerine nasıl ayrıldığına bağlıdır.

Hold-out yöntemi, çok büyük bir veri kümesine sahip olduğunuzda kullanışlıdır, zaman konusunda sıkıntınız var ve modelin ilk sunumu için çok kısa zamanınız var ise hol-out yöntemini tercih etmelisiniz. Cross validation, birden fazla eğitim-test bölmesi kullandığı için, daha fazla hesaplama gücü gerektireeğinden hold-out’a göre daha fazla zaman alır.

Başka bir yazıda bu konu hakkında bşr uygulama yayınlamayı düşünüyorum. o zamana kadar takipte kalın :)