Mengatasi “Missing Data” dalam Dataset
Missing data dalam dataset tentu akan membuat hasil analisa data menjadi kacau. Berikut adalah contoh missing data dalam dataset:
Simak penjelasan cara mengatasi missing data dalam dataset ini dengan menggunakan Python dan R.
Daftar Isi
- Python / Spyder
- R / RStudio
Python / Spyder
Buka Anaconda Navigator
Buka Spyder
Buka project sebelumnya tentang Data Preprocessing 02
Lanjutkan dengan kode berikut:
Pro Tips: Highlight kata “Imputer” lalu tekan ⌘ + i untuk menampilkan dokumentasinya seperti ini:
Lanjutkan kode diatas hingga menjadi seperti ini:
Eksekusi kode di atas, maka di console akan tampak seperti ini:
Ketik X pada console untuk mengetahui isi dari matrix X setelah missing data-nya di-handle oleh Imputer:
R / RStudio
Buka RStudio
Buka project sebelumnya tentang Data Preprocessing 02
Lanjutkan dengan kode berikut:
Eksekusi kode diatas sehingga dalam console akan muncul result seperti ini:
Lihat objek dataset, perhatikan bahwa sekarang missing data pada kolom Age sudah diganti:
Lakukan hal yang sama terhadap missing data pada kolom Salary
Eksekusi kodenya, lalu perhatikan bahwa sekarang dataset sudah tidak memiliki missing data lagi.