Mendukung pendidikan minim risiko di tengah pandemi lewat analisis data

Ravelto Wangistu
Jabar Digital Service
6 min readFeb 23, 2021
Ilustrasi kegiatan belajar mengajar. Foto: Pemerintah Daerah Provinsi Jawa Barat

Memahami peran data dalam mendukung rekomendasi kebijakan di sektor pendidikan Jawa Barat

Per 26 Januari 2021, kasus Covid-19 di Indonesia telah mencapai satu juta kasus. Di sisi lain, jumlah kasus terkonfirmasi harian juga terus meningkat drastis; selama satu minggu di bulan Januari, ada tiga hari di mana kasus Covid-19 harian di Indonesia memecah rekor. Akibatnya, pemerintah kembali memberlakukan kebijakan pembatasan sosial, kali ini dengan nama Pemberlakuan Pembatasan Kegiatan Masyarakat (PPKM) di Jawa dan Bali. Kebijakan ini berpengaruh terhadap beberapa sektor krusial, termasuk sektor pendidikan.

Berdasarkan data Kementerian Pendidikan dan Kebudayaan (Kemendikbud), Jawa Barat memiliki lebih dari 1 juta anak didik yang bersekolah di 841 sekolah pada level SMA, SMK, dan SLB. Dengan jumlah peserta didik yang sangat besar, data memiliki peran penting dalam menyusun kebijakan pendidikan. Tujuannya adalah untuk mengurangi dampak negatif dari kebijakan yang mungkin kurang tepat, seperti pembukaan sekolah yang mendorong munculnya klaster baru Covid-19, sekaligus meningkatkan efektivitas kegiatan belajar mengajar di sekolah semasa pandemi.

Sebagai unit layanan digital dan data di Jawa Barat, Jabar Digital Service (JDS) memberikan melakukan analisis klastering sekolah untuk memberikan rekomendasi kepada sekolah-sekolah di Jawa Barat berdasarkan zonasi yang ada. Hasil analisis klastering digunakan untuk tiga hal: rekomendasi pembukaan sekolah; kerentanan sekolah terhadap Covid-19; dan peredaran kasus Covid-19 di Jawa Barat.

Metode yang digunakan dalam analisis ini ada dua, yaitu Nearest Neighbor Analysis (NNA) dan K-Means.

Nearest Neighbor Analysis atau NNA merupakan metode untuk melihat distribusi (spread) dari data geografis. NNA bertujuan untuk mengetahui desa-desa mana saja yang bertetangga dengan tiap sekolah. Analisis NNA akan membantu kami melihat seberapa banyak sekolah yang berdekatan pada sebuah desa.

Metode K-Means merupakan metode unsupervised learning yang bertujuan untuk mengelompokkan data dalam kelompok-kelompok berdasarkan lokasi dan kedekatan satu titik dengan titik lainnya. Dalam analisis ini, kami menggunakan analisis K-Means untuk menentukan desa di kecamatan mana yang berada di klaster hijau (zona aman), klaster kuning (zona waspada), dan klaster merah (zona risiko).

Deskripsi data

Dalam analisis ini, terdapat beberapa indikator yang kami gunakan untuk menentukan sekolah mana yang berada pada zona hijau (zona aman), zona kuning (zona waspada), dan zona merah (zona risiko):

  1. Data kasus kumulatif positif Covid-19 pada desa di Jawa Barat,
  2. Data lokasi sekolah dan desa di daerah Jawa Barat, dan
  3. Data jumlah penduduk dan wilayah desa di Jawa Barat.

Data jumlah kasus kumulatif digunakan untuk melihat jumlah kasus Covid-19. Data lokasi sekolah dan desa merupakan data yang berbentuk centroid (titik lokasi) yang bertujuan untuk menentukan lokasi sekolah dan desa sekaligus melihat hubungan lokasi antara keduanya. Sedangkan data jumlah penduduk dan wilayah desa digunakan untuk menghitung kepadatan penduduk.

Ketiga indikator ini menjadi faktor utama dalam menentukan sekolah-sekolah mana yang boleh melakukan kegiatan belajar mengajar secara tatap muka maupun daring.

Implementasi metode

Kami melakukan tiga tahap dalam menganalisis data kerentanan sekolah:

Proses workflow dari analisis kerentanan sekolah.

Di tahap pertama, atau preprocessing, kami melakukan pembersihan data yang dilanjutkan dengan proses merapikan data sehingga dataset siap dianalisis.

Setelah itu, analisis dilakukan dengan metode Nearest Neighbor Analysis (NNA) yang bertujuan untuk melihat hubungan antara lokasi desa dan sekolah yang ada di Jawa Barat. Hasil analisis NNA memasangkan 5957 desa (titik oranye) dan 808 sekolah (titik ungu) di Jawa Barat. Jarak threshold (jarak maksimal satu titik bisa menyambung titik lain) yang digunakan adalah 5 km.

Gambar 3.1. Hasil analisis NNA sekolah

Berdasarkan hasil NNA sekolah, ditemukan bahwa masih banyak desa (terutama di daerah selatan) yang tidak memiliki sekolah dalam jangkauan 5 km. Di sisi lain, terdapat desa (terutama di kota besar) yang memiliki beberapa sekolah dalam jangkauan 5 km. Untuk contoh yang lebih jelas, dapat dilihat pada gambar di bawah ini.

Gambar 3.2 Hasil Analisis NNA Sekolah
Gambar 3.2. Hasil analisis NNA sekolah

Gambar di atas menunjukkan bahwa terdapat satu desa (titik oranye) yang memiliki beberapa sekolah (titik ungu) dalam jangkauan 5 km. Namun, ada pula sekolah yang ‘dimiliki’ oleh beberapa desa sekaligus. Hal tersebut harus menjadi perhatian karena ada kemungkinan seorang anak atau tenaga didik bersekolah di desa yang berbeda dengan tempat tinggalnya.

Menggunakan hasil analisis NNA, kami membuat analisis klastering (clustering) menggunakan metode K-Means. Data kami bagi ke dalam tiga kelompok warna: klaster hijau (zona aman); klaster kuning (zona waspada); dan kluster merah (zona risiko).

Analisis ini bertujuan untuk menentukan kelompok sekolah mana yang memiliki kerentanan tinggi, sedang, dan rendah berdasarkan kasus positif, pendudukan usia sekolah per sekolah, ketidaktersediaan sanitasi, dan coverage internet.

Hasil analisis dibagi kedalam tiga klaster yang digambarkan berdasarkan warna setiap dot dalam scatter plot. Contoh analisis klaster dapat dilihat pada gambar di bawah ini.

Gambar 3.3. Hasil klastering berdasarkan kepadatan penduduk dan jumlah kasus positif.

Hasil analisis klastering menggunakan perbandingan kepadatan penduduk dan jumlah positif menunjukkan bahwa terdapat hubungan linear antara kepadatan penduduk dan jumlah positif. Artinya, semakin tinggi kepadatan penduduk pada suatu desa akan berkorelasi positif dengan jumlah kasus positif.

Di gambar tersebut, juga terlihat bahwa klaster hijau (zona aman) yang berjumlah 613 sekolah didominasi oleh daerah dengan kepadatan penduduk rendah.

Sedangkan klaster kuning (zona waspada) berjumlah 138 sekolah, didominasi di daerah dengan kepadatan penduduk sedang atau memiliki kasus Covid-19 pada level sedang.

Untuk klaster merah (zona risiko) berjumlah 57 sekolah, didominasi di daerah padat yang memiliki kasus Covid-19 dalam jumlah besar.

Insight

Gambar 4.1. Hasil analisis klastering berdasarkan lokasi

Dari 840 sekolah yang dianalisis, 53% sekolah (446 sekolah) berada di zona kuning dan 16.3% sekolah (137 sekolah) berada di zona merah. Hal ini menunjukkan bahwa masih banyak sekolah masuk dalam zona risiko Covid-19.

Di sisi lain, dari data spasial, juga terlihat bahwa zona kuning dan merah didominasi wilayah Bandung Raya dan Bodebek (Bogor, Depok, dan Bekasi). Hasil ini membuktikan bahwa kepadatan penduduk memang memiliki pengaruh kuat terhadap penyebaran Covid-19.

Gambar 4.2. Hasil analisis klastering berdasarkan kabupaten/kota.

Dari grafik 4.2, terlihat bahwa hanya tiga kabupaten/kota yang memiliki zona merah (Kota Bekasi, Kabupaten Bekasi, dan Kota Depok) dan sembilan kabupaten/kota yang memiliki zona kuning. Zona merah didominasi kota-kota yang berdekatan dengan Jakarta, sedangkan zona kuning didominasi kota-kota besar di Jawa Barat.

Gambar 4.3. Hasil analisis klastering sekolah zona kuning dan merah berdasarkan kabupaten/kota.

Dari sisi jumlah sekolah yang terdampak, dapat dilihat bahwa Kabupaten Karawang dan Kabupaten Bogor merupakan kabupaten dengan sekolah yang paling banyak terdampak (40) dengan seluruh sekolah berada di zona kuning.

Di sisi lain, Kota Bandung (42 sekolah) merupakan daerah dengan sekolah yang berada di zona merah terbanyak.

Simpulan

Berdasarkan hasil analisis NNA dan K-Means, dapat disimpulkan bahwa kepadatan penduduk memiliki pengaruh yang signifikan terhadap zona ancaman Covid-19.

Hasil analisis ini juga akan digunakan untuk menentukan apakah kegiatan belajar mengajar dapat dilaksanakan secara tatap muka atau tidak.

Lebih jauh lagi, dapat dilakukan pengembangan analisis seperti penambahan variabel-variabel yang lebih relevan dengan Covid-19 dan pemberian bobot secara proporsional di setiap variabelnya.

Catatan penyunting:

Artikel ini ditulis oleh Ravelto Wangistu dan Christopher Aryo untuk Jabar Digital Service. Keduanya adalah Junior Data Analyst di JDS yang mendukung proses rekomendasi kebijakan di Jawa Barat yang berdasarkan data.

“Analisis Klastering Sekolah menggunakan Metode NNA dan K-Means” merupakan salah satu proyek analisis data dalam rekomendasi kebijakan penanganan Covid-19 dari JDS untuk Dinas Pendidikan Provinsi Jawa Barat.

Artikel disunting untuk keringkasan, koherensi, dan kesesuaian dengan standar Medium JDS.

--

--

Ravelto Wangistu
Jabar Digital Service

A psychology student who interested on data science and visualizations.