Penyakit Menular di DKI Jakarta — Analisis Data Eksploratif

Radian Lukman
dataradi
Published in
5 min readJul 30, 2021
Photo by CDC on Unsplash

Dilansir dari alodokter.com, penyakit menular merupakan penyakit infeksi yang disebabkan oleh mikrorganisme, seperti virus, bakteri, parasit, atau jamur, dan dapat berpindah ke orang lain yang sehat. Contoh dari penyakit menular yang umum terjadi antara lain:

  • Infeksi Saluran Pernapasan Akut (ISPA)
  • Diare
  • Tuberkolosis (TBC)
  • Penyakit Kulit
  • Malaria
  • Dan lain-lain.

Penyakit menular dapat ditularkan secara langsung maupun tidak langsung. Pencegahan penyakit menular juga bisa diupayakan melalui kebiasaan hidup sehat. Di antaranya tidak meludah sembarangan, mencuci tangan, tidak memakai peralatan pribadi bersamaan dengan orang lain, serta mengonsumsi makanan sehat dan bergizi untuk meningkatkan daya tahan tubuh terhadap penyakit.

Berdasarkan hasil Sensus Penduduk 2020, penduduk DKI Jakarta pada bulan September 2020 sebanyak 10,56 juta jiwa. Dibandingkan dengan tahun 2010, jumlah penduduk di DKI Jakarta meningkat sekitar 954 ribu jiwa, atau rata-rata sebanyak 88 ribu jiwa setiap tahun. Tingginya peningkatan jumlah penduduk di DKI Jakarta tentunya menimbulkan berbagai permasalahan seperti kemacetan, banjir, polusi udara, dan kesehatan.

Pada kesempatan kali ini, saya akan melakukan analisis data eksploratif mengenai jumlah penderita penyakit menular di DKI Jakarta. Data tersebut diperoleh dari data.jakarta.go.id dan telah saya gabung menjadi satu file berformat csv. Bahasa pemrograman yang dipakai adalah Python.

1. Import packages

Packages yang digunakan adalah pandas, matplotlib, dan seaborn.

2. Import data

Data yang digunakan merupakan data berformat comma seperated value (csv) bernama PenyakitMenularDKI.csv. Data tersebut diimport menggunakan pandas dan dimasukkan ke variabel bernama “data”. Dapat dilihat, data memiliki 216 baris (jumlah pengamatan) dan 4 kolom (jumlah variabel).

Kita dapat melihat nilai unik (unique values) pada kolom “tahun”, “wilayah”, dan “nama_penyakit” dengan:

  • Kolom ‘tahun’ berisikan tahun pengamatan dari 2015 sampai dengan 2020.
  • Kolom ‘wilayah’ berisikan nama kabupaten/kota administrasi yang beranggotakan: Kepulauan Seribu, Jakarta Selatan, Jakarta Timur, Jakarta Pusat, Jakarta Barat, dan Jakarta Utara.
  • Kolom ‘nama_penyakit’ berisikan nama penyakit yang beranggotakan: Malaria, Gastro Entritis, Kolera, Kusta, TBC, dan DBD.

3. Mengubah Jenis Data

Untuk melihat jenis data pada tiap kolom, kita dapat gunakan perintah:

Dapat dilihat kolom ‘tahun’ dan ‘jumlah_penderita’ berkategori integer, kolom wilayah dan nama_penyakit berkategori object. Untuk analisis lebih lanjut, kolom ‘tahun’, ‘wilayah’, dan ‘nama_penyakit’ akan diubah menjadi kategori.

Dengan perintah tersebut, jenis data pada kolom ‘tahun’, ‘wilayah’, dan ‘nama_penyakit’ berhasil diubah menjadi category.

4. Mengecek Missing Value

Jumlah data yang null pada tiap kolom berjumlah 0 yang berarti data sudah bersih dan dapat diolah ke tahap selanjutnya.

5. Line Plot Jumlah Penderita Penyakit Menular Tiap Tahun

Untuk dapat melihat jumlah penderita penyakit menular tiap tahun, kita dapat melakukan grouping pada kolom tahun. Setelah itu nilai pada kolom ‘jumlah_penderita’ akan dijumlahkan tiap grup. Data yang telah digrup tersebut dimasukkan ke dalam variabel “pertahun”. Setelah itu kita membuat plot menggunakan pandas.

Berdasarkan plot tersebut, jumlah penderita penyakit menular di DKI Jakarta meningkat sejak tahun 2015 sampai puncaknya di 2019. Pada tahun 2019, jumlah penderita penyakit menular mencapai 82.363 kasus. Namun, di tahun 2020 jumlah penderita menurun hampir 50% menjadi 42.315 kasus.

Kita juga dapat melihat jumlah penderita penyakit menular berdasarkan nama penyakit tiap tahun dengan membuat pivot table. Perintah untuk melakukannya yaitu:

Plot tersebut memberi informasi bahwa terdapat 3 penyakit yang jumlah kasusnya signifikan yaitu: DBD, Gastro Entritis, dan TBC. Diantara ketiganya, penderita penyakit TBC berjumlah terbanyak disusuli Gastro Entritis dan DBD.

6. Bar Chart Jumlah Penderita Penyakit Menular

Untuk dapat membuat bar chart tentang banyaknya penderita penyakit menular, kita akan membuat fungsi bernama “PlotGrup”. Fungsi tersebut akan menghitung jumlah penderita pada grup dan membuat bar chart menggunakan pandas. Perintah untuk fungsi tersebut adalah:

Fungsi PlotGrup membutuhkan 2 argumen:

  1. grup : Kolom yang akan menjadi dasar pengelompokkan.
  2. judul : Judul plot yang akan dibuat

Selanjutnya, kita akan membuat bar chart jumlah penderita penyakit menular di DKI Jakarta digrup berdasarkan “nama_penyakit”.

Dari output dan bar chart tersebut, kita dapat memverifikasi dugaan kita sebelumnya bahwa memang terdapat 3 penyakit yang jumlah penderitanya signifikan yaitu TBC, Gastro Entritis, dan DBD. Kita dapat melihat jumlah kasus pada masing-masing penyakit di output tersebut.

Kita juga dapat membuat bar chart jumlah penderita penyakit menular di DKI Jakarta digrup berdasarkan wilayah (kabupaten/kota administrasi):

Dari output dan bar chart tersebut, kita dapat mengetahui bahwa Kota Administrasi Jakarta Timur menduduki peringkat pertama dengan jumlah kasus sebanyak 110.252. Kemudian disusul oleh Jakarta Barat (76.418), Jakarta Selatan (64.167), Jakarta Utara (50.019), Jakarta Pusat (46.002), dan Kepulauan Seribu (388).

7. Bar Chart Dengan Multikategori (Grid)

Untuk dapat mengetahui data secara keseluruhan dalam satu plot, kita dapat membuat fungsi bernama “PlotGrid”. Perintah untuk fungsi tersebut adalah:

Fungsi PlotGrid membutuhkan 3 argumen:

  1. x : Kolom kategori yang akan menjadi sumbu-x
  2. kolom : Kolom kategori yang menjadi pemisah bar chart
  3. judul : Judul plot yang akan dibuat

Sebagai contoh, kita akan membuat bar chart jumlah kasus berdasarkan nama penyakit dan bar chart tersebut dipisah sesuai tahun:

Chart tersebut tentunya sangat berguna karena kita dapat mengetahui secara keseluruhan penyakit apa yang jumlah penderitanya tertinggi tiap tahun. Pada tahun 2015 dan 2016, penyakit menular di DKI Jakarta didominasi oleh TBC dan DBD. Jumlah Kasus DBD tertinggi terjadi pada tahun 2016. Pada tahun 2017–2020, penyakit menular di DKI Jakarta didominasi oleh TBC dan Gastro Entritis.

Selanjutnya, kita dapat mencari tahu jumlah kasus berdasarkan nama penyakit pada tiap kabupaten/kota administrasi dengan perintah:

Dari chart tersebut, dapat diketahui kasus TBC tetap menjadi yang tertinggi di tiap kabupaten/kota administrasi. Kasus Gastro Entritis menduduki peringkat ke-2 di tiap kabupaten/kota administrasi.

Terakhir, kita dapat mengetahui jumlah kasus berdasarkan kabupaten/kota administrasi tiap tahun dengan perintah:

Dari chart tersebut, dapat diketahui jumlah penderita penyakit menular di Kota Adminisrasi Jakarta Timur tertinggi tiap tahun. Kemudian disusul oleh Jakarta Barat dan Jakarta Selatan. Kasus di Kepulauan Seribu, Jakarta Pusat, dan Jakarta Utara fluktuatif tiap tahun.

Kesimpulan

  1. Jumlah penderita penyakit menular di DKI Jakarta pada tahun 2015–2019 cenderung meningkat dan mencapai puncaknya pada tahun 2019 sebanyak 82.363 kasus. Jumlah penderita kemudian menurun sekitar 50% pada tahun 2020 dengan kasus sebanyak 42.315.
  2. Sepanjang tahun 2015–2020, TBC (tuberkolosis) merupakan penyakit menular yang berjumlah tertinggi yaitu sebanyak 188.601 kasus. Gastroenteritis menduduki peringkat ke-2 yaitu sebanyak 111.047 kasus dan DBD (demam berdarah dengue) berada pada peringkat ke-3 dengan 44.929 kasus.
  3. Setiap tahun, penyakit menular yang mendominasi di DKI Jakarta adalah TBC dan gastroenteritis. Kedua penyakit tersebut juga tertinggi pada tiap kabupaten/kota administrasi.
  4. Jakarta Timur menjadi kota administrasi dengan jumlah kasus tertinggi baik secara total maupun tiap tahun. Kemudian disusuli Jakarta Barat dan Jakarta Selatan.

Sekian analisis data eksploratif yang bisa saya jelaskan. Saya harap, hasil ini dapat bermanfaat sebagai bahan pengambilan kebijakan atau penelitian lebih lanjut. Jika Anda tertarik akan project ini, Anda bisa akses dataset dan syntax pada GitHub saya.

Terima kasih!

--

--

Radian Lukman
dataradi
Editor for

Data Enthusiast | Bachelor of Statistics from Diponegoro University