Visualisasi Data: Jakarta dan Partikulat PM 2.5

Melihat lebih jelas bagaimana konsentrasi partikel kecil berbahaya ini di kota Jakarta Pusat dari tahun ke tahun.

Data with Alvin
11 min readJun 10, 2022
sumber gambar: wikimedia commons

Particullate matter (PM) 2.5 adalah salah satu jenis partikel polusi udara yang seringkali terpapar oleh banyak orang, terlebih bagi mereka yang tinggal di kota besar dengan kepadatan penduduk yang tinggi, di Jakarta misalnya. Partikel ini sangat kecil, hanya berdiameter 2.5 mikron atau kurang bahkan dapat lebih kecil dari itu. Jika dikonversi ke milimeter, 2.5 mikron sama dengan 0.0025 milimeter, atau kurang lebih besarnya hanya berdiameter 3 persen dari sehelai rambut manusia.

sumber gambar

Komponen sebagian besar dari PM 2.5 seperti yang dideskripsikan oleh WHO adalah sulfat, nitrat, amonia, natrium klorida, karbon hitam, debu mineral, dan air. Dengan komponen-komponen ini dan ukurannya yang sangat kecil, PM 2.5 dinilai berbahaya karena dapat lebih merusak kesehatan tubuh dibandingkan dengan PM 10 atau partikel polusi udara lainnya. PM 2.5 dikatakan dapat menembus dinding parung-paru dan masuk ke dalam peredaran darah. Eksposur berlebih secara terus-menerus terhadap manusia, dalam rentang semua umur, dapat menyebabkan berbagai macam penyakit pernapasan hingga bisa memicu kangker paru-paru dan penyakit jantung, yang tentu saja dapat menyebabkan kematian.[1]

Karena itu, didorong rasa ingin tau tentang partikel kecil berbahaya ini, saya mencoba untuk memvisualisasikan bagaimana konsentrasi PM 2.5 di kota Jakarta, lebih tepatnya di Jakarta Pusat.

Persiapan Data

Data monitoring PM 2.5 di Jakarta bisa didapatkan dari bermacam sumber, seperti dari Jakarta Open Data, IQAir, AirNow, dan lain sebagainya. Saya sendiri pada akhirnya memilih AirNow, yang sensor udaranya berada di Kedutaan Besar Amerika Serikat di Jakarta, karena konsistensi dan kelengkapan datanya saya rasa lebih baik daripada beberapa sumber data lain. Selain itu, untuk mendapatkan datanya pun cukup mudah, hanya perlu mengunjungi ke situs berikut dan kemudian memilih jenis data atau periode tahun yang diinginkan.

Dari AirNow, saya mengumpulkan data mulai dari 1 Januari 2016 sampai 1 Juni 2022 untuk kemudian digabungkan menjadi satu dataset, dengan total 55609 baris data.

10 baris pertama dari dataset

Seperti dilihat dari gambar di atas, dataset terdiri dari catatan setiap jam mengenai konsentrasi dari PM 2.5 di Jakarta Pusat, dengan kolom berjumlah 13 dan 1 index dengan datetime format. Deskripsi beberapa kolom yang perlu diperhatikan adalah sebagai berikut:

  • NowCast Conc: weighted average dari 12 jam terakhir data
  • AQI: Air Quality Index (Indeks Kualitas Udara)
  • AQI Category: Kategori berdasarkan AQI
  • Raw Conc: Konsentrasi PM 2.5 setiap jam sebelum diolah menjadi NowCast dan AQI
  • QC Name: Hasil validasi data
nilai janggal pada kolom

Sebelum melakukan pengolahan dataset, saya memerika distribusi datanya terlebih dahulu. Saya mendapati nilai yang janggal dan sangat besar pada kolom Raw Conc, yaitu 985, berulang pada beberapa baris data sementara Q3-nya hanya bernilai 48. Setelah mengamati kembali dan melihat polanya, saya mengasumsikan jika nilai yang sangat besar ini adalah error yang dihasilkan oleh sensor. Mungkin saja karena memang saat itu konsentrasi polutannya sedang tinggi sehingga sensor kesulitan menangkapnya dengan benar, atau memang murni karena sensor yang perlu dikalibrasi ulang saja. Selain itu terdapat juga baris data yang tidak memiliki data sama sekali, hanya berupa tanggal saja, dan dan dianggap sebagai missing data oleh QC. Ada total sekitar 1115 baris data yang memiliki label invalid dan missing, atau sekitar 2% dari total keseluruhan dataset. Data yang invalid sebagian besar didominasi oleh nilai 985. Agar tidak mempengaruhi proses komputasi saya ke depan, saya putuskan untuk membuang baris data yang invalid dan missing ini karena proporsinya yang tidak besar.

Setelah memastikan sudah tidak ada lagi data dengan nilai ekstrim dan invalid, data saya agregasi menjadi rata-rata harian karena saya ingin melihat trend dari hari ke hari sepanjang 2016 ke 2022. Untuk dapat menggagregasi data yang dari setiap jam menjadi setiap hari, saya panduan sebagai berikut:

Untuk mendapatkan konsentrasi rata-rata setiap harinya, saya menjumlahkan setiap record Raw Conc. dalam satu hari kemudain dibagi 24. Metode yang dapat digunakan untuk dapat menyelesaikan bagian ini adalah dengan menggunakan fungsi resample() harian dan kemudian ambil mean-nya.

resample data harian

Terdapat 2344 hari setelah data dilakukan resample dari jam ke hari, mulai dari 1 Januari 2016 sampai 1 Juni 2022. Dari konsentrasi harian di kolom 24H_Conc, saya ingin melihat berapa sih nilai Indeks Kualitas Udaranya? Dan kira-kira kategori kualitas udaranya bagaimana untuk konsentrasi harian ini? Saya menggunakan equation sebagai berikut untuk mendapatkan nilai Indeks Kualitas Udara (AQI):

equation indeks kualitas udara

Equation ini digunakan secara universal untuk mendapatkan nilai dari Indeks Kualitas Udara di seluruh dunia. Nilai dari Indeks Kualitas Udara kemudian diterjemahkan menjadi kategori kualitas udara dengan rentang seperti gambar di bawah.

tabel kategori indeks kualitas udara beserta keterangannya

Setelah mengkalkulasi nilai Indeks Kualitas Udara dari konsentrasi harian PM 2.5 dan melakukan riset sederhana dan cepat untuk membandingkan kategori kualitas udara berdasarkan nilai indeksnya, saya melihat hampir mayoritas negara memiliki rentang standard yang sama. Yang jadi pembeda adalah, limit konsentrasi maksimum PM 2.5 harian (24 jam) setiap negara berbeda. Sebagai contoh, dalam panduan WHO limit konsentrasi maksimum PM 2.5 harian yang diperbolehkan adalah 15 ug/m3. Sedangkan untuk Indonesia, limit konsentrasi maksimum PM 2.5 menurut BMKG adalah 65 ug/m3, cukup jauh dengan standar yang ditentukan oleh WHO. Selain itu, Environmental Protection Agency (EPA) Amerika Serikat menetapkan 35 ug/m3 sebagai limit konsentrasi maksimunya. Untuk dapat melihat bagaimana dampak perbedaan dari limit ini, saya coba membuat visualisasi persebaran konsentrasi harian PM 2.5 dengan tiga limit konsentrasi maksimum dari WHO, EPA, dan BMKG sebagai berikut:

limit konsentrasi harian PM 2.5 WHO, EPA, dan BMKG

Dari visualisasi di atas, kita bisa melihat jika limit yang diberikan oleh WHO terkesan lebih tinggi dibanding dengan limit dari EPA maupun BMKG. Hal ini bukan tanpa alasan, karena dari WHO juga memang memberi kelonggaran bagi setiap negara untuk menyesuaikan limit maksimum konsentrasi PM 2.5, terlebih jika negara tersebut adalah negara yang struggling dengan tingkat polusi udara yang tinggi.[2]

Pada proyek ini saya memutuskan menggunakan limit konsentrasi maksimum dari EPA. Alasannya dua; pertama karena data yang saya akuisisi berasal dari sensor yang dikelola oleh EPA itu sendiri, sensor ini berada di Kedutaan Besar Amerika Serikat di Jakarta. Kedua karena saya melihat dari visualisasi di atas limit yang ditetapkan oleh EPA lebih masuk untuk analisa saya ketimbang limit yang ditetapkan oleh BMKG ataupun limit dari BMKG. Sebagai contoh, pada value yang di bawah limit maksimum EPA masih dipertimbangkan masuk ke kategori kualitas udara Sedang dan Baik. Melewati limit maksimum, sudah masuk ke kategori Tidak Sehat Untuk Kelompok Renta, Tidak Sehat, Sangat TidakSehat, dan Berbahaya.

Oh iya, setelah melakukan agregasi dan mengambil mean harian dari hasil agregasi tersebut, nilai konsentrasi maksimum PM 2.5 saya ubah menjadi Indeks Kualitas Udara dan mengambil kategori yang sesuai dengan rentang nilai indeksnya. Hasilnya adalah seperti visualisasi di atas; hanya ada kategori Baik, Sedang, Tidak Sehat Untuk Kelompok Rentan, dan Tidak Sehat. Untuk kategori Sangat Tidak Sehat dan Berbahaya sendiri tidak ada dalam visualisasi di atas karena setelah melakukan agregasi ternyata tidak ada nilai Indeks Kualitas Udara yang masuk ke dua rentang kategori tersebut. Berikut adalah hasil akhir pengolahan dataset utama sebelum saya masuk ke tahap visualisasi data.

dataset setelah diolah

Deskripsi dari setiap kolom adalah sebagai berikut:

  • 24H_Conc: Mean harian konsentrasi PM 2.5 dalam satuan ug/m3
  • AQI: Nillai Indeks Kualitas Udara yang didapat dengan menggunakan equation yang telah ditentukan
  • Category: Kategori dari nilai Indeks Kualitas Udara
  • exceed_who: Status dari konsentrasi harian PM 2.5 apakah melewati limit maksimum dari standar WHO.
  • exceed_epa: Status dari konsentrasi harian PM 2.5 apakah melewati limit maksimum dari standar EPA.
  • exceed_bmkg: Status dari konsentrasi harian PM 2.5 apakah melewati limit maksimum dari standar BMKG.

Visualisasi Data

A. Heatmap Konsentrasi PM 2.5

Saya memisahkan lebih dulu dataset akhir saya menjadi dua bagian; tahun yang sudah lalu (2016 sampai 2021) dan tahun yang sedang berjalan (2022). Setelah itu saya ingin mengetahui bagaimana konsentrasi PM 2.5 di tahun 2021. Untuk itu saya membuat heatmap sehingga saya mudah lebih mudah untuk memahaminya.

heatmap konsentrasi PM 2.5 tahun 2021

Kotak putih pada gambar merepresentasikan tidak adanya data pada tanggal/hari tersebut. Di bulan Februari sendiri memang hanya sampai tanggal 28 saja. Sementara itu, bulan April, Juni, September, dan November jumlah harinya hanya sampai tanggal 30. Oleh karena, hanya pada di tanggal 28 Oktober, 30–31 Oktober, dan 1–2 November tahun 2021 yang datanya tidak ada. Jika kita perhatikan, pada bulan Januari, Februari, Maret, November, dan Desember mayoritas konsentrasi PM 2.5 lebih rendah dikarenakan kemungkinan pada saat itu Jakarta sudah memasuki musim penghujan. Menurut WHO sendiri cuaca juga bisa menjadi salah faktor tingginya konsentrasi PM 2.5 di udara.[3]

Namun untuk dapat memastikan korelasi dan kausalitas dari tinggi dan rendahnya konsentrasi PM 2.5 di Jakarta Pusat, perlu dilakukan metode stastisikal lebih lanjut dengan tambahan dataset yang mumpuni. Pada proyek ini sendiri tidak mengcover hal tersebut, sehingga kita tidak bisa menarik kesimpulan yang pasti mengapa konsentrasi PM 2.5 dapat rendah dan tinggi pada periode tertentu.

Kita bisa melihat jika pada 18 Maret, 15 Juli, dan 30 Agustus adalah hari dimana konsentrasi PM 2.5 sangat tinggi di Jakarta Pusat dengan masing-masing konsentrasi 68.1 ug/m3, 66.1 ug/m3, dan 69.2 ug/m3.

Bagaimana dengan konsentrasi PM 2.5 dari tahun 2016 sampai tahun 2021? Untuk menjadwab pertanyaan ini, saya membuat visualisasi heatmap dengan mengelompokkan data harian berdasarkan periode bulan dan mengambil median sehingga nilainya lebih robust.

konsentrasi bulanan PM 2.5 di Jakarta Pusat tahun 2016 sampai tahun 2021.

Sepanjang tahun 2020 terlihat konsentrasi PM 2.5 terlihat lebih rendah setiap bulannya dibanding dengan tahun-tahun lainnya. Ada kemungkinan besar hal ini memiliki korelasi karena periode tersebut adalah periode awal pandemi, dimana di Jakarta sendiri ditetapkan PSBB sehingga kegiatan atau pergerakan masyarakat dibatasi yang berarti penggunaan kendaraan ataupun aktivitas industri berkurang drastis. Median dari konsentrasi PM 2.5 selama bulan Juni, Juli, Agustus 2020 masing-masing adalah 47.65 ug/m3, 47.2 ug/m3, dan 43.9 ug/m3, lebih rendah dari periode yang sama pada tahun-tahun sebelumnya, terlebih dibandingkan dengan tahun 2018 dan 2019. Lagi, untuk dapat membuktikan korelasi dan kausalitas dari hipotesis pemberlakuan PSBB dengan turunnya konsentrasi PM 2.5, perlu dilakukan uji statistikal lebih lanjut.

Bagaimana dengan konsentrasi harian PM 2.5 di tahun 2022? Tentu saya buat juga visualisasinya meskipun tahun 2022 masih berjalan. Berikut heatmapnya.

konsentrasi harian PM 2.5 tahun 2022

5 Januari dan 30 Januari menjadi hari dengan konsentrasi PM 2.5 tertinggi, yaitu 64 ug/m3 dan 65.2 ug/m3. Hari atau tanggal yang tidak memiliki data konsentrasi PM 2.5 direpresentasikan dengan kotak putih.

B. Persebaran Konsentrasi PM 2.5 Tahun 2016–2021

Untuk dapat melihat persebaran konsentrasi PM 2.5 sepanjang 1 Januari 2016 sampai 31 Desember 2021, saya membuat sebuah chart interaktif sehingga memudahkan saya untuk melihat distribusi dari kategori kualitas udara dalam rentang waktu tertentu.

persebaran konsentrasi harian PM 2.5

Dengan melihat chart di atas, kita dapat mengetahui jika selama enam tahun terakhir kualitas udara di Jakarta Pusat menurut data yang digunakan mayoritas masuk ke dalam kategori Sedang, disusul kategori Tidak Sehat Untuk Kelompok Rentan, Tidak Sehat, dan Baik. Tentu meskipun menempati peringkat dua, kualitas udara dalam ketegori Tidak Sehat Untuk Kelompok Rentan bisa dibilang mengkhawatirkan, karena berarti 40.7% dari jumlah hari sepanjang 2016 ke 2021 tidak ramah bagi para kelompok rentan yang tinggal dan beraktivitas di Jakarta Pusat.

Mari lihat persebaran konsentrasi PM 2.5 sepanjang satu tahun pertama pandemi, yaitu tahun 2020.

konsentrasi PM 2.5 sepanjang tahun 2020

Jumlah hari dengan kualitas udara Baik kali ini lebih banyak daripada hari dengan kualitas udara Tidak Sehat. Meskipun begitu, hari dengan kualitas udara Tidak Sehat Untuk Kelompok Rentan masih menempati peringkat nomer dua di tahun 2020 walaupun kita sama-sama ingat dua tahun lalu pergerakan masyarakat sangat dibatasi terkait merebaknya pandemi COVID-19.

Bagaimana dengan konsentrasi PM 2.5 di tahun 2022? Apakah membaik? Untuk menjawabnya, saya membuat visualisasi di bawah ini.

konsentrasi PM 2.5 sepanjang tahun 2022 (Januari — Mei)

Tahun 2022 terlihat lebih baik; sejauh ini, kualitas udara di Jakarta Pusat dengan kategori Sedang memiliki jumlah jauh lebih banyak dari kualitas udara dengan kategori Tidak Sehat Untuk Kelompok Rentan. Mayoritas konsentrasi PM 2.5 berada di bawah ambang batas harian yang ditentukan oleh EPA, yaitu 35 ug/m3. Meskipun begitu, kualitas udara yang seharusnya kita kejar adalah kualitas udara dengan kategori Baik. Oleh karena itu, penting bagi kita sebagai masyarakat urban yang tinggal di Jakarta untuk berkontribusi dalam mengurangi konsentrasi partikulat PM 2.5 ini, salah satunya dengan menggunakan kendaraan umum atau angkutan massal jika ingin berpergian, dan tentu saja jika aksesnya memungkinkan. Hal ini semata-mata demi kesehatan tubuh kita sendiri. Semakin banyak kendaraan automobil (motor dan mobil) pribadi berjejal di jalanan ibukota, maka semakin tinggi juga kemungkinan meningkatnya konsentrasi PM 2.5 yang berbahaya bagi tubuh kita itu.

Bagaimana Cara Melindungi Diri Dari PM 2.5?

Setidaknya beberapa cara berikut dapat melindungi diri dari paparan PM 2.5:

  1. Sebelum keluar rumah untuk beraktivitas, cek lebih dulu kualitas udara real time yang ada di sekitar kamu. Salah satu caranya dapat melihat di IQAir, atau dapat menginstall aplikasi serupa di ponsel kamu.
  2. Menggunakan masker saat beraktivitas di luar rumah. Sebagian besar mengatakan jika masker minimum yang digunakan untuk mampu menangkal PM 2.5 adalah masker dengan jenis N95. Namun, dalam beberapa studi, seperti di dalam artikel ini, mengatakan jika masker medis pun efektif untuk menangkal PM 2.5. Tapi pada intinya, menggunakan masker medis ataupun N95 adalah hal wajib apabila status kualitas udara di kota kamu tidak dalam kategori Baik ataupun Sedang.
  3. Jaga tubuh kita tetap sehat dan bugar dengan istirahat dan minum air yang cukup.
  4. Bagi orang yang memiliki asma, konjungtivitis, serta alergi, disarankan agar membawa obat yang dibutuhkan ketika beraktivitas di luar rumah. Kelompok rentan seperti anak-anak, orang lanjut usia, dan wanita hamil, disarankan untuk tidak beraktivitas di luar rumah terlebih saat kualitas udara sedang tidak sehat atau mengindikasikan nilai yang tinggi.
  5. Untuk berkontribusi dalam pengurangan PM 2.5, seperti dijelaskan sebelumnya, dapat dengan menggunakan kendaraan atau angkutan massal untuk transportasi. Kurangi penggunaan kendaraan automobil pribadi seperti sepeda motor ataupun mobil.

Tentu selain hal di atas, peran dari otoritas yang bertanggung jawab juga berperan penting dalam upaya pengurangan partikulat PM 2.5 di seluruh Indonesia. Seperti yang dikutip dalam artikel tirto.id ini, “…pemerintah juga perlu merancang dan menerapkan strategi untuk mengurangi polusi udara dengan mendorong masyarakat menggunakan transportasi umum, memperbesar porsi penggunaan energi baru-terbarukan, serta memperketat regulasi emisi khusus untuk sektor pembangkit.”

Penutup

Proyek visualisasi ini tentu tidak bisa menggenarilisir tentang kondisi kualitas udara dan konsentrasi PM 2.5 yang terjadi di Jakarta Pusat, terlebih di Jakarta, karena tentu keterbatasan dari cakupan alat ukur sendiri. Dinas Lingkungan Hidup Provinsi DKI Jakarta sendiri setidaknya memiliki lima stasiun pengukuran kualitas udara, yaitu di Jakarta Utara, Jakarta Selatan, Jakarta Barat, Jakarta Timur, dan Jakarta Pusat.

Selain itu, dibutuhkan keahlian yang lebih dalam lagi untuk menganalisa bagaimana persebaran dari partikulat PM 2.5 ini. Namun meskipun begitu, pada proyek ini tetap saya memberikan kemampuan terbaik saya untuk menghasilkan informasi yang valid dan juga dapat dipercaya.

Proyek ini dikerjakan dengan menggunakan bahasa pemrograman Python, dengan bantuan dari beberapa libraries seperti Pandas, NumPy, Plotly, dan Altair.

Saya sangat terbuka untuk kritik dan saran sehingga saya mampu mengembangkan metode maupun alur kerja dari proyek-proyek saya kedepan. Jika ada yang ingin disampaikan ataupun ditanyakan, kamu dapat menyapa saya melalui e-mail di alvinnoza.data@gmail.com.

Terima kasih sudah mampir dan membaca blog ini. Jangan lupa, pakai masker dan jaga kesehatan tubuh supaya tetap kuat melawan bahayanya PM 2.5 ini. Sampai jumpa di blog berikutnya!

Alvin

--

--

Data with Alvin

personal journey into data science & machine learning ( ◕▿◕ )