Resampling Data Time Series

Pandas Dataframe

Dadan Dahman W.
Howdy Sysinfo
3 min readFeb 28, 2022

--

Dalam hal analisis data time series, resampling merupakan teknik penting yang memungkinkan kita secara fleksibel menentukan resolusi data yang diinginkan. Kita dapat meningkatkan frekuensi seperti mengubah data hari menjadi bulan, maupun sebaliknya. Pandas time series memiliki 2 fungsi resampling, yaitu downsampling dan upsampling.

Downsampling, Mengurangi baris datetime menjadi frekuensi yang lebih lambat, bisa dibilang juga mengurangi rows dataset menjadi lebih sedikit. Contoh: mengubah kolom datetime yang awalnya daily menjadi monthly.

Upsampling, Kebalikan dari downsampling, menambah baris datetime menjadi frekuensi yang lebih cepat, menambah rows dataset dengan membuat kolom datetime menjadi lebih detail. Contoh: mengubah kolom datetime yang awalnya daily menjadi hourly.

Dari resampling ini, kita dapat menerapkan metode statistik untuk transform value data yang ada seperti mean, sum, count.

Downsampling

Sekarang akan dicoba melakukan proses downsampling pada dataset.

Upsampling

Sekarang akan dicoba melakukan proses upsampling pada dataset.

Resampling by Frequency

Bagaimanakah caranya me-resampling data berdasarkan frekuensi, misalnya sekali 2 minggu, tiap 12 jam?

Berikut data awal kita sebelum di resampling.

Kemudian data tersebut kita downsampling dari daily to 2 monthly, kemudian dihitung rata-ratanya, jika ada nilai NaN maka dapat diisi dengan fillna method = ‘bfill’

Tabel resampling untuk time series.

image by dqlab

Sekian artikel kali ini semoga bermanfaat, terima kasih.

--

--