Resampling Data Time Series
Pandas Dataframe
Dalam hal analisis data time series, resampling merupakan teknik penting yang memungkinkan kita secara fleksibel menentukan resolusi data yang diinginkan. Kita dapat meningkatkan frekuensi seperti mengubah data hari menjadi bulan, maupun sebaliknya. Pandas time series memiliki 2 fungsi resampling, yaitu downsampling dan upsampling.
Downsampling, Mengurangi baris datetime menjadi frekuensi yang lebih lambat, bisa dibilang juga mengurangi rows dataset menjadi lebih sedikit. Contoh: mengubah kolom datetime yang awalnya daily menjadi monthly.
Upsampling, Kebalikan dari downsampling, menambah baris datetime menjadi frekuensi yang lebih cepat, menambah rows dataset dengan membuat kolom datetime menjadi lebih detail. Contoh: mengubah kolom datetime yang awalnya daily menjadi hourly.
Dari resampling ini, kita dapat menerapkan metode statistik untuk transform value data yang ada seperti mean, sum, count.
Downsampling
Sekarang akan dicoba melakukan proses downsampling pada dataset.
Upsampling
Sekarang akan dicoba melakukan proses upsampling pada dataset.
Resampling by Frequency
Bagaimanakah caranya me-resampling data berdasarkan frekuensi, misalnya sekali 2 minggu, tiap 12 jam?
Berikut data awal kita sebelum di resampling.
Kemudian data tersebut kita downsampling dari daily to 2 monthly, kemudian dihitung rata-ratanya, jika ada nilai NaN maka dapat diisi dengan fillna method = ‘bfill’
Tabel resampling untuk time series.
Sekian artikel kali ini semoga bermanfaat, terima kasih.
Referensi :