Mengenal Time Series dan Struktur yang Membentuknya

Oleh:

— Data Science Lecturer at Purwadhika Startup & Coding School

Akhir-akhir ini saya memperbarui materi pelajaran untuk kelas Data Science di Purwadhika Startup & Coding School karena kita perlu mengikuti perkembangan teknologi yang ada. Salah satu materi yang saya perbarui adalah materi mengenai Time Series, yang merupakan salah satu tipe data favorit saya.

Kenapa begitu? Karena kita menghasilkan data Time Series setiap harinya, dan tentu akan sangat keren jika kita mampu memprediksi masa depan kita menggunakan data kita sendiri. Dari segi bisnis, mempelajari Time Series, terutama Time Series Forecasting sangat menguntungkan juga. Karena itu, sering di dalam menganalisis data Time Series; Tujuan dari analisis data ini adalah untuk melakukan prediksi menggunakan data Time Series.

Tetapi, data Time Series juga mampu memberikan penjelasan statistik penting dari suatu data yang diperlukan untuk keputusan bisnis tanpa harus membuat prediksi apapun. Untuk artikel ini, saya tidak akan menulis mengenai cara mempredikisi (forecasting) tetapi saya hanya akan menjelaskan mengenai struktur yang membentuk Time Series.

Time Series

Apa itu data Time Series? Menurut Wikipedia, data Time Series adalah serial dari kumpulan data yang teratur oleh urutan waktu. Frekuensi urutan waktu yang dimiliki oleh Time series data bisa meliputi tahunan, bulanan, jam, atau bahkan mili-detik. Selama data tersebut disimpan dalam urutan waktu, data itu adalah data Time Series.

Dari penjelasan diatas, kita bisa memperkirakan bahwa data Time Series secara dasarnya berbeda dibandingkan data lain yang ada di luar sana. Hal ini berarti cara kita untuk menganalisis data Time Series juga berbeda.

Salah satu teknik yang paling penting untuk mendeskripsikan dan mendapatkan pola data Time Series adalah untuk men-decompose data. Teknik ini akan membagi Time Series data menjadi 4 bagian yaitu:

1. Base atau Level. Nilai dari data jika serial data tersebut merupakan garis lurus.

2. Trend. Kemiringan meningkat atau menurun yang terlihat di Time Series. Di dalam Trend juga terdapat komponen Cyclic yang berbeda dari Trend tetapi sering digabungkan menjadi satu dengan Trend.

3. Seasonality. Pola unik yang terlihat di suatu interval waktu karena faktor musiman. Hal ini bisa karena suatu bulan di setiap tahunnya, suatu hari di setiap bulannya, atau bahkan suatu jam di dalam satu hari.

4. Residual atau Noise atau Error. Variasi dari data yang tidak dapat dijelaskan.

Dibawah adalah contoh dari Time Series dekomposisi dengan menggunakan Python 3 dan modul statsmodels untuk decomposisition.

Time Series Data Dekomposisi

Sebagai catatan, tidak semua data Time Series memiliki seluruh komponen diatas. Time Series akan selalu memiliki Base, rata-rata memiliki Residual, dan Trend dan Seasonality biasanya tidak harus ada.

Komponen diatas dapat digabungkan menjadi model Time Series yang dapat mengungkapkan sifat dari Trend dan/atau Seasonality, yaitu:

  • Additive model. Dimana setiap pengamatan data adalah total dari komponen yang ada. Kita dapat mendeskripsikan hubungan tersebut sebagai

y = base + trend + seasonality + residual

  • Multiplicative model. Dimana setiap pengamatan data adalah perkalian dari komponen yang ada. Kita dapat mendeskripsikan hubungan tersebut sebagai

y = base * trend * seasonality * residual

Untuk mengetahui termasuk dimanakah model data Time Series kita (Additive atau Multipicative), diperlukan Graphical analysis. Time Series data adalah tipe data yang memerlukan gabungan analisis menggunakan gambar; karena itu sewaktu kita memilih model Time Series (untuk analisis ataupun prediksi), kita perlu mem-plot data tersebut untuk mendapatkan pola kasar dari data yang ada.

Perbedaan dari Time Series data yang termasuk dalam Additive dan Multipicative dapat terlihat dari gambar dibawah.

Perbedaan Additive dan Multipicative model

Kita perlu mengetahui pola dari Time Series data kita untuk membantu memilih dan membangun model prediksi kita. Sering kali asumsi dibalik model prediksi di Time Series tergantung kepada pola ini. Kita, tentu saja dapat bekerja tanpa mengetahui pola dari Time Series data kita tetapi model kita tidak akan memberikan hasil yang terbaik.

Cornellius Yudha Wijaya merupakan salah satu pengajar Data Science di Purwadhika Startup & Coding School. Untuk kamu yang ingin mendapatkan pelajaran tentang Data Science secara lengkap dapat mengikuti program Job Connector Data Science. Pendaftaran dan informasi selengkapnya dapat dilihat di sini.

--

--