Zaman Serileri Analizi — 1

Merve Günak
Machine Learning Turkiye
5 min readNov 20, 2021
Time Machine
The Time Machine

Zaman Serisi Nedir?

Zaman Serisi verileri kısaca eşit zaman aralıklarında elde edilen ve kronolojik bir zaman sırasında tutulan verilerdir. Zaman serisi verileri hemen hemen her yerdedir, çünkü zaman gözlenebilen her şeyin bir parçasıdır. Ekonomik göstergeler, hava durumu, sensör verileri ve tıklamalar zaman serisi verilerine örnektir.

Yüzyıllar boyunca insanlık geleceği bilmek istedi ve bir zaman sonra bu istek aynı zamanda zorunlu bir hale geldi. Bir gözlemin bugünkü ve geçmiş değerlerine bakarak, gelecekte alacağı değerlerin tespit edilmeye çalışılması geleceği tahminleme işidir. Bunu yapabilmenin en iyi yollarından birisi zaman serisi analizleridir.

Zaman serisi analizinin birden fazla alanda farklı kullanım durumları vardır. Elektrik tüketim tahmini, örüntü tanıma, sinyal işleme, deprem tahmini, aykırı değerlerin yakalandığı anomali tespiti gibi birçok yerde kullanılır.

Aşağıdaki grafik bir zaman serisinin grafiksel gösterimine örnek olması açısından EPİAŞ üzerinden çektiğim ve günlük frekansta oluşturduğum 2017–2021 Türkiye’nin Elektrik Tüketim verilerini temsil etmektedir:

2017–2021 Türkiye Elektrik Tüketimi Grafiği

Zaman Serisi Bileşenleri

Zaman serileri dört bileşene ayrılabilir:

Trend — Verilerin yukarı ya da aşağı yönlü olarak uzun vadede sergiledikleri harekete trend denir.

Mevsimsellik — Bir dönem boyunca tekrar eden belirli bir kalıbı tanımlar. Periyodik olarak tekrar eden bir örüntü sergiler.

Gürültü — Kalıntılar veya düzensizlikler olarak da bilinir. Trend ve mevsimsellik etkisi ortadan kaldırıldıktan sonra geriye kalan şey kalıntılardır. Öngörülemeyen kısa vadeli dalgalanma şeklinde de özetlenebilir.

Konjonktürel Dalgalanmalar — Bir yıldan fazla süren, uzunluğu sabit kalmayan ve genellikle ekonomik koşulların etkisinden dolayı birçok değişkende görülen dalgalanmalardır.

Bu incelemelerin yapılmasındaki esas amaç zaman serisi verilerindeki desenleri ortaya çıkarıp, bir sonraki bölümde göreceğimiz model seçimi aşamasında bu örüntüleri doğru şekilde kavrayabilecek bir model seçimi yaparken bize yol gösterecek olmalarıdır.

Zaman serisi analizi temelde belirli bir değişkenin zamanla nasıl değiştiğini görmek istediğimiz zaman bize ışık tutacak bir yöntemdir.

İki tür zaman serisi modeli vardır:

  • Tek değişkenli zaman serisi: Bir zamana bağlı değişkeni ve tek bir bağımsız değişkeni olan zaman serisi.
  • Çok Değişkenli Zaman Serileri: Bir zamana bağlı değişken ve birden fazla bağımsız değişken içeren zaman serileri.

Dikkat edilmesi gereken noktalardan bir diğeri ise serinin deterministik veya stokastik özelliklerinin incelenmesidir.

Sabit bir kat sayı, mevsimsellik ve trend deterministik özelliklerken, stokastik özellik değişkenin durağanlığı ile ilgilidir.

Hmm… Durağanlık mı…

Durağanlık ve Durağan-Dışılık Nedir?

Bir serinin geçmiş değerlerine bakarak geleceğe yönelik tahminler yapmaktan söz ediyorduk. Bunu doğru bir şekilde yapabilmemiz için elimizdeki serinin “durağan” olmasını bekliyoruz.

Peki tam olarak bir seriye durağan diyebilmemiz için ne olması gerekiyor?

Zaman içinde belirli bir değere doğru yaklaşan yani sabit ortalama, sabit varyans ve sabit otokorelasyon yapısına sahip olan seriler durağan serilerdir. Bu tanımlamalardan herhangi birini sağlamayan bir zaman serisi durağan-dışı olarak tanımlanır.

Zaman serileri genellikle durağan değildir. Bu seriler birinci veya ikinci farkları ya da logaritmaları alınarak durağan hale getirilmektedir.

Zaman serileri çözümlemesinde serilerin durağan olması neden önemlidir?

Çünkü bir seri eğer durağan değilse farklı örüntüler sergiler. Bu durumda serinin davranışı diğer dönemlere genellenemez ve geleceği tahmin etmek için faydalı olmaz. İşte bu yüzden elimizdeki bir zaman serisinin durağan olup olmadığını bilmek isteriz.

Gelin hep beraber bir serinin durağan olup olmadığını nasıl tespit edebileceğimizi görelim.

Durağanlık Sınamaları Nasıl Yapılır ?

Durağanlık sınaması için çeşitli yöntemler vardır. Bunlar arasından en yaygın kullanılan ADF, Phillipps-Perron, KPSS birim kök testlerinden ve Korelogram grafiğinden bahsedeceğim:

1-Birim Kök Testleri

  • Genişletilmiş Dickey-Fuller Testi (ADF) :

Sıfır hipotezi : Zaman serisinin durağan-dışı (birim kök içerir)

Alternatif Hipotez: Zaman serisinin durağan (birim kök içermez)

T-test üzerinden hesaplanan değer ADF Testi için hesaplanmış olan kritik değerlerden küçükse sıfır hipotezi reddedilir ve bu serinin durağan olduğu anlamına gelir. Eğer sıfır hipotezini reddetmekte başarısız olunursa seri birim kök içerir yani durağan-dışı deriz.

  • Phillipps-Perron Testi

Zaman serilerinde bir diğer birim kök sınaması için kullanılan test Phillipps-Perron testidir. ADF’den farklı olarak t-test istatistiğine parametrik olmayan bir düzeltme yapar. Böylelikle otokorelasyonlar ve değişen varyans durumlarında daha düzgün sonuçlar üretir.

  • KPSS

ADF testi gibi, KPSS testi de bir serinin durağanlığını analiz etmek için yaygın olarak kullanılmaktadır. KPSS testi için sıfır ve alternatif hipotez, ADF testinin tersidir.

2- Otokorelasyon (ACF)

ACF grafiği, verilerin zaman grafiğine bakmanın yanı sıra, durağan olmayan zaman serilerini belirlemek için de kullanışlıdır.

ACF durağan olmayan bir zaman serisi için yavaşça düşer. Mesela çok yüksek bir değerden başlayıp sıfıra doğru çok yavaş düşmesi. Durağan bir zaman serisi içinse otokorelasyon fonksiyonu hızla sıfıra yaklaşır.

Aşağıdaki ilk grafik durağan olmayan bir serinin ACF grafiğini göstermekte olup, ikinci grafik aynı serinin birinci farkı alınıp durağan hale getirildikten sonra çizilen ACF grafiğini temsil etmektedir :

Durağan-Dışı Seri — ACF Grafik
1. Farkı Alınan Seri — ACF Grafik

Özetle,

Yukarıdaki durağanlık sınama yöntemlerinden sadece bir tanesinin kullanılmasından ziyade hem grafiksel hem de parametrik yöntemlerin birlikte kullanılması seri hakkında daha doğru çıkarımlar yapılmasını sağlayacaktır.

Özellikle istatistiksel bir alanda çalışma yapıyorsanız, tek bir teste bağlı kalmak bazen sizi büyük bir yanılgıya doğru sürükleyebilir.

Buraya kadar zaman serisi hakkında fazla detaya ve istatistiksel ispatlara girmeden önemli temel kavramlardan bahsettim. Gelecek bölümde Box-Jenkis Modelleri ve Facebook Prophet üzerinde duracağız…

Vakit ayırdığınız için teşekkürler…

Bana her zaman linkedin ve twitter üzerinden ulaşabilirsiniz.

Bilim ve Sanatla Kalın !

--

--

Merve Günak
Machine Learning Turkiye

A data scientist with a strong passion in data engineering, expanding skills in both domains. https://www.linkedin.com/in/merve-gunak