ZAMAN SERİLERİ (TIME SERIES): Durağanlık Analizi

gokcesimge
İstanbul Data Science Academy
4 min readMar 15, 2024

Zaman Serisi Nedir?

Zaman serileri, aynı değişkenin farklı zaman noktalarındaki değerlerini içeren bir veri kümesidir. Zaman serisi verileri, belirli bir değişkenin zaman içinde nasıl değiştiğini incelemek ve gelecekteki modelleri tahmin etmek için kullanılabilir.

  • Sıcaklık
  • Hisse senedi fiyatları
  • Hisse senedi hacmi
  • Hava durumu
  • Nüfus sayımı
  • Günlük satışlar
  • Elektrik tüketimi
  • Hastalık vaka sayıları veya diğer çeşitli ölçümler.

Zaman serileri, aynı değişkenin farklı zaman noktalarındaki değerlerini içeren bir veri kümesidir. Zaman serisi verileri, belirli bir değişkenin zaman içinde nasıl değiştiğini incelemek ve gelecekteki modelleri tahmin etmek için kullanılabilir. Her bir gözlem zaman sıralıdır ve genellikle eşit zaman aralıklarına sahiptir (gün, hafta, ay, yıl vb.).

Zaman serileri analizi birçok alanda büyük önem taşır. İşte bazı nedenler:

Zaman Serisi Bileşenleri

Bu seriler, genellikle dört temel bileşene sahiptir:

Trend (Eğilim): Sabit bir aralığın olmadığı ve verilen veri seti içerisinde herhangi bir farklılığın olduğu sürekli bir zaman çizelgesidir. Trend Negatif veya Pozitif veya Boş Trend olabilir. Örneğin, bir hisse senedinin uzun vadeli yükseliş eğilimini gösterir.

Seasonality (Mevsimsellik): Mevsimsellik, Sürekli bir zaman çizelgesinde veri kümesi içinde düzenli veya sabit aralıklı kaymalar. Örneğin, bir otel rezervasyonlarının yaz aylarında artıp kış aylarında azalması. Görsel olarak, düzenli zirve ve dip noktalarıyla temsil edilir.

Cyclic Changes (Dönemsel Değişiklikler): Dönemsel değişiklikler, uzun vadeli dalgalanmaları temsil eder. Sabit bir aralığın olmadığı, hareketin ve şeklinin belirsiz olduğu.. Örneğin, ekonomik döngüler veya uzun vadeli iş döngüleri. Görsel olarak, uzun vadeli düzensiz dalgalanmaları gösterir.

Rastgele Gürültü (Random Noise): Rastgele gürültü, zaman serisinde tahmin edilemeyen ve rasgele dalgalanmaları ifade eder. Kısa bir zaman diliminde beklenmedik durumlar/olaylar/senaryolar ve ani artışlar. Örneğin, günlük hisse senedi fiyatlarının rastgele dalgalanmaları.

Time Series veri türlerini tartışırken iki ana tür vardır, Durağan(stationary) ve Durağan olmayan(non-statiionary). Öncelikle buna karar verilmelidir.

Zaman serilerinin durağan (stationary) olması, bu analizlerin doğru sonuçlar vermesi için önemlidir.

  • İstatistiksel analizlerin geçerliliği: Zaman serileri, gelecekteki olayları tahmin etmek ve geçmiş verilere dayalı kararlar almak için kullanılır. Ancak, zaman serileri durağan değilse, istatistiksel analizlerin geçerliği azalır ve tahminler hatalı olabilir.
  • Modelleme kolaylığı: Durağan bir zaman serisi, istatistiksel modellemeyi kolaylaştırır. Durağan bir seri, belirli istatistiksel özelliklere sahip olduğundan, model parametrelerini sabit tutarak tahmin yapmak daha kolaydır. Durağan olmayan serilerde ise model parametreleri zaman içinde değişebilir, bu da modellemenin karmaşıklığını artırır.
  • İstatistiksel testlerin doğruluğu: Bir zaman serisinin durağanlığı, istatistiksel testlerin sonuçlarını etkileyebilir. Özellikle hipotez testleri ve güven aralığı hesaplamaları için durağanlık önemlidir. Durağan olmayan bir zaman serisi, yanıltıcı sonuçlara yol açabilir.
  • Tahmin doğruluğu: Zaman serilerinin durağan olması, tahminlerin doğruluğunu artırır. Durağanlık, gelecekteki verilerin geçmiş verilere dayalı olarak tahmin edilmesini kolaylaştırır.

Stationary(Durağan):

1. Sabit Ortalama : Zaman serisinin ortalama değeri analiz süresince tamamen sabit olmalıdır. Bu, uzun vadeli bir trendin veya sistematik bir yukarı veya aşağı hareketin olmadığı anlamına gelir.

2.Sabit Varyans : Verilerin varyansı (veya standart sapma) analiz süresince sabit kalmalıdır. Verilerin değişkenliğinde sistematik bir artış veya azalma olmamalıdır.

3. Kovaryans Zamana Bağlı Değil: İki değişken arasındaki ilişkiyi ölçen kovaryans, zamana bağlı olarak değişmemelidir. Durağan bir zaman serisinde, değişkenler arasındaki ilişki değişmez.

Stationary(durağan) zaman serisi verileri genellikle daha kolay modellemek ve tahmin yapmak için kullanılır çünkü istatistiksel özellikleri sabittir. Birçok zaman serisi tahmin modeli stationary varsayımını kabul eder.

Non-Stationary(Durağan olmayan):

Ortalama varyans ya da kovaryanstan biri zamana göre değişiyorsa veri kümesi durağan olmayan olarak adlandırılır.

Durağan olmayan zaman serisi verileri, istatistiksel özellikleri sabit olmadığı için modellemek ve tahmin yapmak daha zor olabilir. Durağan olmayan verileri , durağan hale getirmek için dönüştürme veya fark alma gibi işlemler uygulanabilir.

Durağanlığı Nasıl Test Edebiliriz?

Bir zaman serisinin durağanlığını iki şekilde test edebilirsiniz:

Sezgisel yaklaşım: Görsel değerlendirme

İstatistiksel yaklaşım: Unit Root testi

Durağanlığı kontrol etmek için kullanabileceğiniz çeşitli birim kök testleri vardır. En popüler olanlar:

Augmented Dickey-Fuller test

Kwiatkowski-Phillips-Schmidt-Shin test

Python’da ;

Statsmodels: Statsmodels, zaman serileri modelleme ve analizi için birçok istatistiksel modeli destekler.

Scikit-learn: Scikit-learn, makine öğrenimi modellerini zaman serileri verilerine uygulamak için kullanılabilir. Zaman serileri sınıflandırma ve regresyon problemlerini çözmek için kullanışlıdır.

Augmented Dickey-Fuller testiyle durağanlık nasıl test edilir?

Augmented Dickey-Fuller (ADF) testinin hipotezleri şunlardır :

Null hipotez (H0): Zaman serisi durağan değildir (p değeri > 0,05 ise) Alternatif hipotez (H1): Zaman serisi durağandır (p değeri ≤ 0,05 ise)

ADF testinin sıfır hipotezini reddedebilirsek zaman serisi durağandır.

Kwiatkowski-Phillips-Schmidt-Shin testiyle durağanlık nasıl test edilir?

Kwiatkowski-Phillips-Schmidt-Shin(KPSS) testinin hipotezleri şunlardır :

Null hipotez (H0): zaman serisi durağandır (p değeri > 0,05 ise)

Alternatif hipotez (H1): zaman serisi durağan değildir (p değeri ≤ 0,05 ise)

Bir Zaman Serisi Durağan Olmadığında Ne Yapabilirsiniz?

Durağan olmayan bir zaman serisini durağan hale getirmek için farklı dönüşümler uygulayabilirsiniz:

Differencing

Log transformation

--

--