Covid-19 Vaka Sayılarının, Turizmi İlgilendiren Google Trend Verileri İle Karşılaştırılması

Burak Şenol
Deep Learning Türkiye
4 min readJul 18, 2020

Bu çalışmada, global covid-19 kanıtlanmış vaka sayılarındaki artışın, google üzerinde turizm’le alakalı yapılan aramalarda nasıl bir etki yarattığını inceleyeceğiz.

Kullanacağımız veriler;

Çalışmaya ilk önce kullanacağımız kütüphaneleri import ederek başlayalım.

Eğer bu kütüphaneler geliştirme ortamınıza kurulu değilse. Aşağıdaki terminal komutları ile kurabilirsiniz.

pip install pandas

pip install matplotlib

pip install pytrends

Windows üzerinde sanal ortamlar (venv) ve paket kurulumları hakkında daha detaylı bilgi için aşağıdaki videoyu izleyebilirsiniz.

Daha sonra global covid-19 vaka sayılarının bulunduğu .csv uzantılı veri setini okuyalım ve bir değişkene kaydedelim.

Tablo Çıktısı:

time_series_covid19_confirmed.csv

Yukarıdaki tabloda, bizim çalışmamızın ana hatlarını belirleyecek olan birbiri ile ilişkili 2 sütun bulunuyor.

  1. “ObservationDate” sütunu = Bu sütun içerisindeki bilgiler, “Confirmed” kısmında tespit edilen kanıtlanmış vaka sayılarının hangi tarihte olduğunu belirtiyor.
  2. “Confirmed” sütunu = Bu sütun içerisindeki bilgiler, kayıtlı olan tarihte kaç adet kanıtlanmış vaka sayısı olduğunu belirtiyor.

Dikkat edildiği zaman, bu tablodaki verilerin zaman serisi mantığı ile kaydedildiği görülüyor.

Örnek: (Tablodaki Yapı)
01–01–2020 ==> 20 Vaka (A Konumu)
01–01–2020 ==> 17 Vaka (B Konumu)
………………
Örnek: (Bizim İstediğimiz Yapı)
01–01–2020 ==> 37 Vaka (A + B Konumları, o tarih içerisindeki “Toplam Kanıtlanmış Vakalar”)

Yukarıda bahsedilen dönüşümü (Tarihlere göre “Confirmed” ve “Recovered” verilerini gruplandırmak.) gerçekleştirmek için, tablomuz üzerinde bir dizi veri ön işlemesi yapmalıyız.

  • Bu veri ön işleme adımlarından ilki; “ObservationDate” sütunu içerisindeki tarihleri, üzerinde filtreleme yapabileceğimiz gerçek “datetime” referansına dönüştürmek.
  • Daha sonra “datetime” a dönüşen tarih verisi üzerinde, gün(D) kısmını baz alarak, ilişkili oldukları “Confirmed” ve “Recovered” sütunlarında verileri gruplandırırız.
tarihleri baz alarak gruplama yapmak.

Yukarıda bahsedilen ön işlemlerin yapılmasının ardından aşağıdaki tabloyu elde etmiş oluruz.

Tarihlere göre gruplandırılmış “Confirmed” ve “Recovered” verileri.

Evet, çalışmamızın buraya kadar olan kısmında elimizdeki zaman serisi verilerini, tarihsel anlamda gruplandırarak toplam “Confirmed” ve “Recovered” sonuçlarını belirten bir tablo elde etmiş olduk.

Bundan sonra yapacaklarımız;

  1. İstediğimiz belli tarih aralığındaki verileri bu tablodan çekerek bunları bir grafik haline getireceğiz.
Tarih Filtrelemesi
İstediğimiz tarih aralığındaki veriler.

Elde ettiğimiz filtreli sonuçları (22 Ocak ile 22 Haziran arasındaki veriler), matplotlib kullanarak grafik haline getirelim.

22 Haziran ile 22 Ocak arasındaki Covid-19 Vaka Sayısındaki Artış

2. Turizmle alakalı anahtar kelimelerinin, yukarıda belirlediğimiz aynı tarih aralığındaki google trend sonuçlarını çekerek bunlarıda grafik haline getireceğiz.

Turizmle alakalı anahtar kelimeler

  • Travel,
  • Flight,
  • Hotel,
  • Corona (Opsiyonel fakat bu arama trendini incelemekte yararlı olabilir).

Yukarıdaki bu anahtar kelimelerin 22 Ocak ile 22 Haziran aralığındaki trend analizlerine ulaşmak için önce çalışmamızın başında belirttiğimiz Google Trends API’ye erişim sağlamamız gerekmektedir. Bunu “pytrends” kütüphanesi ile sağlıyoruz.

Google Trends API üzerinden veri çekmek ve “pytrends” kütüphanesinin kullanımı için daha detaylı anlatımı aşağıdaki videodan öğrenebilirsiniz.

Evet gelelim, istediğimiz anahtar kelime üzerinden nasıl google trend grafiklerini çekeceğimize. Aşağıdaki kodda istediğimiz anahtar kelimeleri ve tarih aralığını belirledikten sonra API bize sonuçları tablo olarak yansıtıyor.

Belirlediğimiz anahtar kelimelerin, belirtilen tarih aralığındaki google trends verileri.

Şimdi son olarak yukarıda elde ettiğimiz tablodaki bilgilerle, her bir anahtar kelime için ayrı ayrı olmak koşuluyla 4 adet grafik oluşturalım.

Daha önce anahtar kelimeleri bir arada tanımladığımız “keywords” listesini for döngüsüne sokarak, her bir anahtar kelime için grafik çıktısı elde edebiliriz.

22 Ocak ile 22 Haziran Aralığındaki “Covid-19 Vaka Sayıları” ile “Turizmi İlgilendiren Belli Anahtar Kelimelerin Google Trend Verilerinin” Karşılaştırmalı Grafikleri.

“Travel” Trend Analizi
“Flight” Trend Analizi
“Hotel” Trend Analizi
“Corona” Trend Analizi
22 Haziran ile 22 Ocak arasındaki Covid-19 Vaka Sayısındaki Artış

Kaynak kodun tam hali:

--

--