Çalışmalarınızda Kullanmak İçin Veri Seti Bulabileceğiniz 9 Platform

Ali Mert Erdoğan
MIS Profundum
2 min readAug 29, 2022

--

Bu postun amacı hem araştırmalarınızda ve projelerinizde, hem de veri ile ilgili pratiklerinizde işinize yarayabilecek farklı türlerde açık veri setleri sağlayan bazı platformları paylaşmak. Ticari veya gönüllü kuruluşlar tarafından sağlanan bu veri setlerinin bazıları Kaggle ve GitHub gibi platformlarda da erişilebilir durumda. Farklı alanlarda açık veri hizmeti veren platformlar buldukça onları da ekleyerek bu postu güncellemeyi düşünüyorum.

UCI Machine Learning Repository

1987’de Kaliforniya Üniversitesi akademisyenleri ve gönüllü öğrencileri tarafından kurulan bu arşivde araştırmalarda, derslerde ve projelerde kullanılabilecek çok sayıda ve çok çeşitli alanlarda veri bulmak mümkün. Nostalijk görünüme sahip orijinal sayfa hala kullanımda olmasına karşın şöyle yeni bir web sayfasında da hizmet veriyorlar.

BuzzFeed

Amerika Birleşik Devletleri merkezli bir internet medya, haber ve eğlence sitesi olan BuzzFeed haberlerinde kullandığı verileri GitHub üzerinden paylaşıyor. Kullanıcılar veri analizlerine, kütüphanelere ve kılavuzlara açık kaynak olarak ulaşabiliyor. Site fake haberler, veri sızıntıları, müsabaka skorları gibi konular üzerine bazı örnek veri setlerine de erişim imkanı sağlıyor.

ProPublica

Yine Amerika Birleşik Devletleri merkezli ünlü bir haber kaynağı olan ProPublica sağlık, eğitim, çevre, hukuk, ulaştırma, ordu gibi kamusal konularda ücretsiz ve ücretli veri setleri sağlamakta. Bazı veri setleri eski raporlara dayanıyor olsa da güncel ve işe yarar çok sayıda veri setleri de mevcut.

FiveThirtyEight

Seçim tahminleri, hava durumu, ekonomi, spor, havayolu güvenliği gibi alanlarda haberler ve analizler paylaşan veri gazeteciliği sitesi olan FiveThirtyEight’in analizlerinde kullandığı bazı veriler ve yöntemlere erişebilirsiniz. Ayrıca bu veri setleri kuruluş tarafından düzenli olarak güncellenmekte.

The GDELT Project

Dünyanın tüm bölgelerinden, 100 dilde yapılan online ve offline yayınları anlık olarak takip ederek, geçmişten günümüze insanlık tarihinin kaydını tutan bir büyük veri projesi. Bu haliyle yeterince iddialı olsa da GDELT (Global Database of Events, Language, and Tone) aslında bundan daha fazlası, zira proje ile tutulan tüm verilerin yanında bunlardan anlamlı sonuçlar çıkaran analitik araçların tamamı ücretsiz olarak ilgililere sunuluyor.

The Open Data Institute

Telecom Italia işbirliği ile kurulan Birleşik Krallık merkezli bu özel kuruluş hava durumu, hava kirliliği, elektrik kullanımı, telekomünikasyon, sosyal medya gibi farklı alanlarda veri setleri sunuyor. Kuruluş ayrıca açık veri kültürünü yaygınlaştırmak amacıyla da faaliyetlerde bulunuyor.

Earth Data

Earth Data bilimsel araştırmalarınızda da kullanabileceğiniz açık veri setleri sunmakta. NASA kaynakları üzerinden edinilen iklim, okyanuslar, hatta orman yangınları gibi konularda veri setlerine erişebilirsiniz. Sayfada ayrıca tutorial, webinar ve makalelere de yer verilmekte.

Urban Atlas European Environmental Agency

Birleşmiş Milletlerin Spider Bilgi Portalı üzerinden arazi kullanımı üzerine metrikler içeren mekansal veri setine ulaşabilirsiniz. Veriler 100,000’in üzerinde nüfusa sahip kentsel alanları kapsamakta. Veri görselleştirme projelerinizde interaktif haritalar oluşturmak için elverişli bir kaynak niteliği taşıyor.

The U.S. Census Bureau

Amerika Birleşik Devletleri Nüfus Sayım Bürosu nüfustan dış ticarete çok çeşitli veri setlerini erişime açmış durumda. Bu veriler ücretsiz ve veri görselleştirme üzerine pratik yapmaya çok müsait. Site ayrıca sağlanan veriler ile ilgili betimleyici tablo ve grafikleri de içermekte.

--

--