Veri Madenciliği Analizinde Veri Görselleştirme 1 — Veri Görselleştirmenin Tarihi ve Güncel Uygulamaları

Zeynep Destan
Vakıf Katılım Ar-Ge Merkezi
4 min readSep 19, 2023

Bu yazı serimizde UCI veri tabanından seçtiğimiz veri setine uygun, veri madenciliği analizi için görselleştirme tekniklerini inceleyeceğiz. Bunun için ilk başta veri görselleştirme ile ilgili teorik bilgiler, güncel veri görselleştirme uygulamaları, veri madenciliği analiz yöntemleri ve uygun görselleştirme teknikleri hakkında bilgi verip sonrasında da Python’da bulunan görselleştirme kütüphaneleri ile yapılan çalışmalar ve bu çalışmaların seçtiğimiz veri setini yorumlamada uygunluğu hakkında analiz sonuçlarımızı paylaşacağım.

Veri Madenciliğinde Görselleştirme

Veri analizi sonucu elde edilen çıktılar veri görselleştirme yöntemi ile daha anlaşılır bir şekilde sunulur. Veri görselleştirme grafikler, animasyonlar gibi genellikle 2 boyutlu veya 3 boyutlu çizimlere sahip araçlarla yapılır. Veri görselleştirmenin kullanıldığı ve fayda sağladığı alanlar aşağıda verilmiştir:

1. Veriyi Anlama ve Analizi: Görselleştirmeler sayesinde verilerin karmaşıklığı azaltılır, kalabalık veri kümeleri bir yığın olarak durmak yerine sahip oldukları örüntüyü, ilişkiyi, eğilimleri gösterecek şekilde sunulur. Bu da veriye daha derin bakılmasını, analizlerin daha iyi yapılmasını sağlar.

2. Karar Verme Süreçleri: Analizlerin daha hızlı yapılmasından dolayı karar verme süreci daha kısadır. Veri görselleştirme ile eğilimler işlenen konu hakkında detaylı bilgiye sahip olunmasa bile belirli bir çıkarım yapılmasını sağladığından dolayı yöneticiler ve karar alıcılar daha hızlı ve stratejik karar alabilmektedir.

3. Hızlı İletişim: İnsanlar görsellere yazılı metinlerden daha hızlı tepki vermektedir. Bunun sebeplerinden biri de görsel sunumların veriyi daha basit ve açıklayıcı bir şekilde iletmesidir. İşlenen konu hakkında detaylar bilinmese dahi görsel sunumlar ile belirli çıkarımlar yapılabilir.

4. Trend: Verinin sahip olduğu eğilim ve örüntü görselleştirmelerle daha açıklayıcı olur. Bu sayede trendler, gidişat daha hızlı fark edilir ve tahmin edilebilir olur.

5. Eğitim: Veriyi daha geniş kitleye ulaştırmak ve açıklamak için görselleştirme kullanılır. Açıklamak istenen sonuç görsel sunumlarla desteklenerek daha hızlı iletilir ve karşı taraf tarafından daha kolay anlaşılır.

6. Globallik: Görsel sunumlar dil engelini büyük ölçüde ortadan kaldırır. Daha geniş bir kitleye hitap etmesini sağlar.

7. Etkilemek: Görselleştirmeler şekilleri, renkleri ve sunumları ile analizleri daha ilgi çekici yapabilir. İstenilen mesajı görselleştirme araçları ile daha etkili bir şekilde hedef kitleye sunabilir.

Veri Görselleştirmenin Tarih İçerisinde Gelişimi

Veri görselleştirmenin tarih içindeki serüveni 1786 yılında William Playfair’in infografikleri ile başladı. Playfair karmaşık ekonomik verileri daha açıklayıcı hale getirmek için çizgi ve bar grafiklerinden yararlanarak ilk veri görselleştirmeyi yapmıştır.

19.yüzyılda Florance Nightingale ise Kırım Savaşı sırasında hastane verilerini kullanarak veri görselleştirme ile hemşirelik uygulamalarını iyileştirmiştir. Bu olay sağlık verilerinin görselleştirmenin önemini gösteren ilk örneklerdendir.

20.yüzyılda bilgisayar grafikleri ile görselleştirme dijitalleşti. Bilgisayarlar ile daha fazla ve karmaşık veri üretimi yapılırken aynı zamanda bu verileri interaktif görselleştirmeler ile anlaşılabilir bir şekil alıp sunuldu. Yine bu dönemde Edward Tufte, veri görselleşirme hakkında temel kaynak haline de gelen “The Visual Display of Quantitative Information” adlı kitabını çıkardı. Kitapta etkili grafik tasarımı ve veri görselleştirmenin ilkeleri gibi konuları almıştır.

21.yüzyıla gelindiği ise verinin ve veri biliminin öneminin artması ile elde edilen verilerin kaynağı ve boyu geçmiş yüzyıllara göre fazlasıyla artmıştır. Büyük veri de denilen veri kümelerini görselleştirmek ve içlerinden çok daha karmaşık matematiksel işlemlerle elde edilen analizden yorumlanması için farklı görselleştirme teknikleri geliştirilmiştir. Bunun yanında devamlı artan ve hızlı aksiyon alınması gereken veriler için de eş zamanlı olarak olarak değişen canlı veri görselleştirme teknik ve araçları geliştirilmeye ve kullanılmaya başlanılmıştır.

Örnek Veri Görselleştirme Uygulamaları

Yakın zamanlarda veri görselleştirme tekniklerinde yapılan örnek uygulamalara bakıldığında özellikle yapay zekâ, makine öğrenmesi algoritmaları ve güncellenen veriyi kullanarak geliştirmeler yapıldığı görülmektedir. Bunlara iki örnek AWS QuickSight Q ve Microsoft Power BI’dır.

QuickSight Q

AWS ürünü olan QuickSight bulut temelli, sunucusuz bir BI hizmetidir. Doğal dil işleme yazılımı sayesinde kullanan kişinin gerçek zamanlı güncelleme yapan etkileşimli panolarında incelemeler yaparak veya makine öğrenmesi destekli düzenleri ve aykırı değerleri aratarak veriyi anlamasını sağlar (AWS, 2021).

QuickSight Q ‘da kullanıcılar veriyi önceden hazırlamadan veya hangi görselleştirme tekniğinin daha uygun olduğuna karar vermeye gerek duymadan sorgularına uygun grafikleri görüntüleyebiliyorlar. Bu durum kullanıcı açısından işleri basitleştirdiği için zamandan ve maliyetten tasarruf sağlıyor.

(Barr, 2021)

Microsoft Power BI

Power BI, şirketlerin verilere erişmesine, bunları analiz etmesine ve anlamasına ve dolayısıyla veriye dayalı kararlar almasına olanak tanıyan bir dizi bulut tabanlı araçtır.

Birbirinden bağımsız veri kaynaklarını tutarlı, görsel olarak anlaşılır ve etkileşimli öngörülere dönüştürülmesini sağlamak için birlikte çalışan yazılım hizmetlerinden, uygulamalardan ve bağlayıcılardan oluşan bir koleksiyondur (Microsoft, 2022).

--

--