Bölüm 1: Haber için veri görselleştirirken nelere dikkat edilmeli?

Sadettin Demirel
Veri Jurnali
Published in
9 min readAug 9, 2019

--

Photo by Isaac Smith on Unsplash

Veri görselleştirme disiplinlerarası bir alan ve popülaritesi veri biliminden iş zekâsı sektörüne gazetecilikten akademiye giderek artıyor. Günümüzde verilerden bilgi elde etme süreçlerinde veri görselleştirme etkili bir şekilde kullanılıyor. Son yıllarda gazeteciliğin niceliksel değişimi ve dönüşümü olarak kabul edebileceğimiz veri gazeteciliği pratiklerinde de veri görselleştirme disiplinini veri haberciliği süreçlerinin önemli bir adımı olarak görmekteyiz. Fakat her zanaat veya pratik gibi veriyi görselleştirmenin de belirli püf noktaları, katı olmasa da temel prensipleri mevcut. Bilinçli veya bilinçsiz olarak bu prensiplerden sapıldığında ortaya çıkan çalışma okuru yanıltabiliyor veya istenilen mesajı karşı tarafa iletmekte başarısız olabiliyor. Bu nedenle bu yazıda veri görselleştirirken nelere dikkat etmemiz gerektiğini püf noktalarına değinerek anlatacağım.

Veri görselleştirme ve görsel algılarımız

Veri görselleştirmeyi soyut (nicel veya nitel olmak üzere) verilerin daha kolay anlaşılması ve yorumlanabilmesi için temel istatistik ve tasarım bilgisinden yararlanılarak belirli grafik formatlarında sunulması olarak tanımlayabiliriz. Literatürde ve endüstride benzer tanımlar bulmak mümkün, çoğaltabilir ve çeşitlendirebiliriz. Veri görselleştirmenin gücünü aşağıdaki görsel yardımıyla rahatlıkla görebiliriz.

Soldaki veri noktalarına teker teker odaklanmak verideki ilişkileri anlamaya çalışmak zaman alacaktır. Fakat aynı veri noktalarını görselleştirdiğimizde verideki ilişkileri ve trendi görmek sadece saniyeler alıyor. Bu işlemin öncekine göre daha kısa sürmesi tesadüf değil.

Veri görselleştirmeyi bu denli önemli hâle getiren ise görsel algılarımız. Veri görselleştirme uzmanı Stephen Few’e göre normalde anlayamayacağımız soyut veri noktalarını beynimiz belirli formlarda sunulursa daha kolay algılıyor ve yorumlayabiliyor. Bu formlar bildiğimiz grafik teknikleri fakat bu grafik tekniklerinin arkasında ise görsel algılarımızdan hareketle hazırlanmış tasarım ilkeleri yatıyor. Görsel algılarımız niteliklerini ortaya koyan yakınlık, benzerlik, simetri, devamlılık, figür & arka plan gibi ilkelere Psikoloji’de Gestalt Prensipleri adı veriliyor. Bu prensipler sadece veri görselleştirmede değil tüm tasarım işlerinde ve sektöründe kullanılıyor.

Gestalt Prensipleri
Gestalt prensiplerinden hareketle grafiklerde kullanılan görsel ögeler — Görsel: Alberto Cairo — Truthful Art & Functional Art

İstatistik bilgisi ile görsel algılarımızdan istifade ederek icra edilen bu disiplin keşifçi ve betimleyici veri görselleştirme olarak farklı alt başlıklara sahip. Keşifçi veri görselleştirme (exploratory data visualization) veri analizi öncesinde veriyi anlamak ve yorumlamak için yapılırken, betimleyici veri görselleştirme (explanatory data visualization) ise analiz sonrası elde edilen çıktıların sunumu ve sergilenmesi için kullanılıyor. Veri gazeteciliği pratiklerinde, iş zekâsı raporlarında betimleyici veri görselleştirme örneklerini görmekteyiz. İstatistik ve tasarım bilgisini daha spesifik parametrelere indirgersek veri görselleştirmede kullanılan grafik tipi, renk & font tercihi ve tabii ki temelinde veri analizi önemli rol oynuyor.

Dikkat edilmesi gereken temel noktalar

Veri görselleştirme disiplininde bilimsel çalışmaların yanı sıra zorunlu olmasa da kabul görmüş belirli kurallar da mevcut. Bazı durumlarda bu kurallar bir tutam yaratıcılık katılarak esnetilebiliyor. Yani normatif katı kurallar silsilesinden ziyade uyulması okur / hedef kitle nezdinde iletişim sürecini kolaylaştırabilecek belirli temel noktalar var. Özellikle veri görselleştirmeye yeni başlayanlar için bu esaslardan sapmamakta fayda var.

1- Bir grafiğin anatomisi

Normal bir grafik, başlık, eksen (yatay ve dikey) isimleri, değişken isimleri, değişkenlerin durumunu gösteren görsel ögeler (çubuk, pasta, çizgi, nokta), lejant, etiket gibi belli başlı unsurlardan oluşuyor. Grafikte yer verilen bu ögeler algılama, yorumlama ve bilgi aktarım sürecini belirli bir bağlama kavuşturuyor. Grafiğe eklenen anlaşılır bir başlık, eksenleri ve grafiği açıklayan ifadeler ve tabii ki verinin yapısına göre tercih edilen renkler, fontlar kullanıcı tarafında çalışmanın de-kod edilmesini kolaylaştıracaktır.

Görsel: Data + Design, Simple Introduction to Preparing Visualization Information

2- Renklerin önemi ve renk seçimi

Beynimiz zıtlıkları, farklılıkları çok sever. Bu yüzden grafikte kullanılan parametreler içinde renkler, sembollerden daha etkilidir. Gazetelerde iki resim arasındaki 7 farkı bulun egzersizlerini bilirsiniz. Aşağıdaki iki çift görselde buna benzer bir deney ile renklerin semboller üzerindeki üstünlüğünü görebiliriz.

  • Hangi görselde yuvarlak kırmızı noktayı daha hızlı buldunuz?
Görsel: Data + Design, Simple Introduction to Preparing Visualization Information
  • Hangi görselde iki katman arasındaki sınırı daha hızlı fark ettiniz?
Görsel: Data + Design, Simple Introduction to Preparing Visualization Information

İlk görselde muhtemelen mavi yuvarlak noktalar içinde yer alan kırmızı noktayı sağdakinden daha hızlı fark ettiniz. İkinci görselde ise iki grup arasındaki sınırı soldakinde daha hızlı fark ettiniz. Bu iki görsel gösteriyor ki algılarımız söz konusu olduğunda renkler sembollere ezici bir üstünlük sağlıyor. Fakat bu üstünlük uygun kullanılmadığında grafiğin başarısını etkileyebilir veya verilen mesajın etkisini azaltabilir. Bu nedenle veri görselleştirme uzmanı Lisa Ross’un tasarlarladığı grafiklerde renk kullanımı üzerine aşağıdaki tavsiyelere uymakta fayda var.

Grafikte kullanılan renklerin kullanımı söz konusu olduğunda kontrast değerinin okuru rahatsız etmemesi çok önemli. Gereksiz renkler cümbüşüne gerek yok. Arka plan ve kullanılan figür veya fontun renklerinin birbiriyle uyumlu olması ve birbirlerini sabote etmemesi önemli.

Görsel: Lisa Rost

Genelde bu tip hatalar az yapılır ama söylemekte fayda var: Sağdaki görselde olduğu gibi yüksek değerlerde baskın — koyu renkler kullanılmalı.

Görsel: Lisa Rost

Renk seçimi söz konusu olduğunda yaşadığımız çevre, kültürümüzden gelen belirli kalıplaşmış renk paletlerini kullanmak okurun grafiği daha kolay deşifre etmesini sağlayacaktır. Örneğin iyi ve kötü ifadelerini sırasıyla kırmızı ve yeşil tonları kullanmak okuru yanıltabilir veyahut kafa karışıklığına neden olabilir.

Görsel: Lisa Rost

Renkleri daha etkili kullanmak için verinin yapısını dikkate almalıyız. Aşağıdaki grafiklerin ilkinde ardışık renkler kullanılmış. Fakat grafikte bir grup kişinin değerlerini görmekteyiz. Yani mevcut veri yıllık aylık işsizlik oranı, büyüme oranı olsaydı değere göre bir rengi koyu ve açık tonlarda kullanabilirdik. Fakat eldeki veri kategorik bir veri olduğu için farklı renkler kullanmalıyız. Bu noktada daha detaylı bilgi almak ve yanılmamak adına ColorBrewer’den yararlanabilirsiniz.

Görsel: Lisa Rost

3- Uzak durulması gereken üç boyutlu grafikler

Bilgisayar teknolojilerinin gelişmesiyle birlikte veri görselleştirmelerde iki boyutlu grafiklerin yanı sıra üç boyutlu grafikler tasarlamak da artık zor değil. Fakat grafik interaktif değilse ve harita gibi ögeler içermediği sürece üç boyutlu grafikler iki boyutlu grafiklere nazaran gereksiz kalıyor. Veri görselleştirme çalışmalarında amaç okura veya hedef kitleye istenilen bilgi veya mesajı sade bir şekilde aktarmak olduğu için üç boyutlu grafikler dekorasyondan başka bir işlev görmüyor. Bazıları için üç boyutlu grafikler belki göze hoş gelebilir ama bilginin verimli bir şekilde aktarımı için işlevsel değil.

Pasta grafiklerde bu durum parçalar arasındaki açıyı da bozduğu için görsel algı için bir nebze daha yanıltıcı olabiliyor. Aşağıdaki grafikte fantazi evrenlerdeki karanlık güçlerin oranlarının gösterildiğini farz edelim. Soldaki üç boyutlu grafiğe göre Hogwarts’ın sahip olduğu oran Orta-Dünya’dan daha fazla algılanabilir ama iki boyutlu grafikte bu değerin aynı olduğunu görmekteyiz. Bir diğer hata yine Atlantis ile TARDIS’i karşılaştırdığımızda ortaya çıkıyor.

Görsel: Data + Design, Simple Introduction to Preparing Visualization Information

Üç boyutlu çubuk (sütun) grafiğe gelirsek görselleştirmedeki verilen bilgi doğru olsa da görsel olarak üç boyutluluğun gereksiz olduğunu söyleyebiliriz. Mevcut veriyi iki boyutlu grafiklerde daha anlaşılır ve göze hoş gelen bir şekilde görselleştirmek mümkün.

Görsel: Data + Design, Simple Introduction to Preparing Visualization Information

4- Veri görselleştirmenin istenmeyen ferdi: Pasta grafikler

Temel veri görselleştirme teknikleri içinde sıklıkla tercih edilen pasta grafikler bazı durumlarda yanıltıcı olabiliyor. Özellikle görselleştirilecek verideki değişkenler 4 veya 5 adetten fazla ve değerler birbirine yakınsa. Örneğin aşağıdaki görselde A, B ve C grafiklerine göz atalım. Muhtemelen pasta grafiklerde 1, 2, 3, 4, 5 değerleri arasında bir fark göremiyor veya bu değerleri özdeş olarak algılıyor olabilirsiniz. Aynı verinin çubuk grafiklerde görselleştirilmiş versiyonlarına baktığımızda değişkenler arası farkları rahatlıkla karşılaştırabiliyor ve farkı görebiliyoruz. Zorunlu olmadıkça pasta grafik yerine çubuk grafikleri tercih etmekte fayda var

Bir diğer önemli nokta ise özellikle verideki değişimleri gösterirken pasta grafik tercih etmemek. Çünkü pasta grafiklerdeki açıyı (angle) baz alarak değerleri karşılaştırma algımız çubuk grafiklerdeki uzunluk (length) veya yükseklik (height) parametresine göre daha düşüktür. Bunu Cleveland ve Mcgill’in yaptıkları çalışmada da görmek mümkün.

Görsel: Data + Design, Simple Introduction to Preparing Visualization Information

5- Grafikteki eksenler

Her grafik en az 1 veya 2 eksenden (x ve y eksenleri) oluşur. Grafikte üçüncü bir eksene gerek yoktur. Eğer yer verilirse dikey iki eksenin aynı ölçüyü belirten ifadelere veya aynı ölçü aralıklarına sahip olmasına dikkat edilmelidir. Örneğin aşağıdaki grafiklerde üç ayrı ögenin fiyatları yer alıyor. Soldaki grafikte ABD’deki fiyatları Dolar ve İngiltere’deki fiyatları Euro üzerinden gösteriyor. Değerler aynı ölçüde görselleştirilmediği için bu grafik hatalıdır. Aynı grafiği dolar bazında tekrar tasarlarsak karşımıza farklı bir görselleştirme çıkıyor.

Görsel: Data + Design, Simple Introduction to Preparing Visualization Information

Aynı şekilde ölçülen değerin yanı sıra sağ ve soldaki dikey eksenlerin değer aralıkları da görselleştirmeyi etkileyecektir. Bu tip grafiklerde verideki bir öge soldaki, diğer öge ise sağdaki eksene oranla görselleştirilir. Aşağıda veri değerleri saat baz alınarak tasarlanmış olsa da saat aralıkları aynı olmadığı için bu grafik hatalıdır. Zaten bu durumda üçüncü bir eksen kullanmaya ihtiyaç yoktur. Gerek duyulmadığı sürece iki eksen (dikey ve yatay) kullanmak bu noktada güvenli bir seçenek olacaktır.

Görsel: Data + Design, Simple Introduction to Preparing Visualization Information

Üçüncü bir eksen dışında bazı grafiklerde dikey ekseni sıfırdan başlatmamak da grafikteki eğilimleri, ilişkileri yanlış yorumlamamıza neden olabilir. Aşağıdaki çubuk ve alan grafiklerde solda yer alanlarda dikey eksen sıfırdan başlatılmamış. Bu durumda çubuk grafikte orta gelir miktarında Hawaii’nin diğer yerel bölgelere göre çok düşük olduğunu, alan grafikte ise hisse senedi fiyatlarının 2016 ve 2017 yılları arasında dalgalı bir trende sahip olduğunu görüyoruz. Fakat sağ taraftaki grafiklerde olduğu gibi eksen sıfırdan başlatılırsa Hawaii’nin diğer bölgelerden çok da düşük olmadığını, hisse senedi fiyatlarının ise daha düzenli seyrettiğini görebiliriz. Kısaca ekseni 0'dan başlamayan grafiklere dikkatli yaklaşmalıyız.

Görsel: Claus Wilke — Fundamentals of Data Visualization

6- Daha estetik grafikler mümkün

Veri görselleştirmede grafik tercihi kadar kullanılan grafiğin estetik bir şekilde tasarlanması da çalışmanın başarısında önemli bir rol oynar. Bu aşamada eğer çalışma interaktif değilse sağdaki grafikte olduğu gibi gereksiz bazı ögeler grafikten çıkarılabilir. İlk grafik de hatalı değil ama ikincisinde çubukların uçlarında yer alan değerler, eksen çizgilerinin kaldırılması, grafiğe anlaşılır bir başlık ve alt başlık eklenmesi okura istenilen bilgiyi daha rahat aktarıyor.

Görsel: Data + Design, Simple Introduction to Preparing Visualization Information

Diğer bir nokta, genelde sütun veya çubuk grafiklerde soldaki görselde olduğu gibi veri noktalarını ifade eden değerler dikey veya hafif eğik olarak ekleniyor. Her ne kadar bu durum grafiğin okunmasını imkânsızlaştırmasa da ekseni dikey hâle getirmek çalışmanın daha kolay okunması ve anlaşılmasını sağlayacaktır.

Görsel: Data + Design, Simple Introduction to Preparing Visualization Information

Grafik tasarımının bir diğer parametresi ise kullandığımız fontlar. Tercih edilen aracın özelliklerine göre değişkenlik gösterse de anlaşılır, kolay okunabilir bir font seçmek, çengelli serif’li fontlar yerine ağdasız yazı tipleri kullanmak çalışmayı daha estetik hâle getirebiliyor. Bu noktada Roboto, Helvetica, Proxima Nova, Lato vb fontları önerebilirim.

Görsel: Data + Design, Simple Introduction to Preparing Visualization Information

Son olarak pek estetik ile ilgisi olmasa da grafiklerde piktogramlar (figürler) kullanırken ayrıca dikkat etmeliyiz. Genelde piktogram kullanılan çalışmalarda sembollerin ölçüsü değiştirilerek hata yapılıyor. Figürlerin ölçüsünü değiştirmek yerine eldeki veriye göre aynı ölçüde ama adet olarak kullanmak daha doğru olacaktır. Örneğin soldaki grafik figürlerin ölçüsü değiştirilerek tasarlanmış ama ölçü baz alınırsa B’nin A’nın üç katından fazla olduğu sonucu çıkabiliyor. Piktogram kullanımında adet üzerinden görselleştirme yapılırsa daha net bir çalışma elde edilebilir.

Görsel: Data + Design, Simple Introduction to Preparing Visualization Information

Bu yazıda özellikle veri gazeteciliği süreçlerinde olmakla beraber tüm veri görselleştirme pratiklerinde dikkat edilmesi gereken noktaları faydalı bulduğum birçok kaynaktan yararlanarak özetlemeye ve derlemeye çalıştım. İlgili kaynakları aşağıya listeledim. Bir sonraki yazıda bu yazıyla ilişkili olarak Türkiye’de ve dünyada üretilen veri görselleştirme çalışmalarını inceleyerek yapılan hataları ve bu çalışmaların nasıl daha iyi hâle getirilebileceğine dair düşüncelerimi paylaşacağım.

Veri görselleştirme süreçlerinde dikkat edilecek noktalar ve kullandığım görseller için yararlandığım kaynaklar:

Bu yazı daha önce telifli olarak https://www.newslabturkey.org’da yayımlanmıştır.

--

--

Sadettin Demirel
Veri Jurnali

Researcher at Uskudar University, Co-founder of @voydorg, #rstats #dataviz, #datajournalism