Veri Okuryazarlığı

gokcesimge
İstanbul Data Science Academy
5 min readMar 20, 2024

Nasıl ki bilgisayar ve internet kullanımına alışmak zorunda olduysak bir dönem, artık verilerin her yerde olduğu bir zamanda yaşıyoruz. Değişen dünyaya ayak uydurabilmek için veriyi bilmek, onunla nasıl etkileşim kuracağını bilmek, ne yapıp ne yapamayacağını bilmek önemlidir.

Veri her yerdedir, veriler aracılığıyla dünyayı öğrenebiliriz. Ancak çoğu zaman yüksek düzeyde karmaşıklığa sahip çok sayıda bilgiyle karşı karşıyayız. Bunu nasıl değerli içgörülere dönüştürebiliriz?

Veri okuryazarı olmak, verilerin değer yaratmak için nasıl birleştirilip bağlanabileceğini anladığımız anlamına gelir.

Veri okuryazarlığı, kodlama veya veri analizinin arkasındaki matematiği anlamak gibi teknik becerilerle ilgili değildir. Bunun yerine, veriler ve analizler hakkında eleştirel düşünmeyi ve onlarla nasıl etkileşime girileceğini, bunların alaka düzeyini anlayarak, onu bağlama oturtarak ve hem potansiyelini hem de sınırlarını bilerek nasıl etkileşime geçileceğini öğrenmekle ilgilidir.

Veri okuryazarlığı şu şekilde tanımlanabilir:

Verileri okuma, verilerle çalışma, analiz etme ve içgörüleri verilerle iletme yeteneğidir. Burada üç ana bileşeni ayırt edebiliriz: verileri okumak, verilerle çalışmak ve verileri analiz etmek ve içgörüleri verilerle iletmek.

DIKW Piramidi

Verinin değerini daha iyi anlamak için Data-Information-Knowledge-Wisdom çerçevesini kullanabiliriz.

Ne kadar yükseğe çıkarsak, ham verilerden başlayarak mükemmel bilgeliğe kadar verilerden o kadar fazla değer elde edebiliriz.

DATA : Ham veriler gözlemlerden veya ölçümlerden oluşur. Henüz bir anlamı yok. Organize değildir ve işlenmemiştir.

INFORMATION: Veriyi anlamlı hale getirme, veriye “kim,ne, ne zaman, nerede” gibi sorular sorarız.

KNOWLEDGE: Analiz ve inceleme süreci başlıyor burada bizimi için, istatistiksel ve görsel yaklaşımları kullanarak içgörüler elde ediyoruz.

WISDOM: Bu aşamada da artık uygulamaya başlıyoruz, sonuçları aksiyona çevirdiğimiz aşama.

Veriye Dayalı Karar Verme

Belirli bir sorun hakkında bilinçli bir karar vermek ve buna göre hareket etmek için verileri kullanma sürecidir.

Performansı optimize etmek, daha iyi bir anlayış kazanmak, risklere karşı koruma sağlamak veya en iyi eylem planını belirlemek için kullanılabilir.

Veriye dayalı karar verme sadece büyük kuruluşlar için geçerli değildir, küçükten başlayabilirsiniz.

Bu sadece veri ekibinin sorumluluğunda değildir; aslında farklı geçmişlere sahip kişilerin dahil edilmesi veriye dayalı süreci zenginleştirecektir.

Ne tür veriye dayalı proje üstlenirseniz üstlenin, her veriye dayalı süreci destekleyen bazı adımlar şöyledir;

İlk ve çok önemli adım, sürecin geri kalanına rehberlik edecek bir sorun bildiriminin tanımlanmasıdır.

İkinci adım gerekli verileri toplamaktır.

Üçüncü adım veri analizini gerçekleştirmektir.

Son adım, sonuçların iletilmesi ve tabii ki süreç üzerinde düşünürken yeni edindiğimiz içgörülere göre harekete geçilmesiyle ilgilidir.

Etkili veriye dayalı karar alma, iyi hazırlanmış bir sorun bildirimi ile sağlanır. Problem bildirimi şu soruyu yanıtlar: ‘Çözmek istediğiniz sorun nedir?’ . Hangi verilerin toplanması gerektiği, hangi analiz tekniğinin uygun olduğu, sonuçların nasıl kullanılabileceği konusunda yol gösterici niteliktedir.

Veri Türleri

Verileri düşündüğünüzde muhtemelen şunun gibi bir şey düşünürsünüz: çok sayıda sayı içeren bir tablo. Ya da belki aklınızda bir tür grafik vardır. Bu, en yaygın veri biçimlerinden biri olsa da, hemen akla gelmeyecek başka formatlar da vardır.

Bir analizde tam bir sonuç elde etmek için sıklıkla farklı veri türlerini kullanmak zorunda kalacağız. Veri türü temel olarak verilerin nasıl toplanacağını, verilerin nasıl saklanacağını ve verilerin nasıl analiz edileceğini etkiler. İki temel ayrım yapmamız gerekiyor: Verinin structured(yapılandırılmış) mı yoksa unstructured(yapılandırılmamış )mı olduğu.

Yapılandırılmış veriler, satırlar ve sütunlar halinde düzenlenmiş tablo biçimindeki verilerdir. Katı bir yapıya sahip olduğundan bilgisayar tarafından rahatlıkla okunup kullanılabilir. Genellikle ilişkisel veritabanlarında(relational databases) saklanır.

Yapılandırılmamış verilerin ise önceden tanımlanmış bir yapısı yoktur. Bu nedenle, bu tür verilerin bir analizde kullanılabilmesi için daha fazla ön işleme yapılması gerekmektedir. Yapılandırılmamış veriler genellikle belge veritabanlarında(document databases) depolanır.

Yapılandırılmış veriler en tanınabilir veri türüdür. Verileri düşünürken muhtemelen aklınıza ilk gelen şey budur. Excel gibi tablolar çok karşılaştığımız bir örnektir. Daha sonra hesaplamalar için kullanılabilecek, satırlar ve sütunlar halinde düzgün bir şekilde düzenlenmiş veri sayfalarından oluşur.

Yapılandırılmamış verilerin önceden tanımlanmış bir formatı yoktur ve bu nedenle birçok biçimde olabilir. Yaygın örnekler; resimler, videolar, ses dosyaları ve e-posta, sosyal medya gönderileri veya derecelendirmeler gibi metinlerdir.

Analiz Türleri

Descriptive (Tanımlayıcı) analiz, geçmişte ne olduğunu anlamak için geçmiş verileri analiz etmeyi içerir. Verilerdeki eğilimlere, kalıplara ve ilişkilere dair içgörü sağlamak için verileri özetlemeye ve sunmaya odaklanır. Bu analiz biçimi genellikle karmaşık istatistiksel yöntemleri içermez; bunun yerine veri toplama, özetleme ve görselleştirme gibi basit tekniklere dayanır. Descriptive analitik, verilerin temel düzeyde anlaşılmasını sağlayarak predictive ve prescriptive analitik gibi daha gelişmiş analitik biçimlerinin temelini oluşturur.

Diagnostic(Teşhis edici) analitik, belirli olayların veya eğilimlerin neden oluştuğunu anlamak için verileri daha derinlemesine incelemeyi içerir. Geçmiş sonuçların veya davranışların temel nedenlerini belirleyerek descriptive analitiğin ötesine geçer.

Predictive (tahmine dayalı) analitik, gelecekteki sonuçları veya eğilimleri tahmin etmek için geçmiş verileri, istatistiksel algoritmaları ve makine öğrenimi tekniklerini kullanmayı içerir. Gelecekteki olayları tahmin etmek için kullanılabilecek kalıpları ve ilişkileri belirlemek üzere geçmiş verileri analiz eder. Bu tahminler doğası gereği olasılıksaldır ve işletmelerin potansiyel sonuçları öngörmesine ve daha bilinçli kararlar almasına yardımcı olur.

Prescriptive(öngörüye dayalı) analitik, yalnızca gelecekteki sonuçları tahmin etmekle kalmayıp aynı zamanda bu sonuçları optimize etmek için eylemler önererek tahmine dayalı analitiğin ötesine geçer. Karar verme sürecine rehberlik eden ve kuruluşların hedeflerine daha etkili bir şekilde ulaşmalarına yardımcı olan eyleme dönüştürülebilir bilgiler sağlar.

Örnek,

Descriptive analizler, ölümcül bir salgın var, hastaların hastaneye kabulünde katlanarak bir artış olduğunu gösteriyor.

Diagnostic analitiği , verileri keşfedecek ve korelasyonlar kuracaktır. Örneğin, hastaların tüm semptomlarının (yüksek ateş, kuru öksürük ve yorgunluk) aynı bulaşıcı ajana işaret ettiğini belirlemenize yardımcı olabilir.

Predictive(Tahmine dayalı) analizler, önümüzdeki birkaç hafta veya ay içinde hastaneye kabul edilen hasta sayısında bir artış öngörebilir. Verilerdeki kalıplara göre hastalık hızlı bir şekilde yayılıyor.

Artık hastalığın yayıldığını bildiğinize göre, prescriptive analizler, hasta akınını yeterince tedavi etmek için elinizdeki personel/ilaç malzemesi sayısını artırmanızı önerebilir.

Sonuç olarak,

Veri okuryazarlığı günümüzün hızla dijitalleşen dünyasında önemli bir beceri haline gelmektedir. Bu yazıda, analitik türlerinin çeşitliliği ve veri yapılarının önemi üzerinde durduk. Analitik türleri aracılığıyla verilerinizi anlamak ve geleceği tahmin etmek, veri tabanlı kararlar almanıza yardımcı olabilir. Ayrıca, veri yapılarının doğru bir şekilde oluşturulması ve yönetilmesi, veri okuryazarlığının temelini oluşturur. Veri okuryazarlığının önemi giderek artmaktadır çünkü doğru bilgiye erişmek ve onu etkili bir şekilde kullanmak, bireylerin ve kurumların başarısında kritik bir rol oynamaktadır. Dolayısıyla, veri okuryazarlığını geliştirmek ve analitik yetenekleri artırmak, modern dünyada rekabet avantajı sağlayabilir.

--

--