Veri Bilimine Giriş

Berivan Küçükkart
Yetkin Yayın
Published in
4 min readJun 12, 2022
Photo by Myriam Jessier on Unsplash

Veri Nedir?

Veri Latince’de “gerçek”, “reel” anlamına gelen datum sözcüğünün çoğul halidir. Her ne kadar çıkış noktasında gerçeklik temel alınsa da günümüzde genellikle somut gerçeklik anlamında kullanılmıyor. Kavramsal anlamda ise veri kayıt altına alınmış her türlü ölçüm, gözlem, olay, durum ve fikir anlamına gelir.

Veri Okuryazarlığı

Nasıl ki normal okur-yazarlıkta harfleri ve sesleri analiz edip mantıklı çıkarımlar yaparak anlamlandırıyorsak veri okuryazarlığında da verinin bilgiye oradan da analiz edilip mantıklı kararlar alarak eyleme geçirilmesi söz konusudur. Veriyi, bireye ve topluma faydalı; mantık odaklı ve bunu bilime dayanarak yapan kişiye veri okuryazarı denir diyebiliriz.

Verinin kaynağı göz önünde bulundurularak verinin okunması, yazılması, belirli bir bağlam üzerinde tartışmaya açılması; uygulanması gereken analitik yöntemler ve tekniklerin kestirilebilmesi veri okuryazarlığının temelini oluşturur. Yani ham veriden birey ve toplum için faydalı çıkarımlarda bulunmak veri okuryazarının işidir.

Verinin doğru okunması ve doğru sonuçlara ulaşılması çok önemlidir. Manipüle edilmiş verinin farkına varılması, doğru bilginin istismarına karşı dikkatli olunması veri okuryazarından beklentilerdir.

P21 Yetkinlikleri ve Veri Bilimi Neden Önemli?

ABD’de aralarında American Association of School Librarians, National Education Association, Microsoft, HP, Dell, Apple, Pearson, ETS, İntel, gibi eğitim ve teknoloji ile ilgili şirketlerin de bulunduğu 32 üyeli bir “21 Yüzyıl Yetkinlikleri” ortak çalışma grubu tarafından yapılan bir araştırmaya göre içinde yaşadığımız çağda yetişen bir bireyin başarılı bir kariyer ve yaşam yolu çizebilmek için öğrenmesi ve kendisini geliştirmesi gereken konular, sahip olması gereken bilgi ve deneyimler saptanmıştır.

Bu yeterlilikler Temel dersler ve 21. Yüzyıl Temalar, Öğrenme ve İnovasyon Yetkinlikleri, Medya ve Teknoloji Yetkinlikleri ve Yaşam ve Kariyer Yetkinlikleri olarak ı4 ana başlıkta toplanmıştır.

Bu hususta bizi ilgilendiren kısım Medya ve Teknoloji Yetkinlikleri ana başlığı altında yer alan bilgi okuryazarlığı, medya okuryazarlığı, bilişim ve iletişim teknolojileri okuryazarlığı alt konularıdır. Veri okuryazarlığını bilişim ve iletişim teknolojileri okuryazarlığının bir alt dalı olarak düşünebiliriz.

Veriyi anlamak ve analizini yapmak 21. yüzyılda yaşayan bir bireyin mutlaka sahip olması gereken bir özelliktir. Verinin toplanması, düzeltilmesi, görselleştirmesi ve analiz yoluyla veriden anlam çıkartılması daha sonra çıkarılan bu anlamın bir problemin çözümü için kullanılması veri okuryazarlığında beklenen niteliklerdir.

İstatistik ve Veri Analizi Arasındaki Fark

İstatistik bilimi sayesinde oldukça çeşitli hesaplamalar ve analizler yapmak mümkün. İstatistik ve veri bilimi birbirinden beslenen konulardır. Veri analizinde de temel istatistik bilgisi kullanılır. Peki istatistik ile neyi yapamadık da veri bilimine ihtiyaç duyduk? Bunu bir örnek üzerinden açıklayalım:

Michelangelo Buonarroti, Davud Heykeli

Elimizde yukarıdaki gibi bir büst olduğunu varsayalım. İstatistik bilimi büste dair ölçümleri yani alın genişliği, göz küreleri arasındaki mesafe, burun uzunluğu, çene genişliği gibi ölçümleri kullanarak söz konusu popülasyon içinde hangi yüzdelik kesime ait olduğunu, standart sapma içinde yer alıp almadığını öğrenmemize yardımcı olur. İstatistik “factual” yani gerçeklere dayalı bir bilimdir.

Veri analitiği ile ise büstte yer almayan diğer kısımlar hakkında çıkarımlarda bulunabiliriz. İstatistik bilimi sayesinde elde ettiğimiz veriler ile büstü yapılan şahsın ayak numarası, kilosu, boyu gibi verilere ulaşabiliriz. Veri analitiği, “inferential” yani çıkarımcı bir bilim dalıdır.

Veri Analitiğinde 3 Temel Kavram

Veri analitiğinde Türkçemize Betimleyici veri analizi , Öngörücü veri analizi ve Reçete Yazıcı veri analizi olarak çevrilen 3 temel kavram ve/veya metodolojiden bahsedebiliriz. Bir veri analistinden bu üç analiz türünü de yapabilmesi/anlayabilmesi beklenir. Bunlardan kısaca bahsedecek olursak:

  1. Betimleyici Veri analizi: İngilizcesi Descriptive Data Analysis olan bu analiz türünde yapılan iş daha çok eldeki veriler ışığında yapılan bir durum analizidir. Örneğin, bir şirkette x yılında y farklı lokasyonda z kadar çalışan ile t dolar kar elde edilmiştir.
  2. Öngörücü Veri Analizi: İngilizcesi Predictive Data Analysis olan bu analiz türünde ise betimleyici veri analizini bir adam ileriye götürerek bir tahminde, öngörüde bulunmak beklenir. Örneğin, bir şirkette x yılında y farklı lokasyonda z kadar çalışan ile t dolar kar elde edilmiştir. x1 yılında y ve z değerleri değişmeden t1 dolar kar elde edebileceği öngörülmektedir.
  3. Reçete Yazıcı Veri Analizi: İngilizcesi Prescriptive Data Analizi olan bu analiz türünde Betimleyici ve Öngörücü Analiz türlerinden faydalanarak bir yol haritası veya reçete yazma görevi beklenir. Örneğin, bir şirkette x yılında y farklı lokasyonda z kadar çalışan ile t dolar kar elde edilmiştir. x1 yılında y ve z değerleri değişmeden t1 dolar kar elde edebileceği öngörülmektedir. Ancak lokasyon sayısı y-2'ye düşürülüp z kadar çalışan kalan lokasyonlara dağıtılırsa karlılık oranı %5 arttırılabilir.

Bilgi Piramidi

Bilgi Piramidi

Bilgi Piramidi, tıpkı Maslow’un İhtiyaçlar Hiyerarşisindeki gibi katmanlardan oluşur. En alt katmanda data yani ham ölçümler, ikinci katmanda information yani ham ölçümlerden çıkarılan anlam, üçüncü katmanda knowledge yani bağlam; veriden çıkardığım anlamı nasıl kullanabilirim?, son katmanda ise wisdom yani uygulamaya geçme, karar verme aşaması olarak açıklayabiliriz.

Ne yazık ki Türkçede information ve knowledge için ayrı ayrı kullanılan kelimeler mevcut değil, her ikisine de bilgi diyoruz. Bu piramidi Türkçeye en doğru şekliyle veri, malumat, bilgi ve hikmet olarak çevirebiliriz.

Yaptığımız gözlemler sonucunda elde ettiğimiz ölçümlere veri denir. Bu noktada piramidin en alt katmanındayız. Bu ölçümler sonucu ne, nerede, ne zaman, neden, kim sorularına yanıt verip anlam kazandırdığımızda information yani malumat katmanındayız demektir.

Bu aşamadan sonra elde ettiğim sonuçları ne için, nasıl kullanırım? sorusuna yanıt verdiğimizde ise artık knowledge katmanındayız. Son aşama ise verdiğimiz yanıt ışığında harekete geçme, karar alma ve uygulama yani wisdom katmanıdır.

Veri Bilimine kısa bir giriş yapıp kavramlardan, metodolojiden ve terminolojiden bahsettiğimiz yazımızın sonuna geldik.

Veri Bilimi’ni bir seride ele alacağız. Bunu yaparken BTK Akademi’de yer alan Veri Bilimi ve Makine Öğrenmesi Atölyesi — Bootcamp 2022 eğitiminde aldığım notları kaynak olarak kullanacağım.

Eğitim linki için tıklayınız.

Bir sonraki yazıda görüşmek üzere.

--

--