Veri Bilimci ve İstatistikçi

A.Oğuzhan Durmaz
Data Runner
Published in
2 min readAug 6, 2019
Photo by Luke Chesser on Unsplash

Merhaba, bu yazımızda Vincent Granville tarafından yazılan yazı ışığında veri bilimci ve istatistikçi konusunu konuşacağız.

Çoğu istatistikçiler veri bilimini veri analiz etmekten ibaret olduğunu düşünüyor ama veri bilimi düşündüğümüzden daha fazlası. Veri bilimi otomatik tahminler sağlayan ve bunları eyleme geçiren, veriyi otomatik işleyen algoritmaları uygulamayı da içerir. Örneğin;

● Otomatik teklif sistemleri

● Bir bölgedeki ya da ülkedeki ev fiyatlarını gerçek zamanlı tahmin etme sistemleri

● High Frequency Trading (Yüksek Hızlı Ticaret)

● Reklamları en üst düzey etki sağlayacak bir kullanıcı ve web sayfasıyla eşleştirme

● Arama motorlarında arananlara alakalı sonuçlar döndürme

● Facebook veya Amazon gibi sitelerde arkadaş veya kitap önerileri

● Vergi sahtekarlığı ve terör tespiti

● Kredi kartı işlemleri puanlaması

● Kanser tedavisi için yeni moleküller simüle etme

● Bir salgının erken teşhisi

● NASA fotoğraflarını analiz ederek yeni gezegenler veya asteroitler bulma

● Hava durumu tahmini

● Otomatik pilot sistemleri (Sürücüsüz Araba)

● Müşteriye özel fiyatlandırma sistemi

Tüm bu verdiğimiz örnekler hem istatistik bilimini hem de Terabytelarca veriyi gerektirir. Bunları yapan çoğu insan kendilerine istatistikçi demiyor. Onlar kendilerine veri bilimci diyor.

Birkaç yüzyıl boyunca istatistikçiler veri toplamakta ve doğrusal regresyon gerçekleştirmekteler. İstatistikçilerin 300 yıl önce, 20 yıl önce yada 2015 yılında bu konuda gerçekleştirdikleri DAD (keşfet/eriş/ayrıştır) ile bugün veri bilimcilerin gerçekleştirdiği DAD arasında çok az ortak nokta var. Buradaki önemli nokta, daha fazla istatistikçi bu yeni becerileri edindikçe ve daha fazla veri bilimci istatistik bilimini öğrendikçe (örnekleme, deneysel tasarım, güven aralığı), veri bilimciler ile istatistikçileri ayıran sınır bulanıklaşacaktır. Doğrusu güçlü istatistik bilgisine sahip veri bilimcilerin olduğu yeni bir veri bilimci kategorisi ortaya çıktığını görebiliyorum. Bunun yanında zaten önemli mühendislik tecrübesine sahip veri bilimci kategorisine sahibiz.

Ayrıca veri bilimcilerini bilgisayar bilimcilerinden ayıran şey, (özellikle hesaplamalı istatistiklerde bazen de deneysel tasarım, örnekleme ve Monte Carlo simülasyonlarında) daha güçlü bir istatistik geçmişine sahip olmaları.

Orjinal Metin

--

--