Veri Bilimi Rolleri ve Araçları

Turhan Can Kargın
Deep Learning Türkiye
3 min readFeb 14, 2021

Herkese merhabalar!! Bu yazımızda veri bilimi alanında farklı roller ve kullanılan araçlar hakkında bilgi edineceksiniz. Hadi başlayalım!!

Veri biliminde tek bir meslek olmadığını öğrenince şaşırabilirsiniz. Genel olarak dört farklı meslek tipi vardır: Veri Mühendisi, Veri Analisti, Veri Bilimcisi ve Makine Öğrenimi Mühendisi.

Öncelikle şunu söylemeliyim ki her bir meslek grubunun veri bilimi iş akışındaki rolleri farklıdır. Bu sebeple aşağıya veri bilimi iş akışını koymak istedim.

Veri Bilimi İş Akışı

Hadi şimdi her bir meslek grubunu inceleyelim.

Veri Mühendisi

Veri mühendisleri veri akışını kontrol eder: özel veri hatları ve depolama sistemleri oluştururlar. Verilerin sadece toplanması değil, elde edilmesi ve işlenmesi de kolay olacak şekilde altyapı tasarlarlar. Veri bilimi iş akışı içinde, ilk aşama olan veri toplama ve depolama kısmına odaklanırlar.

Veri Mühendisi

Veri mühendisleri, verileri depolamak ve düzenlemek için kullandıkları SQL konusunda uzmandır. Verileri işlemek için Java, Scala veya Python gibi aşağıdaki programlama dillerinden birini de kullanırlar. Görevleri otomatikleştirmek ve çalıştırmak için komut satırında Shell kullanırlar. Son olarak, veri mühendislerinin büyük miktarlarda veriyi alıp depolamak için bulut bilişim konusunda daha bilgili olması gerekiyor.

Veri Analisti

Veri analistleri mevcut durumu veriler aracılığıyla açıklar. Bunu, verileri keşfederek ve görselleştirmeler ve gösterge tabloları oluşturarak yaparlar. Bu görevleri yerine getirmek için genellikle önce verileri temizlemeleri gerekir. Analistlerin diğer rollere göre daha az programlama ve istatistik deneyimi vardır. İş akışı içinde, ortadaki iki aşamaya odaklanırlar. Bunlar, veri hazırlama, keşif ve görselleştirmedir.

Veri Analisti

Veri analistleri, verileri sorgulamak için veri mühendisleri tarafından kullanılan aynı dil olan SQL’i kullanır. Veri mühendisleri SQL depolama çözümleri oluşturup yapılandırırken, analistler analizleriyle ilgili verileri almak ve bir araya getirmek için mevcut veri tabanlarını kullanır. Veri analistleri, küçük miktarlardaki veriler üzerinde basit analizler yapmak için elektronik tabloları kullanır. Analistler ayrıca gösterge tabloları oluşturmak ve analizlerini paylaşmak için Tableau, Power BI veya Looker gibi BI Araçlarını kullanır. Daha gelişmiş veri analistleri, verileri temizlemek ve analiz etmek için Python veya R programlamada rahat hissedebilirler.

Veri Bilimcisi

Veri Bilimcileri, istatistik konusunda güçlü bir geçmişe sahiptir ve bu da, yalnızca verileri tanımlamak yerine verilerden yeni içgörüler bulmalarını sağlar. Tahmin için geleneksel makine öğrenimini de kullanırlar. İş akışı içinde, son üç aşama olan veri hazırlama, keşif - görselleştirme ve tahmine odaklanırlar.

Veri Bilimcisi

Analistlere benzer şekilde, veri bilimcilerin SQL konusunda güçlü becerileri vardır. Veri bilimciler en azından Python veya R konusunda yetkin olmalıdırlar. Bu diller içinde pandas veya tidyverse gibi popüler veri bilimi kütüphanelerini kullanırlar. Bu kütüphaneler, yaygın veri bilimi görevleri için yeniden kullanılabilir kod içerir.

Makine Öğrenimi Mühendisi

Makine öğrenimi mühendisleri, veri bilimcilerine benzer, ancak makine öğrenimi uzmanlığına sahiptir. Makine öğrenimi, Veri Biliminin belki de en hareketli kısmıdır; zaten bildiklerimizden doğru olma ihtimali olan şeyleri tahmin etmek için kullanılır. Bu bilim adamları, ister araba içeren görüntüleri sınıflandırmak ister bir sohbet robotu oluşturmak için olsun, daha büyük, kararsız verileri sınıflandırmak için eğitim verilerini kullanıyor. Derin öğrenmeyle geleneksel makine öğreniminin ötesine geçiyorlar. İş akışı içinde, son üç aşamayı güçlü bir tahmine odaklanarak gerçekleştirirler.

Makine Öğrenimi Mühendisi

Makine öğrenimi mühendisleri, tahmin modellerini oluşturmak için Python veya R kullanır. Bu dillerde, güçlü derin öğrenme algoritmalarını çalıştırmak için TensorFlow gibi popüler makine öğrenimi kütüphanelerini kullanırlar.

Bu yazıda veri bilimi alanındaki mesleki rolleri ve kullanılan araçları gördük. Vakit ayırıp okuduğunuz için teşekkür ederim.

Genel Tablo

Kaynaklar:

--

--