Veri Bilimi Nedir?

Feyzanur Atlıoğlu
Yetkin Yayın
Published in
2 min readMay 5, 2021

Teknolojinin vazgeçilmez alanı olan veri bilimi bugünün gözbebeği konumunda. Teknolojinin gün geçtikçe ilerlemesi ve artık herkese daha hızlı yayılması göz önünde bulundurularak veri sayısının eskiye nazaran çok daha fazla olduğunu biliyoruz. İş hayatında her alanda bulunan multidisipliner bir alan olan veri biliminin bu özellikleri de işin içine girince veri bilimini öğrenmek ve bu alanda ilerlemek isteyenlerin sayısı büyük bir oranda arttığını görüyoruz.

Peki veri bilimi nedir?

Veri bilimi bir veri topluluğundan anlamlı bilgi çıkarma ve verilerden değer elde etmek üzere bilimsel yöntemleri, algoritmaları ve sistemleri kullanan bir bilimdir. Elimizdeki veri kaynaklarından, veri analitiğini kullanarak bilgiler çıkarıp ve bu bilgileri reel sürece çevirdiğimiz bilimdir.

Veri bilimci kimdir?

Genel tanım olarak verilerden anlamlı bilgiler çıkaran, sistemin düzeninden ve kontrolünden sorumlu kişidir.

Veri bilimcisinin kişisel özelliklerine bakılacak olursa;

Meraklı olmalı, araştırma yapmayı sevmeli
Verileri ‘Neden’ ve ‘Nasıl’ soruları ile hikayeleştirebilmeli
Gündemi takip etmeli
Disiplinli ve azimli bir şekilde çalışmalı

Veri bilimine yeni başlayan birisi nasıl öğrenmeli?

İlk adım hangi programları kullanacağına ve hangi seviyelerde bildiğini kişinin analiz etmesi gerekiyor. İstatistik alanında da bağlamları kurabilecek düzeyde olunması gerekiyor. İstatistik, veri biliminin kalbi ise programlama beynidir diyebiliriz.

Yunus Emrah Bulut hocanın da dediği gibi;
Veri Bilimci, bir programcıdan çok istatistik bilen, bir istatistikçiden çok programlama bilen kişiye denir.

Veri bilimi öğrenim sürecinde hangi diller öğrenilmeli?

Öğrenim sırasında kullanılacak en verimli yazılım dillerine bakacak olursak, son 5 yılda çok popüler bir yazılım dili haline gelen Python, veri analizi süreçlerinde en çok kullanılan yazılım dillerinden birisidir. Verilerden anlamlı bir değer önerisi yaratmak amacıyla en çok kullanılan diğer bir dil ise SQL yazılım programıdır. Bunların yanı sıra R algoritmik yazılım dilini de veri analizi alanında en çok kullanılan bir diğer dildir.

Veri bilimine Python alanında yeni başlayanlar için kodluyoruz platformunun Patika.dev isimli alt girişiminde bulunan eğitimlerden Veri Bilimi Patikası isimli 52 saatlik eğitimini öneriyorum.

SQL ve R yazılım programı alanıyla başlamak isteyenler için ise Ozgur Ozluk hocanın önerisiyle Udacity eğitimlerinden SQL for Data Analysis ve Data Analysis with R eğitimlerini öneriyorum.

Veri analizine başlarken bir diğer önemli konu ise topluluklardır. Bilgi paylaşımlarının yapıldığı ve kişinin kendisini çalıştığı alanda geliştirmesi için önemli bir detay olarak görüyorum. Bu alanda ise Python Istanbul ve DataOps Istanbul platformlarını öneriyorum.

--

--