Veri Bilimi Nedir ve Nasıl Öğrenilebilir?

Published in

Datajarlabs

11 min readAug 29, 2018

Veri Bilimi, hiç şüphesiz günümüzün en popüler araştırma ve uygulama alanlarının başında geliyor. Doğası gereği disiplinlerarası bir alan olarak kabul edilmesi gereken Veri Bilimi’ni öğrenmek isteyenlerin sayısı da her geçen gün artıyor. Datajarlabs olarak, verdiğimiz Veri Bilimi eğitimleri sayesinde edindiğimiz tecrübeler ışığında, Veri Bilimi’ni öğrenmek isteyenlere yol göstermesi açısından bir yol haritası oluşturmaya ve takipçilerimizle paylaşmaya karar verdik. Yazının devamında okuyacaklarınız, elbette bizim görüşlerimiz ve evrensel hakikatler olma iddiasında değil. Bununla beraber, Veri Bilimi dünyasına giriş yapmak isteyen ya da bu yolda serüvenini planlı bir şekilde sürdürmek isteyenler için hazırladığımız bu yazı serisinin faydalı olmasını umut ediyoruz. DJL

Not: Yapay zeka hakkında okuma yapmak isterseniz, makinelerin neyi nasıl öğrendiklerini basit bir dille anlatmaya çalıştığım yazıya şuradan, 2019 yapay zeka trendlerinden bahsettiğim yazıya ise şuradan ulaşabilirsiniz.

1. Bölüm: Veri Bilimi Nedir?

Eskilerin bir şeyi tanımlarken kullandıkları bir tabir vardır: Efradını cami, ağyarını mani. Yani bileşenlerini içeren, diğerlerini dışlayan bir tarif. Veri Bilimini tariflerken beni aşan böyle bir işe girişmeyeceğim. Daha çok Veri Bilimi’nin neleri hedeflediğini anlatmaya çalışacak, hangi disiplinlerden yararlandığına değinecek ve bu yolla Veri Bilimi’nin ne olduğu hakkında soyut bir şema çıkarmaya çalışacağım.

Resimde ne görüyorsunuz? Kuşlar mı? Kuşların oluşturduğu kalıp ilginizi çekiyor mu? Ya ağaçlar? Ağaçların oluşturduğu manzara? Eğer cevabınız evetse, emin olun, verilerdeki kalıplar, veri kümelerinin oluşturduğu manzara da ilginizi çekecektir.

Verinin büyük miktarlar ve çeşitlilikte aktığı bir dünyada yaşıyoruz ve herkes verinin çok önemli bir bilgi kaynağı olduğundan bahsediyor. Peki veriden ne gibi bilgilere ulaşmayı amaçlıyoruz?

Basit bir cevap vereyim:

Veriden geçmişe, ana ve geleceğe dair faydalı bilgilere ulaşmak istiyoruz. Yani, ulaşmak istediğimiz bilginin hangi zaman dilimine ait olduğu önemli olduğu kadar, bu bilginin faydalı olup olmadığı da önemli.
Verimize benzer fakat daha önce karşılaşmadığımız gözlemlere denk geldiğimizde, bunları verimiz çerçevesinde anlamlandırabilmek istiyoruz. Yani bildiğimiz kategoriler dahilinde, bilmediğimiz yeni gözlemlerimizi sınıflandırmak istiyoruz.

Yukarıdaki cevap Veri Bilimi açısından amaçları ifade ediyor. Peki, Veri Bilimi bizi bu amaçlara götürürken bunu nasıl yapıyor, yani nelerden yararlanıyor?

İstatistik, bilgisayar bilimleri, alan bilgisi ve sezginin tadında bir bileşiminden yararlanıyor.

O halde, Veri Bilimi ile amaçladığımız işlerden bahsetmeden önce, Veri Bilimi’nin bileşimindeki dört önemli öğeyi biraz daha açmakla işe koyalım.

Veri Bilimi’nin Bileşenleri

i) İstatistik: Modern Veri Bilimi, dünyanın istatistiksel modellenmesi üzerine kurulmuştur desem hata etmiş olmam herhalde. İstatistiksel Öğrenme Teorisi olarak adlandırılan disiplin, çözmek istediğimiz problemleri birer istatistiksel model halinde ifade ederek optimum parametreler üzerinden problemlerin çözümüne ulaşmayı hedefler. Bunu biraz daha anlaşılır kılmak için küçük bir örnek verelim:

Örneğin dolar kurunun nasıl artıp azaldığını anlamak istiyoruz. İstatistiksel Öğrenme Teorisi bunu nasıl yapacağımıza dair bize bazı metodlar sunuyor. Diyelim ki dolar kurunu basit bir lineer regresyon modeliyle modellemeye karar verdik. Kuru etkileyebilecek değişkenlerden faiz ve enflasyonu göz önünde bulundurarak şöyle bir denklem kurduk:

dolar kuru = sabit + parametre1 X FAİZ + parametre2 X ENFLASYON + hata

İstatistiksel Öğrenme Teorisi’ne göre geçmiş verilerden faydalanarak kuru modelleyebilecek sabit, parametre1 ve parametre2 değişkenlerinin optimum değerlerini bulmamız mümkün. Bu değerler, bir şekilde hatayı minimuma indirebilmeli ki optimum kelimesi karşılığını bulabilsin. Bunu nasıl yaptığımıza şu an değinmeyeceğim. Ama bu optimum parametre değerlerini bulduğumuzda, dolar kuruna dair elimizde bir modelimiz olmuş oluyor.

Günümüzde bilgisayarlar ve diğer işlem gücü olan cihazlardaki hızlı gelişimle beraber makineleri doğrudan kodlamak yerine yukarıdaki gibi dolaylı yoldan eğitmek İstatistiksel Öğrenme Teorisi’ni çok önemli bir araç kılıyor. Makine Öğrenmesi dediğimiz alana ise aslında İstatistiksel Öğrenme Teorisi’nin kodlanabilir cihazlar üzerine odaklanmış hali diyebiliriz. Kısa bir tanımını verecek olursak:

Makine Öğrenmesi, bilgisayarların açık ve doğrudan bir şekilde programlanmadan bir görevi yapmayı öğrenmelerini amaçlayan disiplindir.

Makine Öğrenmesi “öğrenme” işini veriye bakarak yapıyor. Yani Makine Öğrenmesi dediğimiz alan veriyi girdi olarak alan ve bir görevi model olarak temsil edebilen algoritmaların bütününden ibaret. Görev dediğim ise bir metni kategorilendirmek, bir fotoğraftaki insanları tanımak, dolar kurunun bir gün sonraki değerini tahmin etmek gibi amaçladığımız işler.

ii) Bilgisayar Bilimleri: Veri Bilimi elbette sadece istatistik biliminden yararlanmıyor. İstatistik kadar önemli bir bileşen de programlama. Yukarıda Makine Öğrenmesi’ni tanımlarken bilgisayarların doğrudan programlanmadan öğrenmelerinden bahsetmiştim. Burada kendimle çelişiyor gibi görünsem de aslında durum farklı. Veri Bilimi programlamayı, programlanmadan öğrenebilen algoritmaların bilgisayarlara tanımlanması için kullanıyor temelde. Elbette programlama dillerinden sadece bu amaç için yararlanmıyoruz. Programlama dillerini kullandığımız amaçları şöylece sıralayabiliriz:

Veri’yi depolardan, veri tabanlarından ya da dosyalardan çekmek.
Veri manipülasyonu, temizlemesi ve üretimi yapmak.
Veriyi görselleştirmek.
Veri üzerinden matematiksel işlemler yaparak, tanımlayıcı istatistikler çıkarmak.
Makine Öğrenmesi metodlarını bilgisayarların anlayacağı kodlara dökmek.
Modellerimizi veri ile eğitmek.
Modellerimizi dış dünyaya hizmet vermek için üretim sistemlerine aktarmak ve modellerimizi üretim ortamında sürekli canlı tutmak.

Yukarıdaki liste programlama dilleriyle yaptıklarımızın sadece birkaçı. Fakat herbirinin günümüz Veri Bilimi açısından ne kadar önem taşıdığı da ortada. Peki ya hangi programlama dili? Python mı R mı? Ya Julia? Java, Scala ve Go? Bunun tartışması burada yapamayacağım kadar uzun. Sadece bir prensipten bahsedip kapatayım konuyu: Programlama dilleri birer araçtır. Tornavidaya ihtiyaç duyduğunuzda İngiliz anahtarı, İngiliz anahtarına ihtiyaç duyduğunuzda pense kullanmazsınız. Aynı şey Veri Bilimi’nde programlama dili seçiminde de geçerli. Fakat, işe yeni başlıyorsanız birisini seçip başlamanız gerekecek. Bu heyecanlı tartışma konusunu şimdilik serinin başka bir yazısına erteleyelim :)

Python mı R mı? Hangisi? Bu konuya burada girmiyorum. Bu ateşli konu serinin sonraki yazılarına kalsın :) Bu arada, Python ismi bildiğimiz piton yılanından gelmiyor, Monty Python’dan geliyor. Resimdeki ve Python’ın logosundaki yılanlar, resmin altına bu notu düşmeye zorladı beni :)

Şu ana kadar istatistik ve programlamanın Veri Bilimi için kritik olduğundan bahsetmiş olduk. Alan bilgisine geçmeden, şakayla karışık bir Veri Bilimci tanımı yapabiliriz:

Veri Bilimci, bir programcıdan çok istatistik bilen, bir istatistikçiden çok programlama bilen kişiye denir.

Diğer taraftan, Veri Bilimi’nin bilgisayar bilimleri içinde yararlandığı tek şey programlama değil. Esasında, dağıtık mimarilerden, büyük veri teknolojilerine kadar bir sürü şey Veri Bilimi’nin kullandığı araç kümesine giriyor. İlgi çekici bir örnek vermek gerekirse, bir zamanlar bilgisayar oyunlarında performans sağlamak amacıyla geliştirilen GPU’lar, Makine Öğrenmesi için olmazsa olmaz bir teknoloji haline gelmiş durumda.

iii) Alan Bilgisi: Veri Bilimi’nin ne olduğu üzerine daha önce bir araştırma yapmışsanız, çoğu açıklamanın istatistik ve programlamadan bahsettiğini fakat alan bilgisinden bahsetmediğini görmüşsünüzdür. Benim alan bilgisi üzerinde ısrarla durmamın birçok sebebi var. Fakat, konuyu uzatmamak adına karikatür nevinden sadece basit bir örnek vereceğim:

Kaynak: U.S. Bureau of Transportation Statistics and Centers for Disease Control & Prevention

Yukarıdaki grafikte iki seri arasındaki korelasyon oranı %93.57! Bir seri ABD’de satılan Japon binek arabalarının sayısını verirken, diğer seri ABD’de motorlu araçlar kullanılarak yapılan intihar sayısını vermekte. Ne düşünüyorsunuz? Sizce ABD’de insanlar Japon arabasına bindikçe intihar etmeyi mi düşünüyorlar?

Bu örnek esasında karikatürize edilmiş bir gerçek hakkında bize ipucu veriyor. Eğer çalıştığınız alana has uzmanlık bilgisine sahip değilseniz, veri tarafından aldatılma riskiniz var. Meseleyi bu kadar uçta ele almamıza da gerek yok aslında. Basit bir mantıkla şöyle düşünebiliriz: Alan bilgisi, bize hangi verinin yararlı olduğu noktasında yön gösterdiği gibi, nedensellik noktasında da yolumuza ışık tutar. Hangi faktörlerin hangi sonuçları doğurabileceği konusundaki uzmanlık, emin olun, her türlü verinin ve metodun ötesinde bir değer ifade ediyor.

Dolayısıyla, Veri Bilimi’ni giriş seviyesinde ele alırken uzmanlıklardan bahsetmiyor fakat temellerden bahsediyorsak, bunun sebebi sadece ve sadece uzmanlığa giden yolun taşlarını döşemekten ibaret.

iv) Sezgi: Veri Bilimi bir bilim midir? Karl Popper’a göre yanlışlanabilir herşey bilimseldir. Eğer Veri Bilimi yanlışlanabilir şeylerden bahsediyor ve sonuçları da yanlışlanabilir şeyler oluyorsa elbette bir bilim kabul edilebilir. Fakat, bazılarından Veri Bilimi’nin aynı zamanda bir sanat olduğunu da duyacaksınız. Neden mi? Kısaca örneklendirelim:

Geldiğimiz noktada Yapay Sinir Ağları ile oluşturulan modeller belli görevlerde tatmin edici çıktılar üretiyor. Fakat ne yazık ki bu sinir ağlarının tam olarak neyi nasıl öğrendiklerini tam olarak açıklayamıyor, sadece ipuçlarını yakalayabiliyoruz. Bu yüzden Yapay Sinir Ağları’nı “kara kutu” modeller olarak anlatan birçok yazı okumuşsunuzdur. Ama aynı zamanda beynimizin nasıl çalıştığını da tam olarak bilemiyoruz değil mi? Yine de insan beyninin çok özel işler çıkardığından kimsenin şüphesi yok.

Yapay Sinir Ağları ile modeller geliştirirseniz göreceksiniz ki orijinal birşeyler çıkarmak; hangi mimarilerin, üzerinde çalıştığınız görevde daha iyi sonuç vereceğini tahmin etmek yer yer bir sezgi işi. Evet, kendiniz ve başkalarının geçmiş tecrübeleri ile büyüttüğünüz sezginiz, bir Veri Bilimci’nin en yardımsever dostlarından birisi. Sezgisiz atıldığınız işler, binbir olasılığın deneme yanılma çabaları içinde zamanın avuçlarınızdan su gibi akıp gittiği işler olacaktır.

Veri Bilimi ile Ne Yapmayı Amaçlıyoruz?

i) Veriyle Geçmişi Anlamlandırmak

Veri Bilimi’nin amaçladığı şeylerden bahsederken, veriden geçmişe dair faydalı bilgilere ulaşmak istiyoruz demiştim. Bunu biraz açalım ve veriden geçmişe dair faydalı bilgilere nasıl ulaşabileceğimize bir göz atalım:

Örneğin şirketinizde size geçmiş satışların adet bazında verisi verildi ve kur hareketlerinin satışları nasıl etkilediğine dair bir çalışma yapmanız istendi. İzleyeceğiniz yolu kabaca şöyle sıralayalım:

Satış verisini inceleyecek ve veride tespit ettiğiniz problemleri gidermeye çalışacaksınız.
Analizinizde faydalı olduğunu düşündüğünüz verileri toparlayacaksınız. Örneğin, kur satış hacmi üzerinde etki ederken bunu birkaç kanalla yapar: i) insanların alım gücünü etkilediğinden satışlarınızı etkiler ii) ürünlerinizin fiyatlarını ithal girdiler sebebiyle etkilediğinden ürünlerinize olan talebi etkiler iii) faizleri etkilediğinden kredi kullanımını etkiler ve dolayısıyla ürünlerinize olan talebi etkiler vs. Özetle, yukarıdaki etki kanallarını analizlerinizde kontrol edebilmek için Gayri Safi Milli Hasıla, tüketici kredisi faizi ve ürünlerinizin kur geçişkenliği gibi değişkenleri analizinizde göz önünde bulundurmalı ve ilgili verileri hazır etmelisiniz. Dikkat ederseniz, tüm bu etkileri göz önüne alabilmek salt bir istatistik bilgisinin ötesinde çalıştığınız alanla ilgili alan bilginizin olmasını gerektiriyor.
Yukarıdaki adımlardan sonra klasik bir “veri analizi iş akışı” uyguladınız ve kurların satış hacminiz üzerindeki etkisine dair bulgulara ulaştınız.

Elde ettiğiniz bulgu şirketiniz için çok değerli. Geçmişi anlamlandırmak adına bir iş yaptınız fakat şirketinizin gelecekte izleyeceği kur stratejisini kurgulamasında önemli yapıtaşlarından birisini ortaya koymuş oldunuz.

Yukarıdaki örnek, geçmişi incelemenin geleceği aydınlatma amacını taşıdığı örneklerden bir tanesi. Bunun yanısıra, sadece geçmişi anlamak adına yapılması gereken işler de var. Örneğin, 15. yüzyılda Atlantik ticaretinin gelişmesinin Akdeniz ticaretine olan etkisini ölçmek gibi.

ii) Veriyle Anı Yaşamak

Şimdi gelelim şimdiye. Hani bir kalıp vardır “anı yaşamak” diye. Yaşadığımız anı bilgi anlamında genişletmek önemli bir mesele çünkü geleceğe dair kontrol edebildiğimiz şeylerin en önemlisi “şu an”. Peki veri bize nasıl yardımcı olabilir? Yeri geldi, Mevlana’dan bir meselle başlayalım:

Günün birinde bir adam bir ev inşa eder ve evin duvarlarıyla bir anlaşma yapar. Duvarlar yıkılmadan önce durumu ev sahibine haber edecek ki ev sahibi ve ailesi bir zarar görmesin. Yıllar yıllar geçer ve bir gün ansızın duvarlar yıkılıverir. Adam gözyaşları ve kızgınlık içinde yıkılan duvarlara seslenir: — Hani anlaşmamız vardı? Hani bana haber verecektiniz? Duvarlardan bir ses duyulur: — Biz haber vermeye çalıştık. Ne zamanki birşeyler söylemek için ağzımızı açtık, sen bir çamurla geldin ve ağzımızı kapadın…

Bu meseli biraz günümüze uyarlayalım. Bir fabrikanız var ve bu fabrikada katma değeri yüksek ürünleri binbir entegrasyon ve otomasyon içinde yüzlerce makine ile üretiyorsunuz. Öyle makineleriniz var ki eğer çalışmazsa tüm üretim süreciniz durma noktasına geliyor. Günün birinde bu makineleriniz bir arıza verir de üretiminiz aksarsa kime kızacaksınız?

Nesnelerin İnterneti diye anılan olgu o kadar yaygın ki. Tüm bu makineler aslında herbir salisede kendilerine ve yaptıkları işlere dair veriler üretiyorlar. Eğer bu verilerden bilgiyi damıtabilirseniz, makinelerinizdeki anomalileri tespit edebilirseniz önlem alacak vakte de sahip olabilirsiniz. Yapacağınız şeyler kabaca şöyle:

Makinelerinizde canlı olarak akan (stream) verileri teslim alacak ve depolayacak altyapı kuracaksınız.
Geçmişte yaptığınız hatalardan ders çıkaracaksınız. Yani geçmiş verilerinizde makine arızalarını tespit edip, arıza durumlarını yakalayabilecek istatistiksel modeller tasarlayacaksınız.
İkinci maddeye ek olarak, anomali olarak adlandırabileceğiniz durumları tespit edecek istatistiksel modeller de tasarlayacaksınız.
Makinelerinizin sözünü kesmeden, söylediklerine kulak verip anlamaya çalışacaksınız.

Özetle, veriyle yaşadığınız anı daha bilgili yaşamanız mümkün.

iii) Veriyle Geleceğin Peşinde

Geldik mi geleceğe…Yalnız peşinen söyleyeyim, bu bölümde küçük bir işgüzarlık yapacağım ve “gelecek” kelimesinin “bilinmez” manasına geldiğini varsayacağım. Bunu yapmaktaki amacım, bu bölümü zaman kavramından bağımsız olarak bilinmeyen/görülmemiş şeylerin tahminine ayırmak isteyişim. Zamansal olarak gelecekteki şeylerin de henüz bilinmeyen/görülmeyen şeyler olduğunu düşünürsek, yaptığım varsayımı mazur göreceksiniz. Yine de ilk olarak zamansal olarak ileride gerçekleşecek bir örneğin incelemesiyle başlayalım:

Elinizde yatırım yapmak için bir miktar paranız olduğunu düşünelim. Alternatif yatırım araçları bir yığın: Borsa, döviz, altın, mevduat, gayrimenkul, Bitcoin, Ethereum, Ripple vs. Hangisine yatırım yapacaksınız? Ne kadarlık bir vadede geri dönüş bekliyorsunuz? Elinizde tüm bu yatırım alternatifleri için tarihsel veriniz var. Eğer alternatiflerin herbirinin fiyatlamasını modelleyebilirseniz, gelecek fiyatlarını da tahmin edebilirsiniz. Örneğin borsayı ele alalım ve basit bir iş akışı çıkaralım:

BIST’ten borsaya kote olmuş tüm hisselerin tarihsel listesini çektiniz.
Hisse fiyatlarını etkilediğini düşündüğünüz verilere de ulaştınız. Örneğin, faiz oranları, kur, enflasyon ve Gaysi Safi Yurt içi Hasıla gibi makro değişkenlerin yanısıra bazı şirketlerin bilançolarına dair veriler de artık elinizde.
Elinizdeki verileri modellerinizde kullanabilmek için işlediniz (Burasını kısa keselim şimdilik, detayları uzunca).
Arasından en iyisini seçeceğiniz alternatif modellerinizi belirlediniz.
Modellerinizin performansını ölçmek için kayan pencereler metodunu kullanmaya karar verdiniz. Tarihsel verinizde yalancı (pseudo) gelecek tasarlayarak ilerleyeceksiniz. Örneğin, 20 periyot önceki veri ile 21. periyodu sanki gelecekmiş gibi tahmin edeceksiniz. Daha sonra pencerinizi bir periyot kaydıracak ve önceki 20 periyotla 22. periyodu tahmin edeceksiniz. Böylece son periyoda kadar geleceksiniz.
Basitçe, modelinizin tahmin performansı ortalamasını alarak modelinizin ne kadar iyi bir iş çıkardığı hakkında bilgi sahibi olacaksınız.
Beşinci ve altınca maddeleri tüm model alternatifleriniz için tekrarladınız ve en iyi performans gösteren modeli seçtiniz.
Seçtiğiniz modeli kullanarak, elinizdeki son 20 periyotluk veri ile artık gerçek geleceği tahmin edebilirsiniz!

Nasıl beğendiniz mi? Tüm alternatif yatırım araçları için yukarıdakine benzer birşeyler yapabildiğinizde, elinizdeki parayı nereye yatırmanız gerektiğine dair veriye dayanan bir öngörü sahibi oldunuz demektir.

İnsanoğlu, grafiğin hep yükseleninin peşinde.

Fakat bilinmez sadece gelecek değildir! Örneğin, sürücüsüz bir araç navigasyon sistemi tasarlamak istiyorsunuz! Ne yapacaksınız, yeryüzündeki tüm yolları gezerek aracınıza hangi yolda nasıl davranması gerektiğini telkin eden kuralları mı kodlayacaksınız? Elbette bu imkansız. Yapacağınız şey, yeterince sayıda ve çeşitlilikte yollarda ne yapılması gerektiğini girdi olarak vererek, aracınızın hiç görmediği yollarda nasıl hareket etmesi gerektiğini öğrenmesini sağlamak.

Bir örnek daha verelim. Bir eğitim kurumu, bir okul işletiyorsunuz. Ortaokul 1. sınıfa 100 yeni kayıt aldınız. Her öğrenciye dair elinizde bazı bilgiler de var fakat bu 100 öğrenciyi nasıl gruplayacağınızı, kimleri hangi sınıflara koyacağınızı bilmiyorsunuz. Ne yaparsınız? Hiç olmazsa elinizdeki verinin size söyleyeceği birşeyler vardır. Önce bunları dinlemelisiniz. 100 öğrenci için açacağınız yeni derslik sayısı 5 ise örneğin, bu 100 öğrenciyi elinizdeki verilere göre 5 gruba ayırmakla başlayabilirsiniz. Elinizdeki veriler size yol gösterir de bu 5 grup sizin de kafanıza yatarsa ne ala. Kafanıza yatmadı mı? O halde, belki 6 derslik ya da 4 derslik açmayı deneyebilirsiniz. Belki böylece daha tutarlı gruplar oluşturmuş olursunuz. Yeter ki verinin dilini nasıl çözeceğinizi bilin.

Yapay Zeka, Veri Bilimi ve Makine Öğrenmesi

Şu ana kadar yazdıklarım arasında Yapay Zeka hiç geçmedi. Peki Yapay Zeka işin neresinde? Esasında bu soruyu Veri Bilimi, Makine Öğrenmesi ve Yapay Zeka arasındaki ilişkinin açıklanması için bir kaldıraç olarak kullanmayı düşünüyorum. İnternette bir araştırma yapacak olursanız, insanların bu üç disiplin arasındaki ilişkiye dair kafalarının biraz karışık olduğunu göreceksiniz. Bazıları, Makine Öğrenmesi’ni Veri Bilimi’nin içine dahil ederken, bazıları ise Yapay Zeka’nın bir parçası olarak algılama eğiliminde. Ben tüm tartışmaları bitirecek bir sınıflandırmayla çıkıp gelecek değilim elbette. Fakat, kendim ne anlıyorum herhalde paylaşabilirim. Bir gözlemle başlayalım:

Geçmişte fizik, felsefenin bir alt dalı olarak görülüyordu. Zaman geçtikçe fizik ilerledi ve artık kendi başına bir bilim dalı olarak görülüyor. Benzer şekilde, Olasılık Teorisi matematik içinde bir araştırma alanıyken, dallanıp budaklanarak İstatistik dediğimiz alanı doğurdu. Dolayısıyla, alanların ya da disiplinlerin birbiri içerisinde değerlendirilip değerlendirilmemesi herşeyden önce zamanın vereceği karara bağlı. Dolayısıyla, bu bölümde söyleyeceğim herşey bu prensibin hükmüne tabi.

Benim anlayışıma göre Veri Bilimi veriden faydalı bilgilere ulaşmayı amaçlayan bir disiplin. Bu açıdan bakıldığında kapsamı çok geniş. Haliyle tam teşekküllü bir tanımını yapmak için çok erken. Yapay Zeka ise bilgisayarların insan gibi düşünebilmelerini sağlamayı amaçlayan bir alan özet olarak. Veri Bilimi doğası gereği Makine Öğrenmesi algoritmalarından yoğun bir şekilde yararlanıyor. Benzer şekilde, Yapay Zeka da günümüzde Makine Öğrenmesi tekniklerinden çok yoğun bir şekilde yararlanan disiplinlerin başında geliyor. Özellikle, Makine Öğrenmesi metodolojilerinden Derin Öğrenme, son 10 yılda Yapay Zeka’nın önünü açan temel gelişme alanı oldu. Fakat benim anlayışıma göre Makine Öğrenmesi, Yapay Zeka’nın büsbütün içinde bir disiplin değil, çünkü tahminsel algoritmalar kadar tanımlayıcı algoritmaları da içinde barındırıyor Makine Öğrenmesi. Diğer taraftan, Yapay Zeka da Veri Bilimi’ne katkı veren alanlardan bir tanesi. Genetik algoritmalardan tutun da bulanık mantığa kadar bir yığın teknik, Veri Bilimi’nde uygulama alanı buluyor. Dolayısıyla, şimdilik bu üç alanı çok ortak noktası olan üç farklı disiplin gibi düşünmemiz yanlış olmaz.

Yazı serisinin ilkini burada sonlandıralım artık. Umarım burada okuduklarınız faydalı olmuş, vaktinizi heba etmemiştir.

Şu yazılara da bir göz atın:

Daha fazlası için Datajarlabs blog sayfasına da göz atabilirsiniz.