Kavram karmaşası üzerine

Canburak Tümer
4 min readJul 7, 2019

--

Yazıda bahsedeceğim ve kendimce birbirlerinden ayırmaya çalışacağım Veri Bilimi, Makine Öğrenmesi ve Yapay Zeka kavramlarının tarihçesine baktığımızda en tazesinin 1980'lere dayandığını ama pek çok akademik yayının bundan da eski olduğunu rahatlıkla görebiliriz. Temelinde matematik ve istatistik yatan bu disiplinler, son bir kaç yılda bilgisayarların veri işleme gücünün artmasıyla akademik dünyadan sıyrıldı ve iş yaşamının merkezine bomba gibi düştü.

LinkedIn üzerindeki bağlantılarınıza şöyle bir baktığınızda, eski analistlerin ve ağırlıklı olarak iş zekası ve veri ambarı uzmanlarının kendilerine veri bilimcisi, makine öğrenmesi uzmanı ya da mühendisi, yapay zeka mühendisi gibi unvanlar seçtiğini görebilirsiniz. (ve evet, itiraf ediyorum benim de ünvanımda makine öğrenmesi geçiyor.)

Gartner Hype Cycle (Kaynak Wikipedia)

Bilişim alanında yaptıkları yayınlar ve anket çalışmaları ile otorite sayılan Gartner’ın düzenli yayınlanan bir “Hype Cycle” raporu vardır. Genellikle LinkedIn unvanlarının da bu döngü ile beraber hareket ettiğini takip edebilirsiniz. Örneğin, 2012 — 2013 döneminde herkes büyük veri uzmanıydı.

Şu anda da yukarıda da dediğim gibi herkes veri bilimi ya da makine öğrenmesi uzmanı. Ancak yıllar önce büyük veride yaşandığı gibi bence şu anda da veri bilimi, makine öğrenmesi ve yapay zeka kavramlarının açıkça tanımlanması ihtiyacı var.

Photo by Carlos Muza on Unsplash

Bu üç kavram günlük konuşmalarda birbirleri yerine geçebilecek şekilde kullanılsalar da, aralarında farklar bulunduğu kanaatindeyim.

Veri Bilimi

Öncelikle bilimin TDK Güncel Türkçe Sözlükteki tanımı ile açıklamaya başlayalım :

1. isim Evrenin veya olayların bir bölümünü konu olarak seçen, deneye dayanan yöntemler ve gerçeklikten yararlanarak sonuç çıkarmaya çalışan düzenli bilgi, ilim.

Veri bilimi için de “kendisine veriyi konu olarak seçmiş bilim dalıdır.” diyebiliriz. Bu durumda bu disiplin, eldeki veriden bir sonuç elde etmeye çalışan, deneylere dayanan yöntemler kullanan, yine bilimin genel geçer tanımı gereği bu deneyler tekrarlanabilir ve deterministik olan bir bilim dalıdır.

Burada benim için ayırt edici nokta, veri biliminin uygulanmasında bir veri bilimcinin deneyleri yapması, sonuçları irdelemesi ve nihayetinde bir karara varmasıdır.

Makine Öğrenmesi

Makine Öğrenmesi, bilgisayarın çeşitli istatistik yöntemlerini kullanarak elindeki veriden bir örüntü çıkarmaya çalışmasıdır. Burada sonuçların elde edilmesi için bir bilim insanına ya da operatöre ihtiyaç yoktur.

Veriler hazırlanır (sadece bu kısımda insana gereklilik vardır), veriler algoritma ya da algoritmalara girer, makine verideki örüntüyü bulur, hazırlanmış sınama verileri ile başarımını tespit eder, en yüksek başarımı olan modeli kendisine esas kabul eder ve bundan sonra kendisine girdi olarak verilen veriler ile ilgili bir tahminde bulunmaya başlayabilir.

Bu saydığım aşamaların çok büyük kısmı otomasyona müsaittir ve otomatize de edilmelidir.

Photo by Franck V. on Unsplash

Yapay Zeka

Yapay Zeka kavramından bahsederken robot resmi koymasam herhalde epey tepki alırdı. 😀

Açık konuşmam gerekirse yapay zeka disiplini benim eğitimimin ya da tecrübemin olmadığı bir alan o sebeple burada çok ahkam kesmek istemiyorum. Yine kendime bu kavramı diğerlerinden nasıl ayrı bir şekilde ifade ettiğimi açıklayıp bırakacağım.

Yapay zeka, içinde bulunduğu durumu tahlil edip, hareket seçeneklerinin çıktılarını hesaplayan ve kendisi için en karlı kararı alan bir sistemdir. Daha önceden üzerinde araştırma yaptığım Uzman Sistemler örneğini ele alırsak da yapay zekanın diğer iki disiplinin aksine her zaman geçmiş veriye ihtiyacı olmadığını da savunabilirim.

Kavramlar arası farkı bir örnekle açıklamam gerekirse,

Bir e-ticaret sitemiz olduğunu düşünelim A/B Testleri yaparak satın alan müşteri sayısını artırmayı hedefliyoruz.

Veri Bilimi disiplininde, testlerden toplanan veriler bir bilim insanına teslim edilir. O kişi çeşitli veri görselleştirme ve istatistik yöntemler kullanarak satış rakamları ile test parametreleri arasında ilişki arar. Doğru ilişkiyi bulduğunu düşündüğünde sonuçlarını rapor eder ve uygulanmasını sağlar.

Makine öğrenmesi disiplininde, testlerden toplanan veriler ile bir model (algoritma) eğitilir. Makinenin bulduğu örüntü bizim için farklı parametreler ile ne gibi satış rakamları elde edebileceğimizi tahmin eder. Ve bize hangi parametreleri ne şekilde ayarlamamız gerektiğine dair bir metod çıkarır.

Yapay zeka ise bizden hedefi ve kullanabileceği parametreleri alır, kendi testlerini tasarlar, uygular. Test çıktılarına göre e-ticaret sitesinin nasıl olması gerektiğine karar verir ve uygular.

Bitirirken

Bu üç kavram her ne kadar geçişken görünse de, kendi kanaatim makine öğrenmesinin veri bilimini kapsadığı yönünde. Makine öğrenmesi veri biliminin bir adım üstüne çıkmış bir disiplin ve ne yaptığını bilen bir makine öğrenmesi uzmanının veri bilimi disiplinini de biliyor olması gerekmekte. Yapay zeka ise bu iki disiplinden beslendiği zaman daha da kuvvetlenebilen ama aslen bunlardan tamamen ayrı bir şekilde de konumlanabilen bir pratik.

Okuduğunuz için teşekkür ederim. Beğendiyseniz alkış butonunu kullanabilir ya da katkıda bulunmak ve eleştirmek için yorum bırakabilirsiniz.

--

--

Canburak Tümer

Cloud Data Engineer @ Google Cloud | Data, Coding and Travel enthusiast