Yapay Zeka Temel Kavramlar-2

Ali Kaan Arbay
Ebebek Tech
Published in
8 min readNov 2, 2021

Bir önceki yazımızda yapay zeka tanımı, amacı ve tarihsel gelişimi anlatılmıştı.

Bu yazımızda veri bilimi, makine öğrenmesi gibi kavramlara açıklık getirilmiştir.

Fakat konunun daha iyi oturması açısından ilk önce en temeldeki kavram olan “veri” kavramına değinilmiştir.

Verinin sözlük tanımı:

Veri, ham (işlenmemiş) gerçek enformasyon parçasına verilen addır. Veriler ölçüm, sayım, deney, gözlem ya da araştırma yolu ile elde edilmektedir. Ölçüm ya da sayım yolu ile toplanan ve sayısal bir değer bildiren veriler nicel veriler denilirken, sayısal bir değer bildirmeyen verilere de nitel veriler denilmektedir.

İstatistikte verinin tanımı:

İstatistikte yorumlanmak ve sunulmak amacı ile toplanmış, çözümlenmiş ve özetlenmiş gerçeklere veri denmektedir.

Sayısal (nümerik) veriler nicel, nitel veriler ise kategorik olarak tanımlanmaktadır. Nicel veriler ayrıca kendi aralarında kesikli ve sürekli olarak iki gruba ayrılmaktadır. Kesikli veriler sayım yolu ile toplanmakta ve çoğu kez sayma sayıları cinsinden ifade edilmektedir. Sürekli veriler ise ölçüm yolu ile toplanmakta ve gerçel (reel) sayılar cinsinden ifade edilmektedir.

Nitel veriler de nominal ve ordinal olarak iki gruba ayrılmaktadır. Nominal veriler yazı ile ifade edilmekte ve anlamlı herhangi bir sıralamaya sahip olmayan verilerdir. Ordinal veriler ise yazı ile ifade edilmekle birlikte anlamlı bir sıralamaya sahip olan verilerdir.

Veri çeşitlerine ayrıntılı olarak veri bilimi için istatistik konu başlığında tekrar değinilecektir.

Veri tanımı yapıldıktan sonra sıklıkla duyduğumuz veri bilimi ve makine öğrenmesi tanımları yapılmıştır.

Veri Bilimi Nedir?, Veri Biliminin Amacı Nedir?, Veri Biliminin Adımları Nelerdir?

Veri bilimi hangi alanlardan oluşur?

Veri Bilimi Nedir?

Veri bilimi, verilerden değer üretmek, elde etmek için istatistik, bilimsel yöntemler (Matematik, Bilgisayar Bilimleri), iş bilgisi ve veri analizi dahil olmak üzere birçok alanı bir araya getiren yapay zekanın bir alt alanı da olan çok disiplinli bir bilimdir.

Turing ödüllü Jim Gray, veri bilimini bir “dördüncü paradigma” bilimi olarak tanımlar.

Veri bilimiyle uğraşan kişilere ise veri bilimci denir.

Veri Biliminin Amacı Nedir?

Veri bilimcilerin görevi web, müşteriler, akıllı telefonlar, sensörler ve diğer pek çok kaynaktan veri toplamak toplanan verileri analiz etmek ve bunlardan eyleme dönüştürülebilir tahmin modelleri üretmektir.

Veri bilimi, makine öğrenmesi ve veri analizi kavramları sıklıkla birbirleri yerine kullanılmaktadır. Bu disiplinler arasındaki ortaklık, verilerin analizi yoluyla tahmin sonucu oluşacak karar vermenin iyileştirilmesini sağlamaktır.

Veri bilimi bu alanlardan beslenmekle birlikte, daha geniş bir kapsama alanına sahiptir. Makine öğrenmesi, veriden örüntü çıkarma, algoritmalarının tasarımı ve değerlendirmesine odaklanır. Veri analizi ise verilerin temizlenmesi ve analizi ile ilgilenir.

Peki, veri bilimini bu kadar önemli yapan şey nedir?

Teknoloji sayesinde her geçen gün daha fazla miktarda veri üretiliyor. Haliyle üretilen bu verilerin depolanmasını sağlamak için veri hacimlerinde haliyle patlamalar görülüyor.

Dünyadaki verilerin yüzde 90'ının son iki yılda oluşturulduğu tahmin ediliyor. Ancak bu verilerin büyük bir çoğunluğu depolanmak üzere veri tabanlarında ve veri göllerinde işlenmemiş bir şekilde saklanıyor.

Toplanan ve depolanan verilerin zenginliği, dünya genelinde kurumlara ve toplumlara avantajlar sağlayabilmesi için bu verileri ilk önce analiz edip sonra modelleyip en son olarak da yorumlayabilmemiz gerekir.

Veri bilimi ise tam da bu noktada devreye girer.

Veri bilimi, her türden işletmenin daha iyi kararlar almak, daha yenilikçi ürün ve servisler yaratmak üzere kullanabileceği tahminleri makine öğrenimi (ML) modellerinin bunlara yüklenen büyük miktarda verilerden öğrenmelerini sağlar.

Veri bilimcilerin görevleri arasında verileri analiz etmek için stratejiler geliştirme, verileri toplama, verileri analiz için hazırlama, verileri keşfetme, analiz etme ve görselleştirme, Python ve R gibi programlama dillerini kullanarak verilerle birlikte modeller oluşturma ve modelleri uygulama yazılımlarına entegre etme sayılabilir.

Aşağıda, bir veri bilimi projesinin adımları verilmiştir.

Veri Biliminin Döngüsü Nasıldır?

Genelde veri bilimi sürecinde izlenen adımlar ise şu şekildedir:

1.İlgilenilen soruyu tanımla

2.Veriyi elde et

3.Veriyi ayıkla

4.Veriyi kontrol et

5.Makine Öğrenmesi modelleri uydur

6.Sonuçları duyur

7.Analizi yeniden oluşturabilecek şekilde yap.

Veri biliminin bu proje döngüsüne Cross-industry standard process for data mining ya da kısa adıyla CRISP-DM modeli denir.

CRISP-DM modeli veri bilimi projeleri için bir modeldir.

Yapay zeka ve veri bilimi kavramlarından sonra veri analizi ve ardından makine öğrenmesi kavramları tanıtılmıştır.

Veri Analizi Nedir?

Veri analizi, iş karar verme süreci için yararlı bilgileri keşfetmek için verileri temizleme, dönüştürme ve modelleme süreci olarak tanımlanır.

Veri analizini veri biliminin bir alt alanı olarak da düşünebiliriz.

Veri Analizinin Amacı Nedir?

Veri analizinin amacı, verilerden faydalı bilgiler çıkarmak ve veri analizine dayalı olarak karar vermektir.

Veri Analizi Sürecinin Adımları Nelerdir?

Veri analizi süreci, verileri keşfetmenize ve içinde bir kalıp (pattern) bulmanızı sağlayan uygun bir uygulama veya araç kullanarak bilgi toplamaktan başka bir şey değildir. Bu bilgi ve verilere dayanarak kararlar verebilir veya nihai sonuçlara ulaşabilirsiniz.

Veri analizi aşağıdaki aşamalardan oluşur:
1.Veri Gereksinimi Toplama
2.Veri toplama
3.Veri temizleme
4.Veri analizi
5.Veri Yorumlama
6.Veri görüntüleme

Anlatılan kavramların kafamızda daha iyi oturması için takip eden görsel verilmiştir.

Makine Öğrenmesi Nedir?

Makine öğrenmesi, insanların öğrenme şekillerini taklit etmek için veri ve belirli algoritmaları kullanarak yapılan tahminlerin doğruluğunu kademeli olarak artıran yapay zekanın bir alt dalıdır.

Makine Öğrenmesinin Amacı Nedir?

Makine öğrenmesi, veri bilimi alanının önemli bir bileşenidir. İstatistiksel yöntemler kullanılarak, algoritmalar; tahminler (regresyon, sınıflandırma) yapmak üzere eğitilir ve veri projelerinde temel tahminleri ortaya çıkarmaktadır. Bu tahminler, sonrasında uygulamalar ve işler dahilinde karar verme sürecini teşvik ederek, ideal anlamda önemli büyüme ölçütlerini etkiler.

Makine Öğrenmesinin Çeşitleri

Makine öğrenmesi üç ana kategoriye ayrılır:

1.Gözetimli Öğrenme ( Supervised Learning )

2.Gözetimsiz Öğrenme ( Unsupervised Learning )

3.Pekiştirmeli Öğrenme ( Reinforcement Learning )

Makine Öğrenmesi Çeşitleri

Bundan sonraki kısımda gözetimli, gözetimsiz ve pekiştirmeli öğrenme kavramları ayrıntıya inilmeden açıklanmıştır.

Bu öğrenme çeşitlerine ve algoritmalarına yazılarımızın ilerleyen kısımlarında ayrıntılı olarak değineceğiz. Ayrıca gözetimsiz öğrenme algoritmalarının bir kısmı öznitelik mühendisliği ve veri ön işleme basamaklarında yine ayrıntılı bir şekilde anlatılacaktır.

Gözetimli Öğrenme:

Denetimli makine öğrenimi olarak da bilinen gözetimli öğrenme, makine öğrenimi ve yapay zekanın bir alt kategorisidir. Verileri sınıflandırmak veya regresyon tahmini yapmak için algoritmalarını etiketlenmiş veri kümeleri kullanılmasıyla tanımlar. Girdi verileri ile model beslenirken, çapraz doğrulama sürecinin bir parçası olarak gerçekleşen, model uygun şekilde uygulana kadar ağırlıklarını ayarlar.

Gözetimli öğrenme, modellere istenen çıktıyı verecek şekilde öğretmek için bir eğitim seti kullanır. Bu eğitim veri seti, modelin zaman içinde öğrenmesini sağlayan girdileri ve doğru çıktıları içerir. Algoritma, hata yeterince minimize edilene kadar ayar yaparak, kayıp fonksiyonu aracılığıyla doğruluğunu ölçer.

Gözetimli öğrenme, iki tür probleme ayrılabilir: sınıflandırma ve regresyon:

Sınıflandırma:
Sınıflandırma algoritmaları, çıktı değişkeni kategorik olduğunda test verilerini belirli kategorilere doğru bir tahminle atamak için kullanır.

Bazı önemli sınıflandırma algoritmaları:

  • Logistic Regression
  • Naïve Bayes
  • Stochastic Gradient Descent
  • K-Nearest Neighbours
  • Decision Tree
  • Random Forest
  • Support Vector Machine

Regresyon:
Bağımlı ve bağımsız değişkenler arasındaki ilişkiyi anlamak için kullanılır. Hava tahmini, Piyasa Trendleri vb. gibi sürekli değişkenlerin tahmini bunlara örnektir.

Bazı önemli regresyon algoritmaları:

  1. Linear Regression
  2. Logistic Regression
  3. Ridge Regression
  4. Lasso Regression
  5. Polynomial Regression
  6. Bayesian Linear Regression
Gözetimli Öğrenme

Gözetimsiz Öğrenme:

Denetimsiz makine öğrenimi olarak da bilinen gözetimsiz öğrenme, etiketlenmemiş veri kümelerini analiz etmek ve kümelemek için makine öğrenimi algoritmalarını kullanır. Bu algoritmalar, insan müdahalesine ihtiyaç duymadan gizli kalıpları veya veri gruplamalarını keşfeder.

Bilgilerdeki benzerlikleri ve farklılıkları keşfetme yeteneği, onu keşifçi veri analizi, çapraz satış stratejileri, müşteri segmentasyonu ve görüntü tanıma, işleme için ideal çözüm haline getirir.

Gözetimsiz öğrenme modelleri, üç ana görev için kullanılır. Bunlar kümeleme, ilişkilendirme ve boyutluluk azaltmadır.

Gözetimsiz öğrenme, algoritmalarının büyük bir kısmı daha önce de belirtildiği gibi öznitelik mühendisliği ve veri ön işleme aşamalarında verinin daha iyi analiz edilip ondan sonra da daha iyi model kurulabilmesi için kullanılır.

Aşağıda önemli gözetimsiz öğrenme algoritmaları verilmiştir. Tekrarlamakta fayda var ki bir sonraki yazılarımızda hem gözetimli hem gözetimsiz hem de pekiştirmeli öğrenmede ki algoritmalar teorik ve bilgisayar uygulamalı olarak detaylı bir şekilde açıklanacaktır.

Bazı önemli gözetimsiz öğrenme algoritmaları:

  • K-means Clustering
  • Hierarchal Clustering
  • Probabilistic Clustering
  • Anomaly Detection
  • Principle Component Analysis
  • Independent Component Analysis
  • Apriori Algorithm
  • Singular Value Decomposition
  • Gaussian Mixture Models

Gözetimsiz öğrenmenin en yaygın gerçek dünya uygulamalarından bazıları şunlardır:

Haber Bölümleri

Bilgisayarla görme

Tıbbi görüntüleme

Anormallik tespiti

Müşteri kişilikleri

Öneri Motorları

Gözetimsiz Öğrenme

Pekiştirmeli Öğrenme:

Pekiştirmeli öğrenme, bir temsilci (agent) belirli eylemleri gerçekleştirerek ve bu eylemlerin sonuçlarını görerek bulunduğu ortamda nasıl davranması gerektiğini geri bildirime dayalı bir şekilde öğrendiği makine öğrenmesi çeşididir. Her iyi eylem için temsilci olumlu geri bildirim alır iken her kötü eylem için temsilci olumsuz geri bildirim veya ceza alır.

Pekiştirmeli öğrenmede temsilci, gözetimli öğrenmenin aksine, herhangi bir etiketli veri olmadan geri bildirimler vasıtasıyla otomatik olarak öğrenir.

Etiketlenmiş bir veri olmadığı için, temsilci yalnızca deneyimiyle öğrenmek zorundadır.

Pekiştirmeli öğrenme, genellikle karar vermenin sıralı olduğu ve hedefin oyun oynama, robotik vb. gibi alanlarda kullanılır.

Temsilci, çevre ile etkileşime girer ve çevresini kendi başına keşfeder.

Bir temsilcinin pekiştirmeli öğrenmedeki ana amacı, maksimum olumlu hareket yaparak model performansını artırmaktır.

Pekiştirmeli öğrenme, bir temsilcinin çevre ile etkileşime girdiği ve bu çevre içinde yaptığı eylemlerle pozitif veya negatif (ceza) geri bildirim alarak öğrenme işlemini gerçekleştirdiği bir tür makine öğrenimi yöntemidir diyebiliriz. Herhangi bir insan müdahalesi olmadan kendi deneyimlerinden öğrendiği için temsilciyi önceden programlamamıza gerek yoktur.

Tanımın üzerinden kısaca geçmek gerekirse temsilci, hangi eylemlerin olumlu geri bildirime veya ödüllere yol açtığını ve hangi eylemlerin olumsuz geri bildirim cezasına yol açtığını öğrenir. Olumlu bir ödül olarak, temsilci olumlu bir puan alır veya ceza olarak olumsuz bir puan alır.

Pekiştirmeli Öğrenme

Yapay zeka temel kavramları tanıtılmıştır.

Bir sonraki yazıya kadar sağlıcakla kalın :)

KAYNAKÇA:

https://www.oracle.com/tr/data-science/what-is-data-science/:

Data science — Wikipedia

Machine learning — Wikipedia

https://www.ibm.com/tr-tr/cloud/learn/machine-learning

https://www.javatpoint.com/reinforcement-learning

https://www.javatpoint.com/machine-learning

--

--