Maşın Öyrənməsi — Ümumi Baxış

Nurlan Ilyasov
Nov 3 · 4 min read

Xülasə: Bu yazı oxucuya Maşın Öyrənməsi məsələlərinin həlli üçün istifadə olunan əsas yöntəmləri və ümumiyyətlə məsələlərin modelləşdirilməsi haqqında ümumi (dərin və çox da texniki olmayan) məlumatın verilməsini nəzərdə tutur. Yazıda Maşın Öyrənməsi termininə “Machine Learning” və ya “ML” deyə müraciət olunacaq.

Önsöz

Öyrənmək nədir? Dünyada ilk ML dərslik kitabının müəllifi olan Carnegie Mellon Universitetinin (CMU) professoru Tom M. Mitchell kompüter proqramarının öyrənməsi haqqında bu sözləri demişdir:

Hər hansı bir T məsələlər (tasks) çoxluğuna və P performans göstəricisinə (performance measure) nisbətən E təcrübəsindən (experience) öyrənən kompüter proqramı, E təcrübəsi ilə inkişaf edir.

Süni İntellektin alt sahəsi olan ML əsaslarını: experience induction üzərindən qurmuşdur. ML ilə bağlı əsas bunu yadda saxlamaq lazımdır ki, ML mövcud məlumatlardan informasiyanı çəkə bilər lakin özündən yeni informasiya kəşf edə bilməz. Aşağıdakı diaqram ML ilə ənənəvi proqramlaşdırma arasında fərqi göstərir.

Diaqramdan bəlli olur ki, əslinə qalsa ML avtomatlaşdırılmanın avtomatlaşdırılmasıdır. Daha spesifik olsaq, bəzən qaydaları manual olaraq özümüzün yazması çətin bir prosesə çevrilir, yəni proqramlaşdırma bottleneck (tıxac, yavaşlama) nöqtəsidir. Yeni görmədiyimiz məlumatlardan istədiyimiz informasiyanı avtomatlaşdırılmış şəkildə almaq üçün köməyimizə ML gəlir, harada məlumatlar (data) bütün bizə gərəkli olan işi görür. ML haqqında daha ətraflı müzakirə aparmaqdan öncə istərdim bu sahə ilə bağlı ən önəmli konfrasnların və jurnalların listini sizinlə paylaşım. Fikrimcə gələcəkdə ML ilə bağlı araşdırma aparmaq istəyən oxucular üçün bu çox faydalı məlumat ola bilər.

Machine Learning (ML)

Aşağıdakı diaqram ML-in bütün alt sahələrinin listin təqdim etməsə də bu üçü ən geniş yayılmış olanlarıdır: Supervised Learning, Unsupervised LearningReinforcmenet Learning.

Supervised Learning (SL)

ML-in ən geniş alt sahəsi olan SL sadə sözlərlə desək modelin öyrənilməsidir. Daha spesifik olsaq SL-in məqsədi bilinməyən modelin dəyərləndirilməsindən ibarətdir, harada bilinən input (giriş məlumatları) bilinməyən output-a (çıxış məlumatlarına) map olunur (tutuşdurulur). Daha aydın anlayışa sahib olmaq üçün aşağıdakı videoya baxın.

SL-də training set növbət formada olacaq, harada D data set, x input (və ya features, predictors, attributes) və t output (targets, responses, labels) olaraq götürülür (x t cütlüyü sample adlanır).

Məsələn: pişik şəklini nümunə olaraq götürsək, o zaman şəklin özü x, pişik olub olmaması isə t olacaq. Beləliklə biz f(x) = t öyrənmək istəyirik, yəni x ilə t-ni əlaqələndirən ümumi funksiyanı. Beləliklə SL-də bir neçə problem var (classification, regression, probability estimation) hansıları həll etmək üçün fərqli yöntəmlər mövcuddur (Artificial Neural Networks, Support Vector Machines, Decision trees və s.). Target-dən aslı olaraq SL problemlərini aşağıdakı kimi bölmək olar:

  • Əgər t diskritdirsə, o zaman bu classification problemidir.
  • Əgər t dəvamlıdırsa (continious), o zaman bu regression problemidir.
  • Əgər t x-in ehtimalıdırsa (probability of x), o zaman bu probability estimation problemidir.

Unsupervised Learning (UL)

UL sadə sözlərlə desək representation (məlumat təqdimatının) öyrənilməsidir. Daha spesifik olsaq UL-in məqsədi bilinməyən input-ların daha effektiv representaion-un öyrənilməsidir. Daha aydın anlayışa sahib olmaq üçün aşağıdakı videoya baxın.

UL-də training set növbət formada olacaq, harada D data set, x input olaraq götürülür (fikir verin sample yalnız input-lardan ibarətdir).

Məsələn: x input olaraq bir qrup insan şəklini götürsək (harada bir qismi gülür digər qismi isə yox) və proqrama bunları qruplaşdırmağı əmr etsək, o zaman proqram gülən və gülməyən insanlar arasında fərqliliyi aşkarlıyaraq hər bir şəkli iki kateqoriyadan birisinə aid edəcək. Buna clustering problem deyilir. Beləliklə UL-də bir neçə problem var (compression, clustering) hansıları həll etmək üçün fərqli yöntəmlər mövcuddur (K-means, Self-organizing maps, Principal Component Analysis və s.).

Reinforcmenet Learning (RL)

RL sadə sözlərlə desək control-un (idarəetmənin) öyrənilməsidir. Daha spesifik olsaq RL-in məqsədi optimal policy (davranışın) öyrənilməsidir. Daha aydın anlayışa sahib olmaq üçün aşağıdakı videoya baxın.

RL-də training set növbət formada olacaq, harada D data set, π*(x) policy, x state (hazırki durum), u action və ya desicion (qəbul olunacaq qərar), x` result state (u tətbiqi nəticəsində x dəyişməsi) və r isə reward adlanır (x, u, x`, r bir yerdə experience sample təşkil edir).

Beləliklə bizim məqsədimiz elə bir π policy tapmaqdır ki (policy action-ların seçilmə qaydasıdır), harada hal-hazırki reward yox uzun müddətli qərarlardan sonra yığılan və toplanan reward-ların cəmi maksimal nəticə verəcəkdir. Məsələn: tələbələr günəşli havada vaxtlarını keçirək yerinə günlərini sıxıcı siniflərdə keçirirlər, buna səbə isə bu günkü günün xoşbəxtliyi qarşılığında təhsillərini bitirdikdən (uzun müddət) sonra daha böyük ümumi nəticəyə və xoşbəxtliklərə çatmaqdır. RL-də bir neçə problem var (Markov Decision Process [MDP], Partially Observable MDP [POMDP], Stochastic Games [SG]) hansıları həll etmək üçün fərqli yöntəmlər mövcuddur (Q-learning, SARSA, Fitted Q-iteration və s.).

Yekun

Beləliklə oxucu Machine Learning haqqında az da olsa məlumat aldı. Bu yazı əsasən gələcək yazılar üçün struktur rolunu daşıyır ki, oxucu rahatlıqla yazılar arasında keçid edə bilsin və ya özü axtarış edərək ona maraqlı olan mövzulara fokuslansın.

Sonda, mənə ADA Universitetində “Artificial Intelligence” kursunu tədris etmiş Prof. Samir Rustamova və Politecnico di Milano universitetində “Machine Learning” kursunu tədris etmiş Prof. Marcello Restelli-yə öz təşəkkürümü bildirirəm.

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade