Çka është Machine Learning?

Elona Shatri
5 min readApr 17, 2019

--

Redaktoi: Erion Çano

Photo by Franck V. on Unsplash

Mësimi Automatik (Machine Learning) është një nga teknologjitë më të reja dhe më tërheqëse në fushën e Shkencave Kompjuterike. Ne çdo ditë përdorim algoritma të cilët bazohen te kjo teknologji. Çdo herë që ne bëmë një kërkim në Google, Bing apo në motorë të tjerë kërkimi habitemi nga shpejtësia dhe saktësia e rezultateve. Një nga arsyet është fakti se këta motorë përdorin algoritma të mësimit automatik të zhvilluar nga kompanitë e mëdha si Google e Microsoft. Keni pyetur ndonjëherë se pse dhe si kutia e mesazheve Junk/Spam është e mbushur me emaile që me të vërtetë janë jo të besueshme? Kjo gjithashtu është mundësuar nga këta algoritma.

Esenca e mësimit automatik është fakti që këta algoritma të jenë duke mësuar gjatë gjithë kohës, e jo të mbesin në gjendjen fillestare. Këtu mund ta heqim një paralele me njeriun: ne mësojmë gjatë gjithë kohës, qoftë nga reagimet apo nga rezultatet që shohim.

Arthur Lee Samuel ishte pioner në fushën e lojërave kompjuterike the inteligjences artificiale. Ai ka dhënë një përkufizim mbi “Machine Learning” duke e quajtur fushë studimi që i jep kompjuterit aftesine e të mësuarit pa qenë i programuar në mënyrë ekplicite. Pra, nuk është e nevojshme ta programoni makinën duke i treguar si të mësojë, makina do të gjejë cilsitë më të rëndësishme dhe do zgjedhë rrugën më të mirë të mësimit.

Një përkufizim tjetër nga Tom Mitchell, është pak më i kuptueshëm. Ai jep këtë përkufizim “Një program kompjuterik është duke mësuar nga eksperienca E në një detyrë T matur me performancën P, vetëm nëse performanca Pdetyrën T përmirsohet gjate eksperiencës E.

Mësimi Automatik tenton që duke i ushqyer kompjuterat me të dhëna dhe infromacione në formë të vëzhgimit dhe të bashkëveprimit me botën reale, t’i aftësoj këta kompjutera të mësojnë ashtu siç mëson njeriu, duke u përmirsuar përgjatë të mësuarit në mënyrë autonome.

Terma nga Mësimi Automatik

Disa terma që do të përdoren më poshtë janë:

1. Bashkësia e të dhënave — është një koleksion i të dhënave të ndërlidhura i përbërë nga elemente të ndara por që nga algoritmat e mësimit automatik trajtohet si një njësi e vetme.

2. Të dhënat trajnuese — Një pjesë (zakonisht pjesa më e madhe) e një bashkësie të dhënash që përdoret për të trajnuar kompjuterin për të mësuar diçka. Pra, pjesa e të dhënave që ja japim kompjuterit për ta trajnuar.

3. Të dhënat testuese — Një përqindje më e vogel e të dhënave, që përdoret për të testuar algoritmat dhe aftësine e tyre për të mësuar nga të dhënat trajnuese

Shembull: Në lëndën e matematikës, profesori i lëndës ka një libër me probleme të zgjidhura. Bashkë me profesorin e lëndës kemi zgjidhur 80% të problemeve, mirëpo ai nuk na ka dhënë 20% të problemeve duke thënë se pjesa tjetër e problemeve do të jetë në provim. Profesori përdor këtë 20% të problemeve që ne nuk i kemi parë më parë për të testuar se çfarë kemi mësuar nga 80% të problemeve që kemi parë.

Ne edhe pse nuk i kemi parë këto 20 % të problemeve do të jemi të aftë t’i zgjidhim ato në bazë te problemeve që kemi parë apo zgjidhur më parë.

Profesori në këtë rast është programuesi i algoritmit, libri me probleme të zgjidhura të matematikës është bashkësia e të dhënave, 80 % e problemeve të zgjidhura që profesori i jep studentëve janë të dhënat trajnuese ndërsa 20 % e problemeve që i shohim në provim janë të dhënat testuese. Aftësia jonë për të zgjidhur këto probleme (rezultati nga provimi) mund të krahasohet më saktësinë e të mësuarit (learning accuracy).

Llojet e Algoritmave të Mësimit Automatik

Dallohen disa tipe kryesore të algoritmave të mësimit automatik: Mësimi i Mbikëqyrur (Supervised Lerning), Mësimi i Pambikëqyrur (Unsupervised Learning), Mësimi i Gjysmë-mbykqyrur (Semi Supervised Learning) dhe Mësimi i Përforcuar (Reinfocment Learning).

1. Mësimi i MbikëqyrurKëta algoritma aplikohen në të dhëna të reja për të parashikuar ngjarje të së ardhmes duke u bazuar në çka është mësuar më parë duke përdorur etiketat (labels). Duke filluar nga analizat e një bashkësie të dhënash trajnimi, algoritmi prodhon një funksion për të bërë parashikime për rezultatet dalëse. Ky system është i aftë që pas trajnimit të mjaftueshëm të parashikojë kategorinë apo etiketën për çfarëdo të dhënë hyrëse (input data). Nuk përfundon me kaq. Algoritmi, duke parë gabimet që mund të ketë bërë më herët në parashikime krahason këto parashikime me të vërtetën (ground truth), dhe ndryshon modelin në bazë të këtyre mospërputhjeve.

2. Mësimi i Pambikëqyrurkëta algoritma përdoren kur të dhënat trajnuese që ne kemi në dispozicion nuk janë as të klasifikuara e as të etiketuara (labelled). Ky model studion se si një sistem mund të nxjerrë një funksion që të përshkruaj një strukturë të fshehur nga të dhëna të paetiketuara (unlabelled data).

3. Mësimi i Gjysmë-mbykqyrurkëta algoritma janë diku në mes të të parëve dhe të dytëve, pasi përdorin si të dhëna të etiketuara edhe të paetiketuara për të trajnuar modelin. Zakonisht pjesa më e madhe e të dhënave jane te paetiketuara. Këto algoritme janë të afta të përmirsojnë dukshem saktësisne e të mësuarit.

4. Mësimi i Përforcuar — është një metodë e të mësuarit që bashkëvepron me mjedisin duke prodhuar aksione dhe zbulon gabime dhe shpërblime gjatë këtyre bashkëveprimeve. Kërkimi për gabime (errors) dhe shpërblime të vonshme (delayed rewards) janë karakteristikat më të rëndësishme të mësimit të përforcuar. Kjo metodë lejon makinat dhe agjentët softuerikë të përcaktojnë automatikisht sjelljen ideale brenda një konteksti specifik në mënyrë që të maksimizohet performanca e tij. Një shpërblim është i nevojshëm për agjentin të mësojë se cili aksioni është më i miri. Ky reagim quhet sinjali i përforcimit (reinforcement signal).

Credits: https://imarticus.org

Kurse online mbi Machine Learning:

References:

  1. https://www.coursera.org/learn/machine-learning

--

--

Elona Shatri

PhD student in Artificial Intelligence and Music. Working on Optical Music Recognition.