Մաթեմատիկայի դերը AI-ում

Syunik Mkrtchyan
Picsart Academy
Published in
6 min readMay 15, 2024

Դասընթացի մանրամասները՝ https://picsartacademy.am/math

Ներածություն

Արհեստական բանականությունը (AI) շատ մեծ արագությամբ հեղափոխում է մեր կյանքը, և արհեստական բանականության այսպիսի արագ զարգացման մեջ առանցքային նշանակություն ունի մաթեմատիկան: Այս հոդվածում մենք կծանոթանանք մաթեմատիկայի «կենսական» նշանակությանը AI-ում։

Մաթեմատիկայի ներդրումները AI-ում

AI-ում շատ կարևոր նշանակություն ունեն չմշակված տվյալները, իսկ դրանք օգտագործելու համար անհրաժեշտություն է առաջանում այդ տվյալները մշակել։ Իսկ այդպիսի տվյալները մշակելու և օգտագործելու համար անհրաժեշտ են խորքային մաթեմատիկական գիտելիքներ։

Ստորև ներկայացնենք AI-ում կիրառվող մաթեմատիկայի հիմնական ճյուղերը։
Դրանք են`

  • Գծային հանրահաշիվ
  • Մաթեմատիկական անալիզ
  • Հավանականությունների տեսություն
  • Վիճակագրություն

Այժմ վերը թվարկած յուրաքանչյուր ուղղության մասին խոսենք ավելի մանրամասն։

Գծային հանրահաշիվ (Linear algebra)

Ինչպես արդեն նշեցինք, գծային հանրահաշիվը մաթեմատիկայի հիմնական ճյուղերից է, որը կիրառվում է AI-ում։ Գծային հանրահաշվի այդչափ կիրառությունը պայմանավորված է նրանով, որ AI-ի շատ ալգորիթմներում օգտագործվում են հանրահաշվական այնպիսի գաղափարներ, ինչպիսիք են գծային տարածությունները, մատրիցները, որոշիչները և այլն։ Հասկանալի է, որ, եթե գործ ունենք այդ հանրահաշվական օբյեկտների հետ, առնչվելու ենք նաև դրանց հետ կատարվող կամ դրանց վրա սահմանված գործողություններին, օրինակ` մատրիցների գումարումը, բազմապատկումը, որոշիչի հաշվումը, ռանգի հաշվումը, հակադարձ մատրիցի որոշումը, վեկտորների գումարումը, բազմապատկումը սկալյարով, մատրիցների սեփական վեկտորների, սեփական արժեքների որոշումը և այլն։

Շատ կարևոր է գաղափար կազմել տարածության չափողականության, ինչպես նաև գծային արտապատկերումների, արտապատկերման միջուկի և պատկերի մասին։ Լայնորեն կիրառվում է մետրիկայի, նորմի, ինչպես նաև մետրիկական և նորմավորված գծային տարածությունների գաղափարները։
Նշենք նաև, որ մեքենայական ուսուցման (ML) մեջ կիրառվող ամենապարզ, բայց և ամենակարևոր խնդիրներից մեկն է գտնել տրված տվյալները լավագույնս մոտարկող ուղիղ գծի կամ հարթության հավասարումը, ինչը նշանակում է, որ վերլուծական երկրաչափությունից նույնպես պետք է որոշակի գիտելիքներ ունենալ։

Չափողականության նվազեցում (Dimensionality Reduction)

Պարզ է նաև այն, որ գործնականում հանդիպելու ենք տվյալների հսկայական ծավալի, որն իր հերթին բարդություններ է առաջացնում, ուստի անհրաժեշտություն է առաջանում այդ ծավալը փոքրացնել։ Բայց հասկանալի է, որ տվյալների ծավալը նվազեցնելուն զուգընթաց ունենալու ենք ինֆորմացիայի կորուստ։ Այսպիսով, խնդիր է առաջանում նվազեցնել տվյալների ծավալը այնպես, որ ինֆորմացիայի կորուստը լինի մինիմալ, և պահպանվեն տվյալների ամենակարևոր հատկանիշները։

Տվյալների քանակի նվազեցման այս գործընթացը AI-ում անվանում են Dimensionality Reduction, հենց այստեղ է, որ կիրառվում են սեփական վեկտորները և սեփական արժեքները, որոնց կիրառությունը ապահովում է ինֆորմացիայի մինիմալ կորուստը։

Մաթեմատիկական անալիզ (Calculus)

Մաթեմատիկայի մյուս ուղղությունը, որը մեծ կարևորություն ունի AI-ում և ML-ում՝ մաթեմատիկական անալիզն է։ Գրեթե բոլոր մոդելներում անհրաժեշտ է ապահովել բարձր ճշտություն։ Հասկանալի է, որ յուրաքանչյուր մոդել իր գործառույթը կատարում է որոշակի ֆունկցիաների միջոցով և որ ամենակարևորն է, յուրաքանչյուր մոդելի համար գոյություն ունի կորստի ֆունկցիա։ Արհեստական բանականությունում առանձնահատուկ նշանակություն ունի կորստի ֆունկցիան մինիմիզացնելու խնդիրը։
Այդ խնդիրը լուծելու համար օգտագործում են մաթեմատիկական անալիզի հիմնական հասկացություններից մեկը՝ ֆունկցիայի ածանցյալի գաղափարը։
Այստեղ կարևոր է նշել, որ հիմնականում բախվելու ենք մի քանի փոփոխական պարունակող ֆունկցիաների և մի քանի փոփոխական պարունակող ֆունկցիաների լոկալ էքստրեմումները գտնելու խնդրին։
Այս խնդիրի լուծման համար օգտագործվում է գրադիենտային վայրէջք կոչվող մեթոդը։

Գրադիենտային վայրէջք (Gradient Descent)

Գրադիենտային վայրէջքը օպտիմալացման հիմնական մեթոդներից մեկն է, որն օգտագործվում է AI մոդելների ուսուցման մեջ: Մեթոդի էությունը հասկանալու համար անհրաժեշտ է լիարժեք տիրապետել ածանցյալի, իսկ մի քանի փոփոխական պարունակող ֆունկցիաների դեպքում՝ ուղղությամբ ածանցյալի գաղափարներին, ինչպես նաև կետում ածանցյալի և գրադիենտ վեկտորների սահմանմանը և հետո արդեն, գաղափար կազմելով այդ հասկացությունների մասին, հասկանալի կդառնա, թե ինչպես են այդ մեթոդով մինիմիզացնում մի քանի փոփոխականի ֆունկցիաները։
Այստեղ առանցքային դեր է կատարում այն փաստը, որ գրադիենտ վեկտորի ուղղությունը համընկնում է այդ կետում ֆունկցիայի ամենաարագ աճի ուղղության հետ, իսկ գրադիենտ վեկտորին հակառակ ուղղությունը համընկնում է ֆունկցիայի ամենաարագ նվազման ուղղությանը։

AI շատ մոդելներում հանդիպելու ենք մի շարք օպտիմալացման խնդիրների, որոնք լուծվում են մաթեմատիկական անալիզի հասկացությունների օգնությամբ։ Գրադիենտային վայրէջքը այդ մեթոդներից մեկն է։ Որոշ մոդելներում հանդիպում է նաև պայմանական էքստրեմումները որոշելու խնդիրը։ Այսպիսի խնդիրները լուծվում են Լագրանժի անորոշ բազմապատկիչների մեթոդի կիրառությամբ, որը նույնպես ուսումնասիրվում է մաթեմատիկական անալիզում։

Հավանականությունների տեսություն և վիճակագրություն

Հավանականությունների տեսությունը ևս լայն կիրառություն ունի AI-ում։ Արհեստական բանականության շատ մոդելներ ստեղծվում են որոշակի կանխատեսումներ անելու կամ թե որոշակի պատկերներ տարբերելու համար։ Այսպիսի մոդելների աշխատանքը հասկանալու կամ առավել ևս այդպիսի մոդելներ ստեղծելու համար անհրաժեշտություն է առաջանում հավանականությունների տեսության խորը իմացություն։ Ավելի պատկերավոր եթե ասենք, նույնիսկ ամենապարզ մոդելներում կիրառվում են պայամանական հավանականության և Բայեսի բանաձևերը։ Նշենք նաև շատ կարևոր մի հանգամանք, որ մոդելում պայմանի գործառույթը կատարում են մոդելում առկա տվյալները։ Անհրաժեշտ է խորը իմացություն պատահական մեծության, պատահական մեծության բաշխման և խտության ֆունկցիաների մասին։ Շատ են կիրառվում նաև պատահական մեծության բնութագրիչները` մաթ-սպասումը, ցրվածքը, տարբեր կարգի՝ սկզբնական և կենտրոնական մոմենտները։ Կարևոր է բաշխման տեսակներից առանձնացնել նորմալ կամ Գաուսյան բաշխումը, որի բաշխման ֆունկցիան տրվում է այս բանաձևով՝

Առանձնահատուկ նշանակություն ունի այն նորմալ բաշխումը, որտեղ

իսկ

հանդիսանում են նորմալ բաշխում ունեցող պատահական մեծության մաթ-սպասումը և ցրվածքը։ Շատ կարևոր է նաև նշել սահմանային թեորեմների և հատկապես հավանականությունների տեսության կենտրոնական սահմանային թեորեմի առանձնահատուկ նշանակության մասին։ Վերջինս, եթե կարճ ձևակերպենք, հնարավորություն է տալիս ցանկացած պատահական մեծություն, որը բավարարում է որոշակի պայմանների, ներկայացնել մի պատահական մեծության միջոցով, որն ունի ստանդարտ նորմալ բաշխում։ Հետաքրքիր է այն հանգամանքը, որ ստանդարտ նորմալ բաշխման կարող ենք բերել նույնիսկ այն պատահական մեծությունները, որոնց բաշխման ֆունկցիայի մասին գաղափար անգամ չունենք։ Այստեղ արդեն ավելի ու ավելի նկատելի է դառնում մաթեմատիկական անալիզի կարևորությունը, քանի որ մաթեմատիկական անալիզը բացի արհեստական բանականությունում իր ուղիղ կիրառությունից, շատ մեծ կիրառություն ունի մաթեմատիկայի մյուս ուղղություններում, որոնք կենսական նշանակություն ունեն AI-ի համար։ Այդպիսի ուղղություններից է հենց հավանականությունների տեսությունը։

Հավանականությունների տեսությունն իր հերթին հանդիսանում է վիճակագրության մաթեմատիկական ապարատը։ Արդեն վիճակագրությունում կիրառում ենք այն ամենը, ինչ ուսումնասիրում ենք հավանականությունների տեսությունում։ Այս երկու ճյուղերը խիստ փոխկապակցված են, սակայն եթե հավանականությունների տեսությունը, տեսություն է որտեղ ուսումնասիրվում են պատահական մեծությունները, որոնց բաշխումները տեսական մակարդակում շատ հաճախ տրված են լինում, և մենք կարողանում ենք որոշել պատահական մեծության որևէ միջակայքում ընկնելու հավանականությունը կամ նրա թվային բնութագրիչները, վիճակագրությունը արդեն տեսություն չի համարվում, այլ ավելի շատ կիրառություն։ Գործնականում սովորաբար տրված չի լինում մեզ հետաքրքրող պատահական մեծության բաշխման ֆունկցիան, և հետևաբար հայտնի չի նաև պատահական մեծության բաշխման ֆունկցիայի մեջ մտնող պարամետրերի և բնութագրիչների թվային արժեքը։ Այդ անհայտների մասին գաղափար կազմելու համար տվյալ պատահական մեծության նկատմամբ հարկ է լինում կատարել մի շարք դիտումներ և փորձեր։ Եվ մաթեմատիկական վիճակագրության հիմնական խնդիրն է ելնելով փորձերի արդյունքներից ստանալ գնահատականներ անհայտ բաշխման ֆունկցիայի, պարամետրերի և բնութագրիչների համար։ Մաթեմատիկական վիճակագրության մյուս կարևոր խնդիրը ստացված գնահատականների վստահելությունը ստուգելն է։ Ինչպես նշեցինք, AI-ի համար չմշակված տվյալները կենսական նշանակություն ունեն, և այդ տվյալները մշակելու համար մաթեմատիկական վիճակագրության գործիքակազմը անփոխարինելի է։ Հավանականությունների տեսության և վիճակագրության մշակած մեթոդներով կարող ենք հասկանալ երկու մեծությունների փոխկապակցվածության աստիճանը՝ կոռելացիան, ինչը նույնպես շատ կարևոր է և ունի առանցքային նշանակություն և տվյալների գիտությունում, և արհեստական բանականությունում։ Մենք արդեն խոսել ենք տվյալները լավագույն կերպով մոտարկող ուղիղ գծի հավասարման մասին։ Եթե ունենք փորձի որոշակի քանակությամբ արդյունքներ, այդ արդյունքների հիման վրա կարող ենք գտնել պահանջվող ուղիղ գծի հավասարումը։ Այդ հավասարումը գտնելու եղանակներից մեկին անվանում են փոքրագույն քառակուսիների մեթոդ, իսկ երբ փոգրագույն քառակուսիների մեթոդով գտնում ենք որոնելի ուղղի հավասարումը, ստանում ենք մի շատ հետաքրքիր առնչություն։ Պարզվում է,որ

որտեղ K-ն հանդիսանում է որոնելի ուղղի անկյունային գործակիցը, VAR (X)-ը հանդիսանում է X-ի ցրվածքը և

իսկ

Վերջինս վիճակագրության հասկացությունների կիրառության փոքր օրինակ էր։

Ամփոփում

Ըստ էության, մաթեմատիկան պարզապես գործիք չէ, որն օգտագործում են AI-ում: Մաթեմատիկան AI-ի հիմքն է, այն լեզուն է, որի միջոցով լուծվում են ոչ միայն վիրտուալ, այլ նաև իրական աշխարհում բավականին բարդ խնդիրները:

--

--