Machine Learning гэж юу вэ?

Orgilbat
3 min readOct 22, 2018

--

Юуны өмнө энэ өгүүлэл Machine Learning -ийн талаар огт юу ч мэдэхгүй хүмүүст зориулсан гэдгийг анхааруулъя. Энд тэнд Machine Learning, AI гэсэн яриа улам ихсэж, харин та юу яриад байгааг нь ойлгохгүйн эрхээр нэг л гээгдэж хоцорсон мэдрэмж төрж байгаа бол энэ өгүүлэл яг танд тохирно.

Та заавал техникийн суурьтай байх албагүй. Гэхдээ энэхүү өгүүллийг уншсаны дараа дээрх сэдвээр яриа өрнөхөд оролцож чадахуйц мэдээлэлтэй болсон байна гэдгийг амлая.

Тэгэхлээр Machine Learning буюу Машин сургалт гэж юу вэ?

Нэлээд бүдүүн тоймоор тодорхойлбол :

Машин буюу компьютер хүний зан төлвийг дуурайж, дасан зохицох чадвартай болж чадна.

Гэхдээ яаж?

Жишээ нь, доорх асуулга өгөгджээ. Тоонуудыг ажиглаад хариултыг олно уу :

3–9

4–16

8–64

9 — ?

Хариулт нь 81 гэдгийг та яаж олов оо???

Энэ бол бидний машинд заах гэж оролдоод байгаа яг тэр “зан төлөв” шүү дээ. Машинуудад бид “Туршлагаасаа суралцдаг” байхыг сургах гээд байгаа юм.

Машин сургалтын алгоритмууд урьдчилан тодорхойлогдсон томъёо, загваргүйгээр, зөвхөн тооцоолох аргад суурилан, өгөгдлөөс шууд “суралцаж” мэдээллийг олж авдаг. Суралцах өгөгдөл ихсэхийн хэрээр алгоритмын ажиллагаа улам сайжирдаг.

Машин сургалтын ямар ч алгоритм өгөгдөл доторх хэв шинж, холбоо хамаарлыг тогтоож, одоогоор мэдэгдэхгүй байгаа төлвийг урьдчилан таамаглах чадвартай. Тэрхүү таамгийг ашиглан, хүмүүс бид илүү оновчтой шийдвэр гаргах юм.

Машин сургалтын хоёр арга байдаг :

  1. Supervised Learning буюу Удирдлагатай сургалт

2. Unsupervised Learning буюу Удирдлагагүй сургалт

  1. Удирдлагатай сургалт гэдэг нь:

Хэв шинжийг олохдоо оролтын болон гаралтын өгөгдлийг хоёуланг нь ашигладаг аргыг хэлдэг.

Бүх удирдлагатай сургалтын аргууд Classification (Ангилал) болон Regression (Регресс) техникийн аль нэгт хамаарна.

Ангилалыг салангид (discrete) утга таамаглахад ашигладаг.

Жишээ нь, дэмжсэн баг маань ЯЛАХ уу ЯЛАГДАХ уу? Энэ имэйл СПАМ уу, ЖИНХЭНЭ үү? гэх мэт асуултын хариу оролтоосоо хамаарч ЯЛАХ, ЯЛАГДАХ эсвэл СПАМ, ЖИНХЭНЭ гэсэн салангид бүлгүүдэд хамаарна.

Регрессийг үргэлжилсэн (continuous) утга таамаглахад ашигладаг.

Жишээ нь, хувьцааны зах зээлийн үнийн хэлбэлзэл, цаашдын хандлага; цаг агаарын урьдчилсан таамаг гэх мэт.

2. Удирдлагагүй сургалт гэдэг нь :

Хэв шинжийг олохдоо зөвхөн оролтын өгөгдлийг ашигладаг аргыг хэлдэг. Өгөгдлөөс яг юу хайхаа мэдэхгүй байгаа үед энэ арга тохиромжтой. Түүхий өгөгдлийг ойлгохын тулд ихэвчлэн ашигладаг.

Ихэнх удирдлагагүй сургалт Cluster Analysis (Бүлэглэх шинжилгээ) гэдэг техник дээр суурилна.

Бүлэглэх шинжилгээ гэдэг нь, өгөгдлийн шинж чанарууыг хэмжээд, адил төстэйгээр нь бүлэглэж хуваахыг хэлнэ. Үр дүнд нь хэд хэдэн ялгаатай бүлгүүд бий болно.

Жишээ нь, гаралтанд A-Z хүртэл бүлгүүд үүссэн гэж үзвэл A бүлгийн d1 элемент энэ бүлгийнхээ d2 элементтэй илүү адилхан хэрнээ B-Z бүлгүүдийн дурын элементээс нэлээд ялгаатай байх юм. Бусад бүлгийн хувьд ч энэхүү шинж хадгалагдана.

Одоо анхны асуулга руугаа буцъя. Энэ бол Удирдлагатай машин сургалтынРегресс техникийн жишээ болно.

Машин сургалтын түгээмэл хэрэглээнээс дурдвал :

  • Apple Siri, Google Assistant гэх мэт хувийн туслах програмууд
  • Цаг агаарын урьдчилсан мэдээ
  • Спортын тэмцээний урьдач таамаг
  • Эмнэлгийн шинжилгээ
  • Netflix, Amazon -ын санал болгосон кино, бараа гэх мэт бидний алхам тутамд машин сургалт ашиглагдаж байна.

Эцэст нь, Машин сургалт бол Хиймэл оюун (AI — Artificial Intelligence) гэдэг өргөн сэдвийн хүрээнд хамаарах бөгөөд Гүн сургалт (Deep Learning) гэх мэт илүү нарийн ойлголтуудыг өөртөө агуулдаг.

--

--