Машин сургалтын тайзны ард: Математик
Data science, машин сургалтын чиглэл хөгжихийн хэрээр загвар боловсруулж буй мэргэжилтэнд өгөгдөл дээр ажиллах улам л амар болж шинэ соргог software, program-ууд нээлттэй болж байгаа билээ. Иймд, зарим анхлан суралцагчид машин сургалтын цаана хэрэглэгдэж буй математикийн ойлголтуудыг мэдэх шаардлагагүй гэж үзэх нь түгээмэл болсон. Машин сургалт гэдэг ойлголт нь статистик, магадлалын онол, программчлал зэргийн огтлолцол дээр оршдог бөгөөд эдгээрийн талаар ойлголтгүйгээр модель боловсруулж сургана гэдэг бол фундаментгүй барилгатай ижил зүйл билээ. Энэхүү нийтлэлийн зорилго нь онолын хичээл заах бус хэрхэн ашиглагддаг, яагаад мэдэх шаардлагатай, илүү дэлгэрэнгүй сурвал хаанаас сурч болох вэ? гэдэг талаар байх болно.
Яагаад чухал вэ?
Машин сургалтын чиглэлээр ажиллахад математикийн суурь ойлголтуудыг мэддэг байх нь маш их давуу талтай.
- Зөв алгоритм сонгох
- Параметрийн тохиргоог оновчтой хийх
- Overfitting, underfitting-с сэргийлэх
- Итгэх интервалыг зөв тодорхойлох зэрэг асар олон хэрэглээ бий.
Бид тоон өгөгдлийг вектор хэлбэрээр илэрхийлдэг бөгөөд векторууд болон бусад шугаман объектуудыг судладаг алгебрын дэд ухааныг Шугаман алгебр гэж нэрлэдэг. Харин хоёр объектыг илэрхийлж буй хоёр вектор хэр ижил төстэй байгаа талаар тайлбар хийх шаардлагатай гэж үзвэл бидэнд Аналитик геометр хэрэг болно. Мөн загвар боловсруулах, өгөгдлийн тайлбар зэрэгт матриц дээр хийх үйлдлүүд асар чухал байдаг. Дийлэнх тохиолдолд өгөгдөл маань тодорхой хэмжээний тодорхой бус байдал буюу white noise-той байдаг бөгөөд үүнээс бодит өгөгдлөө салгаж авах шаардлагатай болдог. Тэр тодорхой бус байдлыг тооцоолох зорилгоор Магадлалын онолын ойлголтуудын ашигладаг. Үүнээс гадна, машин сургалтын загваруудыг сургахад чанарын хэмжүүр метрикийг хамгийн их байхуйц параметрүүдийг тодорхойлох шаардлагатай тулгарах бөгөөд үүнийг Vector calculus болон Оновчлол сэдвүүдээр илүү дэлгэрэнгүй ойлгох юм.
Чухал ойлголтууд
Шугаман алгебр
Facebook дээр найз санал болгох, Spotify дээр дуу санал болгох, өөрийн селфигээ Сальвадор Дали-гийн стилээр зурагдсан уран зураг болгон хувиргах зэрэг нь юугаараа ижил вэ? Бүгдэд нь матриц болон шугаман алгебр ашиглагдаж байгаагаар адил юм. Шугаман алгебрыг “21-р зууны математик” гэж нэрлэдэг. Ялангуяа машин сургалт, дата сайенс-ийн салбарт асар их хэрэглээтэй. Чухал сэдвүүд:
- Basic properties of matrix and vectors — scalar multiplication, linear transformation, transpose, conjugate, rank, determinant,
- Inner and outer products, matrix multiplication rule and various algorithms, matrix inverse,
- Special matrices — square matrix, identity matrix, triangular matrix, idea about sparse and dense matrix, unit vectors, symmetric matrix, Hermitian, skew-Hermitian and unitary matrices,
- Matrix factorization concept/LU decomposition, Gaussian/Gauss-Jordan elimination, solving Ax=b linear system of equation,
- Vector space, basis, span, orthogonality, orthonormality, linear least square,
- Eigenvalues, eigenvectors, and diagonalization, singular value decomposition (SVD)
Хэрвээ та их сургуульдаа математиктаа онцгой анхаарал хандуулаагүй, дээрх сэдвүүд танил биш байвал MIT-ийн онлайн курсийг сонирхоод үзээрэй. Coursera дээр мөн энэ сургалт байдаг шүү.
Магадлалын онол болон статистик
Машин сургалт статистикийн асар олон ойлголт дээр суурилдаг. Зарим үндсэн сэдвүүд нь:
- Data summaries and descriptive statistics, central tendency, variance, covariance, correlation,
- Basic probability: basic idea, expectation, probability calculus, Bayes theorem, conditional probability,
- Probability distribution functions — uniform, normal, binomial, chi-square, student’s t-distribution, Central limit theorem,
- Sampling, measurement, error, random number generation,
- Hypothesis testing, A/B testing, confidence intervals, p-values,
- ANOVA, t-test
- Linear regression, regularization
Статистик, магадлалын онолын талаар асар олон онлайн курс байдаг. Жишээ нь, Coursera дээр R программын хэл ашигласан энэ сургалт харин edX дээр Python ашигласан энэ сургалт байдаг шүү.
Олон хувьсагчийн анализ /Multivariate Calculus/
Calculus нь энгийн шугаман регрессийн хамгийн бага квадратын аргын аналитик шийдэл, нейрон сүлжээний backpropogation зэрэг олон хэрэглээтэй байдаг. Мэддэг байхад илүүдэхгүй сэдвүүд:
- Functions of single variable, limit, continuity and differentiability,
- Mean value theorems, indeterminate forms and L’Hospital rule,
- Maxima and minima,
- Product and chain rule,
- Fundamental and mean value-theorems of integral calculus, evaluation of definite and improper integrals,
- Beta and Gamma functions,
- Functions of multiple variables, limit, continuity, partial derivatives,
- Basics of ordinary and partial differential equations
Хаанаас сурах вэ? Coursera дээр байгаа энэ сургалтыг сонирхоорой.