R — Хичээл 1.
Excel-с файл татаж тооцоолол хийх
R бол статистик, тооцоолол хийхэд ашиглагддаг программын хэл юм. Австралийн их сургуулийн багш нарын зохиосон энэ хэл сүүлийн жилүүдэд Python-тай зэрэгцэн “хамгийн хэрэгтэй тооцооллын хэл”-ний жагсаалтыг тэргүүлж байна.
R — н давуу тал
- Үнэгүй. Программыг татаж авахад л хангалттай.
- Программын хэл тул SPSS, Excel зэрэг тооцооллын программууддаас илүү өргөн сонголтой, илүү хүчирхэг. SPSS дээр өгөгдлөө оруулсны дараа нэг цэс рүү орж нэг товч дараад л тооцоолол хийж болно. Excel ч мөн адил. Харин R-г ашиглавал олон төрлийн тооцоолол, дата цэгцлэх, регресс зэрэг ахисан шатны тооцооллуудыг хурдан хугацаанд хийх, үзэмжтэй графикууд бэлтгэх, machine learning моделиуд сургаж ч болно.
- R-н хэрэглэгчид олон байдаг тул гарсан асуудлуудаа интернэтэд бусадтай хуваалцан хариуг нь олж, ижил төстэй асуудал шийдсэн нөхцлүүдтэй танилцаж болно.
Бодит жишээ
Одоо бодит жишээн дээр ажиллая.
- R татаж авах

https://cran.r-project.org/ сайт руу орж өөрийн компьютерт тохирох хувилбарыг татаж авна.
2. Ажиллуулах
Хэрэгтэй тохиргоог хийсний дараа программыг нээнэ.

Console нь команд ажиллуулах талбар.
File >> New Script хэсэг рүү ороход гарч ирэх Editor нь бараг л таны ноорог цаас болно.
3. Байршил заах
Эксел болон бусад файлыг программ руу татаж ашиглахын тулд файл байгаа газрыг зааж өгнө.
Console дээр курсороо идэвхжүүлсний дараа File >> Change directory

4. Хэрэгтэй package татаж авах.
.xlsx өргөтгөлтэй файл татаж уншуулах болон график гаргах зэрэг бусад үйлдэд хийхэд хэрэгцээт package-уудыг татаж авдаг.
install.packages(“openxlsx”)
library(openxlsx)
Дээрх командыг Console хэсэгт уншуулна.

5. Файлаа татаж уншуулна.
#books нэртэй эксэл файлын 1-р хуудсыг уншуулаад түүнийгээ data гэж нэрлэж байна.
data <- read.xlsx(“books.xlsx”,1)
#data гэж нэрлэсэн өгөгдлийг харах
View(data)

6. Өгөгдлийн статистик
# өгөгдлийн бүтцийг харах
str(data)
# өгөгдлийн ерөнхий статистикийг харах
summary(data)

8 үзэгдэл 2 хувьсагч бүхий өгөгдөл.
Эхний багана буюу хувьсагч Book.name нэртэй. Энд номны нэр байна.
Хоёр дах баганa Book.pages нэртэй. Энд байгаа номнууд хамгийн багадаа 195, хамгийн ихдээ 476, дунджаар 302,9 хуудастай байна.
Дараагийн удаад стандарт хазайлт, вариацын тухай үзэцгээе.
