НӨАТ-ын сугалааны анализ. Хэсэг II

Nyamkhuu Demberelsuren
Beyond Data Science
5 min readSep 8, 2019
https://xkcd.com/221/

Өнгөрсөн нийтлэлд татаж авсан өгөгдөл дээрээ одоо анализ хийе. Хэрвээ та санаж байгаа бол, http://sugalaa.ebarimt.mn -ээс НӨАТ-ийн сугалаатай холбоотой дараах өгөгдлийг боловсруулж авсан:

+------------+--------------+----------+----------+
| Эхний өдөр | Сүүлийн өдөр | Үндсэн | Супер |
+------------+--------------+----------+----------+
| 2016-01-01 | 2016-01-10 | 55020762 | 26003690 |
| 2016-01-01 | 2016-01-20 | 35577825 | 48830941 |
| 2016-01-01 | 2016-01-31 | 52346699 | 69827600 |
| 2016-01-01 | 2016-02-20 | 17901740 | 98483936 |
| 2016-01-01 | 2016-02-29 | 02870088 | 47015520 |
| 2016-01-01 | 2016-03-15 | 80096100 | 26024190 |
| 2016-02-01 | 2016-02-10 | 22633808 | 60515447 |
| 2016-03-01 | 2016-03-31 | 36796987 | 10506598 |
| 2016-04-01 | 2016-04-15 | 67808111 | 58152005 |
| 2016-04-01 | 2016-04-30 | 06868818 | 69034117 |
| 2016-05-01 | 2016-05-15 | 62061197 | 62817812 |
| 2016-05-01 | 2016-05-31 | 54826899 | 12803350 |
| 2016-06-01 | 2016-06-30 | 51794784 | 35479923 |
| 2016-07-01 | 2016-07-31 | 33354738 | 27658285 |
| 2016-08-01 | 2016-08-31 | 12033407 | 05884604 |
| 2016-09-01 | 2016-09-30 | 11001900 | 35849193 |
| 2016-10-01 | 2016-10-31 | 54855480 | 60246885 |
| 2016-11-01 | 2016-11-30 | 28672868 | 30818365 |
| 2016-12-01 | 2016-12-31 | 59765971 | 94262626 |
| 2017-01-01 | 2017-01-31 | 11357920 | 20911810 |
| 2017-02-01 | 2017-02-28 | 62857474 | 16083035 |
| 2017-03-01 | 2017-03-31 | 34419352 | 70375153 |
| 2017-04-01 | 2017-04-30 | 61174721 | 10892827 |
| 2017-05-01 | 2017-05-31 | 67878508 | 93941888 |
| 2017-06-01 | 2017-06-30 | 94663073 | 10642812 |
| 2017-07-01 | 2017-07-31 | 70470451 | 49065302 |
| 2017-08-01 | 2017-08-31 | 37340688 | 40404009 |
| 2017-09-01 | 2017-09-30 | 18761051 | 71742222 |
| 2017-10-01 | 2017-10-31 | 79369350 | 96260467 |
| 2017-11-01 | 2017-11-30 | 71482981 | 77485495 |
| 2017-12-01 | 2017-12-31 | 30204358 | 23059186 |
| 2018-01-01 | 2018-01-31 | 50507359 | 89278942 |
| 2018-02-01 | 2018-02-28 | 85796031 | 35199240 |
| 2018-03-01 | 2018-03-31 | 70171034 | 53451362 |
| 2018-04-01 | 2018-04-30 | 56365763 | 22627273 |
| 2018-05-01 | 2018-05-30 | 61703903 | 55622553 |
| 2018-06-01 | 2018-06-30 | 68747698 | 32385755 |
| 2018-07-01 | 2018-07-31 | 19301136 | 96151358 |
| 2018-08-01 | 2018-08-31 | 17822285 | 88359507 |
| 2018-09-01 | 2018-09-30 | 95392761 | 34204008 |
| 2018-10-01 | 2018-10-31 | 62474172 | 88104987 |
| 2018-11-01 | 2018-11-30 | 40321218 | 86333238 |
| 2018-12-01 | 2018-12-31 | 71079096 | 63030046 |
| 2019-01-01 | 2019-01-30 | 08696606 | 27575743 |
| 2019-02-01 | 2019-02-28 | 31158873 | 20791539 |
| 2019-03-01 | 2019-03-31 | 28869533 | 88590813 |
| 2019-05-01 | 2019-05-31 | 96589469 | 46053913 |
| 2019-06-01 | 2019-06-30 | 27818931 | 25410684 |
| 2019-07-01 | 2019-07-31 | 48687025 | 06375641 |
+------------+--------------+----------+----------+

Хамгийн эхний хийх зүйл бол ямар тоонууд хэр давтамжтай сугалагдаж байгааг шалгах юм. Өгөгдөлд нийт 49 тохирлын 784 (49*8*2) ширхэг тооны мэдээлэл байна. Зөвхөн үндсэн сугалааны 392 ширхэг тооны тархалтаас дараах дүр зураг харагдаж байна:

Зарим тоонуудын бодит давтамж, саарал зураасаар харуулсан онолын 10% -аасаа хэт өндөр (7, 8) эсвэл бага (2, 4) байгааг цэнхэр өнгөөр тодруулан харууллаа. Хэрвээ дээрх зургыг үндсэн болон супер сугааланы бүх тоонууд дээр туршивал:

Мөн адил бусдаасаа хэт өндөр (0) болон бага (4) давтамжтай тоонууд ажиглагдаж байна. Графикаас харахад онолын хувьд байх естой 10%-аасаа хэт хазаалттай мэт харагдаж байгааг статистик ашиглан баталгаажуулая. Тодорхой нэг тооны сонгогдох удааг бином тархалттай гэж үзэн 95% итгэлийн мужийг (z=1.96, магадлал p=10%, нийт туршилтын тоо n=784) дараах аргачлааар тодорхойлье:

Хэрвээ дээрх томъёог ашиглавал итгэлийн муж 7,9%-оос 12,1% -ийн хооронд байна. Уг тоонуудыг бодит байдалтай харьцуульвал, 95% магадлалтайгаар “0” гэсэн тоо сугалаанд сонгогдох магадлал 10%-иас ялгаатай буюу санаандгүй биш байгааг илэрхийлнэ. Ямар нэгэн тоо санаандгүй бус байдлаар сонгогдож байгаа нь тус сугааланы системд эргэлзэхэд хүргэж байна.

Нэмэлтээр тооны байршлын давтамжыг шалгая:

Дээрх зурган дээр босоо тэнхлэгийн дагуу тухайн тооны давтамж байгаа бол хэвтээ тэнхлэг дагуу тухайн тоо сугалааны дугаарын хэддүгээр байранд байгааг харуулсан байна. Үүнээс байршил бүрийн хувьд /0-c 9 хүртэл дарааллан байршсан/ тоо маань хэр давтамжтай байгааг харах боломжтой. Мөн хамгийн их болон бага давтамжтай тоонуудыг тодотгосон байгаа. Жишээ нь, сугалааны дугаарын 3 дах байршилд ихэнхдээ “8” гэсэн тоо байдаг бол “9” гэсэн тоо хамгийн бага байдаг байна.

НӨАТ-ын сугааланы өгөгдөлд хийсэн тус анализаас сугалааны дугаарын тоонууд 100% санандгүй сонгогдохгүй байна гэж дүгнэж болохоор байна. Үүнд, 2 үндсэн шалтгаан байж болно:

  1. Тоог сугалахад ашигладаг төхөөрөмж өөрөө санаандгүй байдлаар гаргах боломжгүй байх. Энэ тохиолдолд өөр төхөөрөмж эсвэл арга ашиглан сугалааны дугааруудыг тодруулдаг болох шаардлагатай.
  2. Ямар нэгэн гадны нөлөөтэй зарим тоонууд давамгайлах. Уг нийтлэлийг бичэж байхад хамгийн сүүлийн 2019 оны 8 сарын 18 тохирлоор 1,316,630,000₮ — ийг хүмүүс хожсон байна. Мэдээж ийм их хэмжээний мөнгө эргэлдэж байгаа тохиолдолж, сугалааны тохиролд нөлөөлөх, ашиг хонжоо олох гэсэн хүмүүс байхыг үгүйсгэхгүй билээ.

Хэрвээ дараагийн удаа та НӨАТ-ын сугалаанд хожихгүй бол битгий сэтгэлээр унаарай. Та азгүй учраас биш харин тохирлын системийн доголдолтой үйл ажиллагаанаас болсон байх магадлалтай юм.

--

--