ທິດສະດີ Machine Learning : Framing[ Machine Learning Crash Course ]
ເປັນການອຸ່ນເຄື່ອງຄ້າວໆທີ່ເວົ້າເຖິງໂຄງປະກອບສາ້ງ, ການເຮັດວຽກ ແລະຄຳສັບຕ່າງໆກ່ຽວກັບ ML:
- Machine Learning: ແມ່ນການຮຽນຮູ້ຂອງເຄື່ອງຈັກທີ່ຮວບຮວມເອົາຄ່າທີ່ປ້ອນເຂົ້າ(Input) ໄປກະຕວງ ຫຼື ພະຍາກອນຄ່າຕ່າງໆ ກັບຂໍ້ມູນຊຸດໃຫມ່(ເພິ່ນອີງຄວາມໝາຍໂດຍໃຫ້ມັນເປັນ Supervised Machine Learning).

ເວົ້າງ່າຍ Machine Learning ແມ່ນການຮຽນຮູ້ຂອງເຄື່ອງຈັກໂດຍການໃຊ້ຂໍ້ມູນ
- Label: ແມ່ນຜົນລັບທີ່ຄາດການໄວ້ (ປຽບເປັນຕົວປ່ຽນຕາມ y ໃນສົມຜົນເສັ້ນຊື y = ax+b )
- Feature: ແມ່ນຄຸນລັກສະນະຕ່າງໆ ທີ່ປ້ອນເຂົ້າໃນ ML (ປຽບເໝືອນຕົວປ່ຽນຕົ້ນ X ໃນສົມຜົນເສັ້ນຊື່ y= ax+b)
- Example: ແມ່ນຕົວຢ່າງໃດໜຶ່ງ ທີ່ຖືກໃຊ້ເຂົ້າໃນການສອນ ແລະການທົດສອບ ML,ປະກອບມີ 2 ປະເພດຄື:
- Labeled Example( x, y): ແມ່ນຕົວຢ່າງທີ່ຮູ້ຜົນລັບຢູ່ແລ້ວ, ມີທັງ Feature ແລະ Label ຍົກຕົວຢ່າງ: ໃນການກວດກ Email ວ່າເປັນ Spam ຫຼື ບໍ່? ສົມມຸດ ເຮົາມີ Email ທີ່ເປັນຕົວຢ່າງໜຶ່ງ ປະກອບມີຄຸນສະນະຕ່າງໆ ເຊັ່ນ: ຄວາມຍາວຂອງຂໍ້ຄວາມ, ຮູບພາບ, ຄຳເວົ້າທີ່ໃຊ້ຂຽນ…(ທັງໝົດເປັນ Feature ກະຄື ຄຸນລັກສະນະ ) ແລະສົມມຸດວ່າ Email ນີ້ເປັນ Spam( ເປັນ Label ກະຄື ຜົນລັບທີ່ຮູ້ຢູ່ແລ້ວ ).
- Unlabeled Example( x ): ແມ່ນຕົວຢ່າງທີ່ບໍ່ຮູ້ຜົນລັບ ມີແຕ່ຄ່າຄຸນລັກສະນະກະຄື Feature. ຕົວຢ່າງ ການກວດ Email ຂ້າງເທິງ: Unlabeled Example ເປັນ Email ໜຶ່ງທີ່ບໍ່ທັນຮູ້ວ່າ ມັນເປັນ Spam ຫຼື ບໍ່ເປັນ.
- Model: ແມ່ນຜົນໄດ້ຮັບຈາກການ Train → Machine Learning, ຖ້າເປັນ Supervised ມັນກໍຄື ຕົວແບບ ທີ່ຖືກເອົາໄປໃຊ້ເຂົ້າໃນການພະຍາກອນ, ກວດຈັບ, ຄາດການຕ່າງໆ. ຜົນການຄາດເດົາຈະດີ ຫຼື ບໍ່ດີ ກໍຂຶ້ນກັບຂັ້ນຕອນການສອນ ແລະຂໍ້ມູນທີ່ປ້ອນໃຫ້ມັນນັ້ນເອງ, ກ່ອນຈະໄດ້ມັນມາກໍຕ້ອງຜ່ານຂັ້ນຕອນພື້ນຖານເຊັ່ນ:
- Training: ການຊ້ອມ ຫຼືການຮຽນຮູ້ຂອງ Model ທີ່ເບິ່ງຂໍ້ມູນວ່າ Feature ໄປສຳພັນກັບ Label. ສະນັ້ນ, ເຮົາກໍຕ້ອງໃຊ້ຂໍ້ມູນທີ່ມີ Feature ພົວພັນກັບ Feature ຫຼາຍກໍລະນີເພື່ອໃຫ້ Model ສາມາດຈັດການກັບຂໍ້ມູນຫຼາຍແບບ.
- Inference: ແມ່ນການສະຫລຸບຜົນໄດ້ຮັບຈາກການພະຍາກອນ ໂດຍໃຊ້ Model ທີ່ຜ່ານການຮຽນຮູ້ມາແລ້ວມາ ພະຍາກອນ unlabeled example(ຕົວຢ່າງທີ່ບໍ່ຮູ້ຜົນລັບ)
Regression Model:
ແມ່ນ Model ທີ່ຖືກໃຊ້ຄາດເດົາ ຂໍ້ມູນແບບຕໍ່ເນື່ອງ (continuous value ເປັນຂໍ້ມູນທີສາມາດເປັນຕົວເລກແບບທົດສະນິຍົມ)
EX:
>ການພະຍາກອນອາກາດ ໂດຍສະເພາະແມ່ນຕົວເລກອຸນຫະພູມຕອນນີ້ມີຄ່າເທົ່າໃດ?, >ຄ່າປີ້ຍົນ ຈາກຫຼວງພະບາງ ໄປຫາຈຳປາສັກມີລາຄາເທົ່າໃດ?, >ອັດຕາການຂະຫຍາຍຕົວຂອງປະຊາກອນລາວມີຄ່າຈັກເປີເຊັນເທົ່າໃດ?
ເຫັນໄດ້ວ່າ ການພະຍາກອນເຫຼົ່ານີ້ລ້ວນແຕ່ເປັນຄ່າຕົວເລກ…

Classification Model:
ແມ່ນ Model ທີ່ຖືກໃຊ້ໄວ້ຈັດໝວດໝູ່ ທີ່ເຮັດວຽກກັບຂໍ້ມູນແບບບໍ່ຕໍ່ເນື່ອງ(discrete value)
EX:
>ຮູບນີ້ເປັນ ງູ, ໄກ່ ຫຼື ມັງກອນ?,
>ຮູບນັ້ນ ເປັນຄົນ ຫຼື ລິງ?
>Email ນັ້ນ ເປັນ Spam ຫຼື ບໍ່?
ເຫັນໄດ້ວ່າ ການພະຍາກອນນີ້ ລ້ວນແຕ່ເປັນຄ່າບໍ່ຕໍ່ເນື່ອງທັງນັ້ນ ເພາະເຮົາເວົ້າບໍ່ໄດ້ວ່າ ຮູບນີ້ ເປັນງູ ເຄິ່ງໂຕ, ຮູບນັ້ນເປັນຄົນ 0.75 ຄົນ ຫຼື Email ນັ້ນ ເປັນ Spam ເຄິ່ງໜຶ່ງ. ແຕ່ເຮົາຈະເວົ້າວ່າ ເປັນງູ, ເປັນລິງ, ເປັນ Spam ແບບເຕັມປາກເຕັມຄຳເທົ່ານັ້ນ.
Key Term: ຄຳສຳຄັນ
classification model: ໃຊ້ໄວ້ຈັດໝວດຫມູ່
regression model: ໃຊ້ໄວ້ຄາດເດົາຕົວເລກ
feature: ຄຸນລັກສະນະ
label: ຜົນໄດ້ຮັບ
example: ຕົວຢ່າງທີ່ໃຊ້ສອນ machine learning
model: ຕົົວແບບທີ່ໃຊ້ໄວ້ພະຍາກອນ, ຈັດໝວດໝູ່ ຫຼືຍັງກະຕາມທີ່ໃຫ້ເຄື່ອງຈັກເຮັດຕັດສິນໃຈເອງ ແລະໄດ້ຈາກການຮຽນຮູ້.
inference: ການສະຫຼຸບຜົນ ຈາກການເອົາ model ທີ່ສອນແລ້ວໄປພະຍາກອນຕົວຢ່າງທີ່ບໍ່ຮູ້ຜົນ(unlabeled example).
