ທິດສະດີ Descending into ML [ Machine Learning Crash Course ] :
ມີເນື້ອໃນເວົ້າເຖິງ 2 ຫົວຂໍ້ຫຼັກໆຄື:
Linear Regression
Linear Regression: ແມ່ນສົມຜົນເສັ້ນຊື່ຖົດຖອຍທີ່ເວົ້າເຖິງຄວາມສຳພັນຂອງຄ່າທີ່ຮັບເຂົ້າມາ ( ຕົວປ່່ຽນຕົ້ນ x ) ແລະຜົນໄດ້ຮັບ ( ຕົວປ່ຽນຕາມ y )
ມີຮູບຮ່າງຄື:


x : ຕົວປ່ຽນທີ່ຮັບເຂົ້າມາ ( input )
y : ແມ່ນຜົນໄດ້ຮັບທີ່ຄາດການ( Output )
m : ແມ່ນຄ່າຄວາມໂຄ້ງ ຫຼື ຄວາມຊັນ
b: ຄ່າຄົງທີ່ ( ຈຸດຕັດ y )
m = Δy / Δx
ເມື່ອຂຽນຢູ່ໃນຮູບຮ່າງຂອງ Machine Learning ຈະເປັນແບບນີ້:

y ’ : ແມ່ນ Output ທີ່ຜ່ານການຄາດເດົາ
b : bias ( ຈຸດຕັດ y ) ບາງເທື່ອ b = w0
x1 : ຄ່າຄຸນລັກສະນະ feature 1
w1 : weight = ຄ່ານ້ຳໜັກຂອງລັກສະນະ
ຖ້າມີຫຼາຍ Feature ໃຊ້ສູດ:

ເມື່ອຮູ້ສູດຂອງສົມຜົນເສັ້ນຊື່ຖົດຖອຍແລ້ວ ເຮົາຈະໃຊ້ມັນໄປເຮັດຫຍັງໃນ ML ? ສະນັ້ນ, ເຮົາຈຶ່ງຕໍ່ຫົວຂໍ້ຕໍ່ໄປຄື:
Training and Loss
- Training: ແມ່ນຂັ້ນຕອນການສອນ ML, ເຊິ່ງເປັນຂັ້ນຕອນຫາ ນ້ຳໜັກ ( weight ) ແລະ ຄ່າຜິດດ່າງ ( bias ) ໃຫ້ເໝາະສົມທີ່ສຸດໂດຍການຮຽນຮູ້ຂໍ້ມູນແບບຢ່າງຈາກຕົວຢ່າງທີ່ຮູ້ຜົນ ( labeled example ).
ອີກຢ່າງໜຶ່ງຄື ໃນທາງ Supervised Machine Learning, ເວລາເຮົາໃຊ້ Model ໄປກວດສອບຕົວຢ່າງຫຼາຍໆອັນ ແລະພະຍາຍາມເຝັ້ນໃຫ້ໄດ້ມາເຊິ່ງ Model ທີ່ສາມາດຫຼຸດຜ່ອນຄ່າ Loss ລົງ, ເອີ້ນວ່າ Empirical Loss Minimization(ການຫຼຸດຄ່າຜິດພາດຈາກການສັງເກດ)
Loss: ແມ່ນຄ່າທີ່ອ້າງເຖິງຄວາມບໍ່ຖືກຕ້ອງໃນການພະຍາກອນ ( Prediction ) ເວົ້າງ່າຍໆແມ່ນ ຄ່າຜິດພາດ.
ມາລອງເບິ່ງຕົວຢ່າງ, Linear Regression ທີ່ມີ 2 ແບບ ເຊິ່ງໂຕໃດຈະເປັນ Model ທີ່ດີກວ່າກັນ?

ສັງເກດຕົວແບບຂອງສົມຜົນເສັ້ນຊື່ຖົດຖອຍທັງ 2 ຄື: ເບື້ອງຊ້າຍ ແລະຂວາ
ລູກສອນສີແດງ: ໄລຍະຫ່າງລະຫວ່າງ ເມັດ ແລະເສັ້ນຊື່(Model)
ເສັ້ນຊື່ສີຟ້າ: ແມ່ນ Model ຂອງ Linear Regression
ຊ້າຍ: ລູກສອນສີແດງຊີ້ຫາເສັ້ນສີຟ້າ ແມ່ນມີຄວາມຍາວຫຼາຍ.
ຂວາ: ມີລູກສອນສີແດງແມ່ນສັ້ນຫຼາຍ ເມື່ອຊີ້ໄປຫາເສັ້ນສີຟ້າ.
ເຊິ່ງຄວາມຍາວຂອງລູກສອນນັ້ນເອງທີ່ເປັນ ຄ່າຜິດດ່ຽງ Loss ສະນັ້ນ, ເຮົາສາມາດຕອບໄດ້ວ່າ Model ຂອງເບື້ອງຂວາແມ່ນ ດີກວ່າ.
- ຈຸດປະສົງຂອງການ Train Model ແມ່ນເພື່ອຊອກຄ່ານ້ຳໜັກຂອງຄຸນລັກສະນະ ( weight ) ແລະຄ່າ bias ເພື່ອໃຫ້ເປັນເຮັດໃຫ້ມີ Loss ໜ້ອຍທີ່ສຸດ
- ເຮົາກໍຕ້ອງມີສູດຄິດໄລ່ຄ່າ Loss ເພິ່ນເອີ້ນວ່າ Loss Function. ເຊິ່ງເພິ່ນສະເໜີມາ 2 ສູດຄື:
- Squared Loss (L2Loss) : ສູດຄິດໄລ່ຄ່າ Loss ຍົກກຳລັງສອງ.
L2Loss = (ຜົນຕ່າງຂອງຜົນຮັບຕົວຈິງ ແລະ ຜົນການພະຍາກອນ ) = ( ຜົນຮັບຕົວຈິງ — ຜົນການພະຍາກອນ )2 :

2. Mean Squared Error(MSE): ສູດຄິດໄລ່ຄ່າສະເລ່ຍຂອງ Loss ໃນຊຸດຂໍ້ມູນ.

y’ : prediction(x) ຜົນການພະຍາກອນ x
y : ຜົນໄດ້ຮັບຂອງຕົວຢ່າງ
Key Term:
bias : ຄ່າຜິດດ່ຽງ ຫຼື ຈຸດຕັດ Y
inference : ການສະຫຼຸບຜົນໄດ້ຮັບ ຈາກການພະຍາກອນ
linear regression : ສົມຜົນເສັ້ນຊື່ຖົດຖອຍ
weight : ຄ່ານ້ຳໜັກຂອງ Feature
