ທິດສະດີ Descending into ML [ Machine Learning Crash Course ] :

No Rattanavong
Sep 2, 2018 · 3 min read

ມີເນື້ອໃນເວົ້າເຖິງ 2 ຫົວຂໍ້ຫຼັກໆຄື:

Linear Regression

Linear Regression: ແມ່ນສົມຜົນເສັ້ນຊື່ຖົດຖອຍທີ່ເວົ້າເຖິງຄວາມສຳພັນຂອງຄ່າທີ່ຮັບເຂົ້າມາ ( ຕົວປ່່ຽນຕົ້ນ x ) ແລະຜົນໄດ້ຮັບ ( ຕົວປ່ຽນຕາມ y )

ມີຮູບຮ່າງຄື:

x : ຕົວປ່ຽນທີ່ຮັບເຂົ້າມາ ( input )

y : ແມ່ນຜົນໄດ້ຮັບທີ່ຄາດການ( Output )

m : ແມ່ນຄ່າຄວາມໂຄ້ງ ຫຼື ຄວາມຊັນ

b: ຄ່າຄົງທີ່ ( ຈຸດຕັດ y )

m = Δy / Δx

ເມື່ອຂຽນຢູ່ໃນຮູບຮ່າງຂອງ Machine Learning ຈະເປັນແບບນີ້:

y ’ : ແມ່ນ Output ທີ່ຜ່ານການຄາດເດົາ

b : bias ( ຈຸດຕັດ y ) ບາງເທື່ອ b = w0

x1 : ຄ່າຄຸນລັກສະນະ feature 1

w1 : weight = ຄ່ານ້ຳໜັກຂອງລັກສະນະ

ຖ້າມີຫຼາຍ Feature ໃຊ້ສູດ:

ເມື່ອຮູ້ສູດຂອງສົມຜົນເສັ້ນຊື່ຖົດຖອຍແລ້ວ ເຮົາຈະໃຊ້ມັນໄປເຮັດຫຍັງໃນ ML ? ສະນັ້ນ, ເຮົາຈຶ່ງຕໍ່ຫົວຂໍ້ຕໍ່ໄປຄື:


Training and Loss

  • Training: ແມ່ນຂັ້ນຕອນການສອນ ML, ເຊິ່ງເປັນຂັ້ນຕອນຫາ ນ້ຳໜັກ ( weight ) ແລະ ຄ່າຜິດດ່າງ ( bias ) ໃຫ້ເໝາະສົມທີ່ສຸດໂດຍການຮຽນຮູ້ຂໍ້ມູນແບບຢ່າງຈາກຕົວຢ່າງທີ່ຮູ້ຜົນ ( labeled example ).

ອີກຢ່າງໜຶ່ງຄື ໃນທາງ Supervised Machine Learning, ເວລາເຮົາໃຊ້ Model ໄປກວດສອບຕົວຢ່າງຫຼາຍໆອັນ ແລະພະຍາຍາມເຝັ້ນໃຫ້ໄດ້ມາເຊິ່ງ Model ທີ່ສາມາດຫຼຸດຜ່ອນຄ່າ Loss ລົງ, ເອີ້ນວ່າ Empirical Loss Minimization(ການຫຼຸດຄ່າຜິດພາດຈາກການສັງເກດ)

Loss: ແມ່ນຄ່າທີ່ອ້າງເຖິງຄວາມບໍ່ຖືກຕ້ອງໃນການພະຍາກອນ ( Prediction ) ເວົ້າງ່າຍໆແມ່ນ ຄ່າຜິດພາດ.

ມາລອງເບິ່ງຕົວຢ່າງ, Linear Regression ທີ່ມີ 2 ແບບ ເຊິ່ງໂຕໃດຈະເປັນ Model ທີ່ດີກວ່າກັນ?

ຕົວຢ່າງ ກຣາຟຂອງສົມຜົນເສັ້ນຊື່ຖົດຖອຍ

ສັງເກດຕົວແບບຂອງສົມຜົນເສັ້ນຊື່ຖົດຖອຍທັງ 2 ຄື: ເບື້ອງຊ້າຍ ແລະຂວາ

ລູກສອນສີແດງ: ໄລຍະຫ່າງລະຫວ່າງ ເມັດ ແລະເສັ້ນຊື່(Model)

ເສັ້ນຊື່ສີຟ້າ: ແມ່ນ Model ຂອງ Linear Regression

ຊ້າຍ: ລູກສອນສີແດງຊີ້ຫາເສັ້ນສີຟ້າ ແມ່ນມີຄວາມຍາວຫຼາຍ.

ຂວາ: ມີລູກສອນສີແດງແມ່ນສັ້ນຫຼາຍ ເມື່ອຊີ້ໄປຫາເສັ້ນສີຟ້າ.

ເຊິ່ງຄວາມຍາວຂອງລູກສອນນັ້ນເອງທີ່ເປັນ ຄ່າຜິດດ່ຽງ Loss ສະນັ້ນ, ເຮົາສາມາດຕອບໄດ້ວ່າ Model ຂອງເບື້ອງຂວາແມ່ນ ດີກວ່າ.


  • ຈຸດປະສົງຂອງການ Train Model ແມ່ນເພື່ອຊອກຄ່ານ້ຳໜັກຂອງຄຸນລັກສະນະ ( weight ) ແລະຄ່າ bias ເພື່ອໃຫ້ເປັນເຮັດໃຫ້ມີ Loss ໜ້ອຍທີ່ສຸດ
  • ເຮົາກໍຕ້ອງມີສູດຄິດໄລ່ຄ່າ Loss ເພິ່ນເອີ້ນວ່າ Loss Function. ເຊິ່ງເພິ່ນສະເໜີມາ 2​ ສູດຄື:
  1. Squared Loss (L2Loss) : ສູດຄິດໄລ່ຄ່າ Loss ຍົກກຳລັງສອງ.

L2Loss = (ຜົນຕ່າງຂອງຜົນຮັບຕົວຈິງ ແລະ ຜົນການພະຍາກອນ ) = ( ຜົນຮັບຕົວຈິງ — ຜົນການພະຍາກອນ )2 :


2. Mean Squared Error(MSE): ສູດຄິດໄລ່ຄ່າສະເລ່ຍຂອງ Loss ໃນຊຸດຂໍ້ມູນ.

y’ : prediction(x) ຜົນການພະຍາກອນ x

y : ຜົນໄດ້ຮັບຂອງຕົວຢ່າງ


Key Term:

: ຄ່າຜິດດ່ຽງ ຫຼື ຈຸດຕັດ Y

: ການສະຫຼຸບຜົນໄດ້ຮັບ ຈາກການພະຍາກອນ

: ສົມຜົນເສັ້ນຊື່ຖົດຖອຍ

: ຄ່ານ້ຳໜັກຂອງ Feature

No Rattanavong

Written by

#ContentLover #VideoEditor #Book #Creativity #Technology #Photography #Inspiration

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade