เล่า AI ให้เห็นภาพ ตอนที่ 2 -Train/Test กับการเดิมพัน Playstation 5 ของ ด.ช. มานะ

Dr. Winn Voravuthikunchai
Apr 3 · 3 min read

สำหรับ serie นี้จะพยายามอธิบายเรื่อง AI ปูพื้นจาก 0 ให้สามารถเข้าใจกันได้ง่าย ๆ นะครับ ตอนนี้ก็จะเป็นตอนที่ 2 ครับ

ทบทวนเรื่อง Classification

  • ในการทำ Classification คือการใช้ Machine Learning เพื่อเรียนรู้ที่จะจำแนกของต่าง ๆ เช่น รูปหมา รูปแมว หรือว่า ข้อมูลนี้เป็น fraud อีเมลล์นี้เป็น spam เป็นต้น
  • สิ่งที่เราจะทำก็คือ การป้อนข้อมูลในอดีตที่สะสมมาที่มีเฉลย (training set) เช่น รูปที่ติด tag ว่าเป็นหมา หรือ อีเมลล์ที่ระบุและมีการตรวจสอบจากคนแล้วเป็น spam ให้ algorithm ทาง Machine Learning เรียนรู้ ที่เราจะเรียกว่าการ train model
  • การ train model คือการปรับ parameter W ต่าง ๆ ในสมการคณิตศาสตร์ y = f(w1x1 + w2x2 + w3x3 + …) จากสมการ x เรียกว่า feature ซึ่งอาจจะเป็น pixel ที่ตำแหน่งต่าง ๆ ของรูปภาพ และ w คือ parameter ส่วน y คือ เฉลย
  • ในการ train model เราจะป้อน y และ x คือเอารูปภาพหมา นั่นคือ x และ tag ของรูปหมา คือ y ใส่เข้าไปหลาย ๆ ภาพ เพื่อให้ Algorithm หาค่า w ต่าง ๆ ที่เหมาะสม
  • เมื่อการ train จบแล้ว เราก็จะได้ w ทั้งหมดออกมา เรียกว่า model
  • และเมื่อมีรูปภาพใหม่มา นั่นคือ x เราก็จะสามารถ ใช้ w กับ x ในการคำนวณ​ y

สรุปคือ

  • ในช่วงการเทรน เราจะป้อน y กับ x เพื่อหา w
  • ในช่วงการนำไปใช้ เราจะป้อน w กับ x เพื่อทำนาย y

— — — — — — — — — — —

Train Test เพื่อวัดความเก่ง ก่อนลงสนามจริง

การทำกระบวนการข้างบน เรามักจะแบ่งข้อมูลที่มีเฉลยออกเป็น 2 ส่วน ส่วนที่ 1 ไว้ train model ส่วนที่ 2 ไว้ test model ที่ต้องทำแบบนี้ก็เพราะ ก่อนที่จะนำ model ไปใช้งานจริง ๆ เราควรจะต้องรู้ก่อนว่า model เก่งแค่ไหน สมมติว่า เราจะทำระบบตรวจมะเร็งปอด ถ้าเราเอาข้อมูลทั้งหมดมาใช้ train model แล้ว deploy เอาไปใช้งานจริง โดยที่เรายังไม่ได้มีการทดสอบมาเลยว่าแม่นยำแค่ไหน ถ้าเกิด model เราตรวจจับผิดขึ้นมา ทุกคนก็คงจะเห็นถึงผลกระทบใช่มั้ยครับ

เราจะได้ยินคำว่า training set, train set, test set, fit model, test model ผมจะโยงกับการสอบของนักเรียนให้ฟัง เพื่อให้ทุกคนนึกตามได้

  • ด.ช. มานะ อยากจะได้ Playstation 5 มาก พ่อบอกว่าถ้าสอบเลขได้เกรด 4 พ่อจะซื้อให้
  • ด.ช. มานะตั้งใจมาก ๆ ว่าจะต้องสอบให้ได้ เพราะถ้าพลาดครั้งนี้ก็จะอด และต้องรออีก 1 เทอมกว่าจะได้มีโอกาสอีก
  • ด.ช.มานะ ได้ยินมาว่า คุณครูพิศมัยที่ออกข้อสอบเลข มักจะออกแนวข้อสอบเดิม ๆ ไม่ได้พลิกแพลงนัก ก็แค่เปลี่ยนตัวเลขบ้าง ถ้าเข้าใจข้อสอบเดิม ๆ ก็โอเค
  • ด.ช. มานะจึงขอข้อสอบจากรุ่นพี่ปิติ ก็ได้ข้อสอบปีที่แล้วมา 100 ข้อ พร้อมเฉลย (เรียกว่า training data)
  • ก่อนที่จะลงมือทำข้อสอบปีที่แล้ว ด.ช. มานะ เอาข้อสอบมาสลับ แล้วแบ่งออกเป็น 2 ชุด
  • 80 ข้อ พร้อมเฉลย (เรียกว่า training set)
  • 20 ข้อ ไม่มีเฉลย (เรียกว่า test set)
  • เอา 80 ข้อ มาทำไป พร้อมกับดูเฉลยไป ทำซ้ำ ๆ พยายามที่จะเรียนรู้ให้มากที่สุด (เรียกว่า train model หรือ fit model)
  • เมื่อพร้อมแล้ว ก็หยิบเอา 20 ข้อที่เป็น test set มาทำ
  • ทำเสร็จแล้ว ก็เอาเฉลยมาเทียบว่าถูกทั้งหมดกี่ข้อ (เรียกว่า evaluate model หรือ test model)
  • ถ้าถูกเกิน 16 ข้อ หรือ 80% ก็จะมีความมั่นใจไปเข้าห้องสอบ
  • สาเหตุที่ด.ช.มานะ ต้องทำแบบนี้ เพราะด.ช.มานะต้องการพกความมั่นใจเต็มเปี่ยมว่าจะต้องสอบได้เกิน 80% เพื่อให้ได้ A ถ้าทำข้อสอบ 20 ข้อนั้นได้ไม่ถึง 16 ข้อ ด.ช.มานะ จะต้องรีบไปอ่านหนังสือเพิ่มเติม รีบไปให้เพื่อติว ไม่งั้นก็จะอดได้ Playstation 5

หลักการในการทำ Classification ก็เหมือนกันเลยครับ เอา training data มาแบ่ง เป็น train set กะ test set ใช้ train set ในการ train model และเอา test set มาหาความแม่นยำของ model

คราวหน้าจะมาเล่าต่อเรื่อง cross validation ครับ

— — — — — — — — — — — — — — — — — — — — — — — — -

สำหรับใครที่สนใจ AI สนใจ Data science สามารถ join group Botnoi Classroom ตอนนี้มีสมาชิก 8 พันคน จะคอยอัพเดทเทรนด์ ความรู้ ทางด้าน AI และ Data science แล้วก็คอยประกาศอีเวนท์ หรือเปิดคลาสสอนด้วย

ส่วนหากใครสนใจใช้บริการ BOTNOI ในสร้างแชทบอท หรือให้คำปรึกษาเกี่ยวกับ AI & Data science ติดต่อได้ผ่านเวป -> Botnoi และ FB Page Botnoi Consulting นะครับ

botnoi-classroom

This publication consists of articles related to Data…

Medium is an open platform where 170 million readers come to find insightful and dynamic thinking. Here, expert and undiscovered voices alike dive into the heart of any topic and bring new ideas to the surface. Learn more

Follow the writers, publications, and topics that matter to you, and you’ll see them on your homepage and in your inbox. Explore

If you have a story to tell, knowledge to share, or a perspective to offer — welcome home. It’s easy and free to post your thinking on any topic. Write on Medium

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store