เมื่อใดเราถึงควรใช้ Machine Learning แก้ปัญหา 🤔 ?
จากส่วนหนึ่งของหนังสือ O’Reilly Designing Machine Learning System ที่เขียนโดยคุณ Chip Huyen
ข้อควรระวัง: ML ไม่ควรใช้ถ้าไม่มีจริยธรรม มีวิธีแก้ปัญหาที่ง่ายกว่า หรือไม่คุ้มทุน แต่อาจแบ่งปัญหาเป็นส่วนย่อยและใช้ ML แก้บางส่วนได้
ไม่ควรละเลย ML เพียงเพราะยังไม่คุ้มทุนในตอนนี้ เพราะเทคโนโลยีมักพัฒนาทีละน้อย การรอให้คนอื่นพิสูจน์ก่อนอาจ ทำให้ตามหลังคู่แข่งหลายปี
ว่าด้วยเรื่องของคำถามที่ว่า เมื่อใดเราถึงจะควรใช้ ML ในการแก้ปัญหาต่างๆ ในธุรกิจ
ซึ่ง ML ได้พิสูจน์แล้วว่ามันสามารถเป็นเครื่องมือ ที่ทรงพลังสำหรับโจทย์ทางธุรกิจที่หลากหลายได้ และได้สร้างความตื่นเต้นและตื่นตัวให้กับผู้คนทั้งในและนอกวงการอย่างมากมาย
แต่เดี๋ยวก่อน !!!
🧠 ML หน่ะ มันก็ไม่ใช่เครื่องมือวิเศษที่จะสามารถ แก้ปัญหาได้ทั้งหมดหรอกนะ เพราะ ปัญหาที่ ML ช่วยได้ก็อาจจะไม่ใช่ Solution ที่เหมาะสมที่สุดก็ได้ ก่อนเริ่ม Project เราอาจจะต้องถามตัวเองก่อนว่า ML จำเป็นหรือคุ้มค่ามากน้อยแค่ไหน เพื่อทำความเข้าใจว่า ML ทำอะไรได้บ้าง ลองดูนิยามนี้:
แมชชีนเลิร์นนิ่ง คือ กระบวนวิธีในการ เรียนรู้ รูปแบบที่ซับซ้อน จากข้อมูลที่มีอยู่ และใช้รูปแบบเหล่านี้เพื่อทำการ คาดการณ์หรือทำนายกับข้อมูลใหม่ ที่ไม่เคยเห็นมาก่อน
จากข้อความด้านบน เราจะมาแกะดูแต่ละคีย์เวิร์ดกัน เพื่อที่เราจะได้เข้าใจว่า ปัญหาแบบไหนที่ ML ช่วยเราได้ และปัญหาแบบไหนที่ ML ช่วยเราไม่ได้
การเรียนรู้: ระบบ ML ต้องสามารถเรียนรู้ได้
ต่างจากฐานข้อมูลทั่วไปที่ไม่มีความสามารถนี้ ML เรียนรู้จากข้อมูล ในการเรียนรู้แบบมีผู้สอน ML เรียนรู้จากคู่ของอินพุตและเอาต์พุตตัวอย่าง เช่น การทำนายราคาเช่า Airbnb จากลักษณะต่างๆ ของที่พัก เมื่อเรียนรู้แล้ว ระบบควรสามารถทำนายราคาของที่พักใหม่ได้
รูปแบบที่ซับซ้อน: ML มีประโยชน์เมื่อมีรูปแบบซับซ้อนให้เรียนรู้
เช่น การกำหนดราคาหุ้น แต่ไม่เหมาะกับการทำนายผลลูกเต๋า บางครั้งรูปแบบอาจไม่ชัดเจน ต้องทดลองจริงจึงจะรู้ว่า ML เหมาะกับงานที่มีความสัมพันธ์ซับซ้อน เช่น การคำนวณราคาเช่าบ้านจากปัจจัยต่างๆ แทนที่จะใช้กฎตายตัว ML สามารถเรียนรู้รูปแบบจากข้อมูลได้เอง
ข้อมูลที่มีอยู่: ML ต้องการข้อมูลในการเรียนรู้ มีอยู่แล้ว หรือหาได้
แม้ในการเรียนรู้แบบ zero-shot ที่ไม่ต้องการข้อมูลเฉพาะงาน แต่ก็ต้องเคยเรียนรู้จากข้อมูลงานอื่นมาก่อน บางครั้งอาจเปิดตัวระบบ ML โดยไม่มีข้อมูล แล้วให้เรียนรู้จากข้อมูลจริง แต่อาจเสี่ยงต่อประสบการณ์ลูกค้าที่ไม่ดี บางบริษัทใช้วิธีปลอมเป็น AI ไปก่อน แล้วค่อยเก็บข้อมูลมาสร้างโมเดลจริงภายหลัง
การทำนาย: เฉพาะปัญหาที่ทำนายได้
ML แก้ปัญหาที่ต้องการคำตอบเชิงทำนายได้ดี เช่น พยากรณ์อากาศ ทำนายผู้ชนะการแข่งขัน หรือแนะนำหนังที่ผู้ใช้อาจชอบ ปัจจุบันปัญหาหลายอย่างถูกปรับให้เป็นปัญหาเชิงทำนาย แม้แต่คำถามเกี่ยวกับอดีตก็สามารถตั้งเป็น “คำตอบจะเป็นอย่างไร?” ML ยังช่วยประมาณผลลัพธ์ของการคำนวณที่ซับซ้อนได้เร็วกว่า เช่น ในงานกราฟิก
ข้อมูลที่ไม่เคยเห็น: ต้องมี Pattern แบบเดียวกับข้อมูลชุดฝึก
โมเดล ML จะทำงานได้ดีเมื่อข้อมูลใหม่มีรูปแบบคล้ายกับข้อมูลฝึกฝน เช่น โมเดลทำนายการดาวน์โหลดแอพปี 2020 จะไม่ทำงานดีถ้าฝึกด้วยข้อมูลปี 2008 ในทางเทคนิค ข้อมูลใหม่และข้อมูลฝึกฝนควรมีการกระจายตัวคล้ายกัน แม้เราไม่รู้การกระจายตัวของข้อมูลใหม่ แต่เราสามารถตั้งสมมติฐานได้ ถ้าสมมติฐานผิด โมเดลอาจทำงานแย่ลง ซึ่งเราสามารถตรวจพบได้จากการเฝ้าสังเกตและทดสอบ
งานที่ทำซ้ำๆ: มีข้อมูลซ้ำจำนวนมาก
ML ต้องการตัวอย่างมากในการเรียนรู้รูปแบบ ต่างจากมนุษย์ที่เรียนรู้ได้เร็วกว่า งานที่ทำซ้ำๆ จะช่วยให้ ML เรียนรู้ได้ง่ายขึ้น เพราะแต่ละรูปแบบจะถูกทำซ้ำหลายครั้ง
ต้นทุนการทำนายผิดต่ำ: เมื่อทำนายพลาดต้องเสียหายน้อย
ML เหมาะกับงานที่ต้นทุนการทำนายผิดต่ำ เช่น ระบบแนะนำสินค้า ถ้าแนะนำผิดผู้ใช้แค่ไม่คลิก แต่ถ้าการทำนายผิดมีผลร้ายแรง ML อาจยังเหมาะสมถ้าโดยเฉลี่ยแล้วประโยชน์จากการทำนายถูกมากกว่าต้นทุนจากการทำนายผิด เช่น การพัฒนารถยนต์ไร้คนขับ
ใช้งานในระดับใหญ่: Project ต้องคุ้มค่า และขยายขนาดได้ (At Scale)
ML ต้องการการลงทุนสูงในด้านข้อมูล การคำนวณ โครงสร้างพื้นฐาน และบุคลากร จึงควรใช้กับงานที่ต้องทำการทำนายจำนวนมาก เช่น คัดแยกอีเมลหลายล้านฉบับต่อปี หรือจัดการตั๋วสนับสนุนหลายพันใบต่อวัน บางปัญหาอาจดูเหมือนทำนายครั้งเดียว แต่จริงๆ แล้วเป็นการทำนายต่อเนื่อง เช่น การทำนายผลเลือกตั้งประธานาธิบดีสหรัฐฯ
รูปแบบเปลี่ยนแปลงตลอด: เหมาะกับโจทย์งานที่มีรูปแบบเปลี่ยนแปลงตลอดเวลา
วัฒนธรรม รสนิยม และเทคโนโลยีเปลี่ยนแปลงตลอดเวลา ทำให้รูปแบบเปลี่ยนไปด้วย เช่น ลักษณะของอีเมลสแปม ML สามารถปรับตัวกับการเปลี่ยนแปลงได้ง่ายกว่าการเขียนกฎตายตัว เพราะสามารถอัปเดตโมเดลด้วยข้อมูลใหม่ได้ โดยไม่ต้องวิเคราะห์ว่าข้อมูลเปลี่ยนไปอย่างไร