เมื่อใดเราถึงควรใช้ Machine Learning แก้ปัญหา 🤔 ?

จากส่วนหนึ่งของหนังสือ O’Reilly Designing Machine Learning System ที่เขียนโดยคุณ Chip Huyen

fr4nk.xyz
myorder
2 min readSep 25, 2024

--

ข้อควรระวัง: ML ไม่ควรใช้ถ้าไม่มีจริยธรรม มีวิธีแก้ปัญหาที่ง่ายกว่า หรือไม่คุ้มทุน แต่อาจแบ่งปัญหาเป็นส่วนย่อยและใช้ ML แก้บางส่วนได้

ไม่ควรละเลย ML เพียงเพราะยังไม่คุ้มทุนในตอนนี้ เพราะเทคโนโลยีมักพัฒนาทีละน้อย การรอให้คนอื่นพิสูจน์ก่อนอาจ ทำให้ตามหลังคู่แข่งหลายปี

ว่าด้วยเรื่องของคำถามที่ว่า เมื่อใดเราถึงจะควรใช้ ML ในการแก้ปัญหาต่างๆ ในธุรกิจ

ซึ่ง ML ได้พิสูจน์แล้วว่ามันสามารถเป็นเครื่องมือ ที่ทรงพลังสำหรับโจทย์ทางธุรกิจที่หลากหลายได้ และได้สร้างความตื่นเต้นและตื่นตัวให้กับผู้คนทั้งในและนอกวงการอย่างมากมาย

แต่เดี๋ยวก่อน !!!

🧠 ML หน่ะ มันก็ไม่ใช่เครื่องมือวิเศษที่จะสามารถ แก้ปัญหาได้ทั้งหมดหรอกนะ เพราะ ปัญหาที่ ML ช่วยได้ก็อาจจะไม่ใช่ Solution ที่เหมาะสมที่สุดก็ได้ ก่อนเริ่ม Project เราอาจจะต้องถามตัวเองก่อนว่า ML จำเป็นหรือคุ้มค่ามากน้อยแค่ไหน เพื่อทำความเข้าใจว่า ML ทำอะไรได้บ้าง ลองดูนิยามนี้:

แมชชีนเลิร์นนิ่ง คือ กระบวนวิธีในการ เรียนรู้ รูปแบบที่ซับซ้อน จากข้อมูลที่มีอยู่ และใช้รูปแบบเหล่านี้เพื่อทำการ คาดการณ์หรือทำนายกับข้อมูลใหม่ ที่ไม่เคยเห็นมาก่อน

จากข้อความด้านบน เราจะมาแกะดูแต่ละคีย์เวิร์ดกัน เพื่อที่เราจะได้เข้าใจว่า ปัญหาแบบไหนที่ ML ช่วยเราได้ และปัญหาแบบไหนที่ ML ช่วยเราไม่ได้

การเรียนรู้: ระบบ ML ต้องสามารถเรียนรู้ได้

ต่างจากฐานข้อมูลทั่วไปที่ไม่มีความสามารถนี้ ML เรียนรู้จากข้อมูล ในการเรียนรู้แบบมีผู้สอน ML เรียนรู้จากคู่ของอินพุตและเอาต์พุตตัวอย่าง เช่น การทำนายราคาเช่า Airbnb จากลักษณะต่างๆ ของที่พัก เมื่อเรียนรู้แล้ว ระบบควรสามารถทำนายราคาของที่พักใหม่ได้

รูปแบบที่ซับซ้อน: ML มีประโยชน์เมื่อมีรูปแบบซับซ้อนให้เรียนรู้

เช่น การกำหนดราคาหุ้น แต่ไม่เหมาะกับการทำนายผลลูกเต๋า บางครั้งรูปแบบอาจไม่ชัดเจน ต้องทดลองจริงจึงจะรู้ว่า ML เหมาะกับงานที่มีความสัมพันธ์ซับซ้อน เช่น การคำนวณราคาเช่าบ้านจากปัจจัยต่างๆ แทนที่จะใช้กฎตายตัว ML สามารถเรียนรู้รูปแบบจากข้อมูลได้เอง

https://www.oreilly.com/library/view/designing-machine-learning/9781098107956/ch01.html

ข้อมูลที่มีอยู่: ML ต้องการข้อมูลในการเรียนรู้ มีอยู่แล้ว หรือหาได้

แม้ในการเรียนรู้แบบ zero-shot ที่ไม่ต้องการข้อมูลเฉพาะงาน แต่ก็ต้องเคยเรียนรู้จากข้อมูลงานอื่นมาก่อน บางครั้งอาจเปิดตัวระบบ ML โดยไม่มีข้อมูล แล้วให้เรียนรู้จากข้อมูลจริง แต่อาจเสี่ยงต่อประสบการณ์ลูกค้าที่ไม่ดี บางบริษัทใช้วิธีปลอมเป็น AI ไปก่อน แล้วค่อยเก็บข้อมูลมาสร้างโมเดลจริงภายหลัง

การทำนาย: เฉพาะปัญหาที่ทำนายได้

ML แก้ปัญหาที่ต้องการคำตอบเชิงทำนายได้ดี เช่น พยากรณ์อากาศ ทำนายผู้ชนะการแข่งขัน หรือแนะนำหนังที่ผู้ใช้อาจชอบ ปัจจุบันปัญหาหลายอย่างถูกปรับให้เป็นปัญหาเชิงทำนาย แม้แต่คำถามเกี่ยวกับอดีตก็สามารถตั้งเป็น “คำตอบจะเป็นอย่างไร?” ML ยังช่วยประมาณผลลัพธ์ของการคำนวณที่ซับซ้อนได้เร็วกว่า เช่น ในงานกราฟิก

ข้อมูลที่ไม่เคยเห็น: ต้องมี Pattern แบบเดียวกับข้อมูลชุดฝึก

โมเดล ML จะทำงานได้ดีเมื่อข้อมูลใหม่มีรูปแบบคล้ายกับข้อมูลฝึกฝน เช่น โมเดลทำนายการดาวน์โหลดแอพปี 2020 จะไม่ทำงานดีถ้าฝึกด้วยข้อมูลปี 2008 ในทางเทคนิค ข้อมูลใหม่และข้อมูลฝึกฝนควรมีการกระจายตัวคล้ายกัน แม้เราไม่รู้การกระจายตัวของข้อมูลใหม่ แต่เราสามารถตั้งสมมติฐานได้ ถ้าสมมติฐานผิด โมเดลอาจทำงานแย่ลง ซึ่งเราสามารถตรวจพบได้จากการเฝ้าสังเกตและทดสอบ

งานที่ทำซ้ำๆ: มีข้อมูลซ้ำจำนวนมาก

ML ต้องการตัวอย่างมากในการเรียนรู้รูปแบบ ต่างจากมนุษย์ที่เรียนรู้ได้เร็วกว่า งานที่ทำซ้ำๆ จะช่วยให้ ML เรียนรู้ได้ง่ายขึ้น เพราะแต่ละรูปแบบจะถูกทำซ้ำหลายครั้ง

ต้นทุนการทำนายผิดต่ำ: เมื่อทำนายพลาดต้องเสียหายน้อย

ML เหมาะกับงานที่ต้นทุนการทำนายผิดต่ำ เช่น ระบบแนะนำสินค้า ถ้าแนะนำผิดผู้ใช้แค่ไม่คลิก แต่ถ้าการทำนายผิดมีผลร้ายแรง ML อาจยังเหมาะสมถ้าโดยเฉลี่ยแล้วประโยชน์จากการทำนายถูกมากกว่าต้นทุนจากการทำนายผิด เช่น การพัฒนารถยนต์ไร้คนขับ

ใช้งานในระดับใหญ่: Project ต้องคุ้มค่า และขยายขนาดได้ (At Scale)

ML ต้องการการลงทุนสูงในด้านข้อมูล การคำนวณ โครงสร้างพื้นฐาน และบุคลากร จึงควรใช้กับงานที่ต้องทำการทำนายจำนวนมาก เช่น คัดแยกอีเมลหลายล้านฉบับต่อปี หรือจัดการตั๋วสนับสนุนหลายพันใบต่อวัน บางปัญหาอาจดูเหมือนทำนายครั้งเดียว แต่จริงๆ แล้วเป็นการทำนายต่อเนื่อง เช่น การทำนายผลเลือกตั้งประธานาธิบดีสหรัฐฯ

รูปแบบเปลี่ยนแปลงตลอด: เหมาะกับโจทย์งานที่มีรูปแบบเปลี่ยนแปลงตลอดเวลา

วัฒนธรรม รสนิยม และเทคโนโลยีเปลี่ยนแปลงตลอดเวลา ทำให้รูปแบบเปลี่ยนไปด้วย เช่น ลักษณะของอีเมลสแปม ML สามารถปรับตัวกับการเปลี่ยนแปลงได้ง่ายกว่าการเขียนกฎตายตัว เพราะสามารถอัปเดตโมเดลด้วยข้อมูลใหม่ได้ โดยไม่ต้องวิเคราะห์ว่าข้อมูลเปลี่ยนไปอย่างไร

Ref.

--

--

fr4nk.xyz
myorder

I'm passionate in Information Processor and interested Computational linguistics & Embedded System