Tech Tips for Life: Confusion Matrix กุญแจสู่ความแม่นยำในการวิเคราะห์ข้อมูลประเภท Classification

MingMing Jantima Boonruethairat
SCB TechX
Published in
2 min readAug 2, 2024

Tech Tips วันนี้ขอเชิญ Data Analytics จาก SCB TechX คุณกอล์ฟ เมธี ประเสริฐกิจพันธุ์ มาช่วยแนะนำเทคนิคการประเมินประสิทธิภาพของ Machine Learning ด้วย Confusion matrix โดยตารางนี้จะทำงานร่วมกับชุดข้อมูลที่เราทราบผลจริงแล้ว โดยจะเปรียบเทียบค่าจริง กับค่าที่คาดการณ์จากโมเดล ซึ่งก่อนอื่นขอพาทุกท่านไปรู้จักองค์ประกอบของตาราง (แสดงในตารางที่ 1) ดังนี้:

1. True Negative (TN): คือจำนวนครั้งที่โมเดลทำนายว่าไม่ใช่ และจริงๆแล้วก็ไม่ใช่ เช่น Model ทำนายว่าผู้ชายไม่ได้ท้อง (Negative) ซึ่งผลจริงคือผู้ชายไม่ได้ท้อง (True)

2. False Positive (FP) หรือ Type 1 error: จำนวนครั้งที่โมเดลทำนายว่าเป็น แต่จริงๆแล้วไม่ใช่ เช่น Model ทำนายว่าผู้ชายท้อง (Positive) ซึ่งผลจริงคือผู้ชายไม่ได้ท้อง (False)

3. False Negative (FN) หรือ Type 2 error: จำนวนครั้งที่โมเดลทำนายว่าไม่ใช่ แต่จริงๆแล้วเป็น เช่น ทำนายว่าผู้หญิงไม่ได้ท้อง (Negative) ซึ่งผลจริงคือผู้หญิงท้อง (False)

4. True Positive (TP): จำนวนครั้งที่โมเดลทำนายว่าเป็น และจริงๆแล้วก็เป็น เช่น Model ทำนายว่าผู้หญิงท้อง (Positive) ซึ่งผลจริงคือ ผู้หญิงท้อง (True)

จากตารางที่ 1 มี 4 วิธีให้เลือกคำนวณประสิทธิภาพของโมเดลและเราควรเลือกใช้วิธีใดคำตอบอยู่ที่นี่แล้วค่ะ

1. Accuracy เหมาะกับการวัดประสิทธิภาพทั่วไปของโมเดลโดยไม่คำนึงถึงประเภทของข้อผิดพลาด

2. Precision เหมาะกับสถานการณ์ที่ความผิดพลาดในการทำนายผลเป็นเรื่องสำคัญ เช่น การทำนายอีเมลที่สำคัญว่าเป็นสแปม

3. Recall เหมาะสำหรับใช้ในกรณีที่ผลการทำนายผิดพลาดอาจนำไปสู่ผลกระทบร้ายแรง นิยมใช้ Metrix วัดกับ Model ที่ทำนายผลลัพธ์ในทางการแพทย์ (Save Life) โดยต้องการให้ค่า Recall สูงๆ เช่น การทำนายว่าบุคคลไม่ติดเชื้อ HIV แต่จริงๆ แล้วติดเชื้อ

4. F1-Score ใช้พิจารณาความสมดุลระหว่าง Precision และ Recall ซึ่งเหมาะสมในการวิเคราะห์ที่ต้องการความแม่นยำและความครอบคลุมทั้งสองด้าน เช่น การวิเคราะห์หุ้น เป็นต้น

Confusion matrix เป็นเครื่องมือที่ใช้วัดประสิทธิภาพของโมเดล Machine Learning โดยเปรียบเทียบผลลัพธ์ที่คาดการณ์กับผลลัพธ์จริง ซึ่งจะช่วยให้เราทราบถึงความถูกต้องและประเภทของข้อผิดพลาดที่เพื่อนำไปปรับปรุงโมเดลให้เหมาะสมยิ่งขึ้นต่อไป

ท้ายนี้บริษัท SCB TechX ให้บริการด้านการจัดการข้อมูลแบบครบวงจร TechX Data & AI Solutions ที่คิดค้นและออกแบบโดยผู้เชี่ยวชาญที่มีประสบการณ์ตรงในการพัฒนา และ Deliver Data ให้แก่องค์กรชั้นนำมากมาย

หากท่านใดสนใจสามารถสอบถามข้อมูลเพิ่มเติมได้ที่ contact@scbtechx.io
อ่านรายละเอียดเพิ่มเติมที่ https://bit.ly/3Q2a9vd

--

--