MAE, MSE, RMSE — เลือกใช้ยังไงดีมาลองดูที่ความหมาย

ข้อเปรียบเทียบในการใช้งานของ MSE, RMSE และ MAE สำหรับโจทย์แนว Regression

TL;DR

  • MAE ย่อมาจาก Mean Absolute Error : ค่านี้จะมีความอ่อนไหวกับ Outlier น้อยกว่า MSE และ RMSE เนื่องจากเป็นการนำค่า Error มาใส่ Absolute เฉย ๆ ซึ่งหากพบว่าข้อมูลมี Outlier อยู่เยอะ ค่านี้ก็อาจเหมาะสมกว่าในการนำไปใช้ประเมินประสิทธิภาพของโมเดล
  • MSE ย่อมาจาก Mean Square Error : ค่านี้จะ Sensitive กับ Outlier มากเนื่องจากมีการนำค่า Error มายกกำลังสอง จึงควรระวังในการใช้งานหากข้อมูลมี Outlier เยอะ
  • RMSE ย่อมาจาก Root Mean Square Error : มีคุณสมบัติที่คล้ายกับ MSE แต่มีเพิ่มเติมตรงที่จะนำ MSE มาใส่ Square Root ซึ่งอาจทำให้ตีความง่ายกว่าเนื่องจากหน่วยของค่า Error จะไม่มีเลขยกกำลัง 2 เหมือนกับ MSE
  • ควรระวัง หากจะนำ Metrics ทั้งสามค่าไปใช้ในเชิงเปรียบเทียบ เนื่องจากจำนวนของข้อมูลนั้นก็มีผลทำให้ค่า RMSE และ MAE เปลี่ยนแปลงไปด้วย
Photo by qimono on Pixabay

เมื่อต้องการวัดค่าประสิทธิภาพ (Performance) ของโมเดลจำพวก Regression แล้ว แน่นอนว่า Loss Function ที่ถูกนึกถึงเป็นอันดับแรก ๆ คงหนีไม่พ้น MSE, RMSE หรือ MAE เป็นแน่ แม้ว่าค่าที่ใช้วัดประสิทธิภาพของโมเดลนั้นจะมีอยู่หลายค่าก็ตาม —

แต่แล้วอะไรล่ะ คือความแตกต่างของ Loss Function ทั้ง 3 ตัว..?

จุดร่วมของทั้ง 3

--

--

PCP
ป้า ๆ ขอคุยเรื่อง Data หน่อย

Data scientist | เขียนไปบ่นไป ความในใจของคนสาย Data | My linktree https://cutt.ly/vwFqTLKu | (╯°□°)╯︵ ┻━┻