ทำนายพนักงานที่จะลาออกด้วยเทคนิค Data Mining แบบไม่ต้องเขียน Code ภาค 2 (หาปัจจัยสำคัญที่มีผลต่อการลาออก)

Pichitchai Pimkote
1 min readSep 30, 2018

--

2จากบทความที่แล้ว ทำนายพนักงานที่จะลาออกด้วยเทคนิค Data Mining แบบไม่ต้องเขียน Code

ผลจากโมเดลของเราทำให้เราสามารถทำนายพนักงานที่มีโอกาสที่จะลาออกได้แล้ว

แต่สิ่งที่ควรจะทำในลำดับต่อไปคือ จะแก้ไขปัญหาการลาออกอย่างไร จุดใหนที่ควรจะโฟกัสก่อน อะไรที่เป็นปัจจัยสำคัญ หรือมีผลมากที่สุดของการลาออก

ในการหาความสำคัญของ attribute ว่ามีปัจจัยหรือมีความสำคัญแค่ใหนนั้นสามารถ หาได้หลายวิธี ซึ่งสามารถหาแบบ attribute แยกเดี่ยวๆ หรือแบบกลุ่ม (ดูแบบเดี่ยวอาจไม่สำคัญ แต่ถ้าจับคู่กับ attribute อื่นด้วยกลับมาความสำคัญมาก เป็นต้น)

เรายังจะใช้งาน RapidMiner อีกเช่นเคย โดยแก้ไข Process จากบทความที่แล้วให้เป็นตามภาพ

  1. โดยเพิ่ม Operator “Weight by Information Gain” เพื่อใช้คำนวน weight ของ attribute ด้วยเทคนิค Information Gain
  2. เพิ่ม Operator “Weight to Data” เพื่อแสดงค่า Weight
  3. รัน Process
  4. ผลการทำงาน

จากผลในตารางจะเป็นได้ว่า คะแนนความพึงพอใจ (satisfaction_level) มี weight สูงที่สุดนั่นคือมีผลต่อโมเดล มากที่สุด

รองลงมาก็คือ number_project, time_spend_company, average_montly_hours

เพียงเท่านี้ก็สามารถหาจุดที่ต้องแก้ไขเพื่อที่จะลด Turnover Rate ได้แล้ว

ขอบคุณที่ติดตาม แล้วพบกันใหม่ในบทความต่อไปนะครับผม

Feedback welcome : pichitchai.pim@gmail.com

#ShareForChange

--

--