ทำนายพนักงานที่จะลาออกด้วยเทคนิค Data Mining แบบไม่ต้องเขียน Code ภาค 2 (หาปัจจัยสำคัญที่มีผลต่อการลาออก)
2จากบทความที่แล้ว ทำนายพนักงานที่จะลาออกด้วยเทคนิค Data Mining แบบไม่ต้องเขียน Code
ผลจากโมเดลของเราทำให้เราสามารถทำนายพนักงานที่มีโอกาสที่จะลาออกได้แล้ว
แต่สิ่งที่ควรจะทำในลำดับต่อไปคือ จะแก้ไขปัญหาการลาออกอย่างไร จุดใหนที่ควรจะโฟกัสก่อน อะไรที่เป็นปัจจัยสำคัญ หรือมีผลมากที่สุดของการลาออก
ในการหาความสำคัญของ attribute ว่ามีปัจจัยหรือมีความสำคัญแค่ใหนนั้นสามารถ หาได้หลายวิธี ซึ่งสามารถหาแบบ attribute แยกเดี่ยวๆ หรือแบบกลุ่ม (ดูแบบเดี่ยวอาจไม่สำคัญ แต่ถ้าจับคู่กับ attribute อื่นด้วยกลับมาความสำคัญมาก เป็นต้น)
เรายังจะใช้งาน RapidMiner อีกเช่นเคย โดยแก้ไข Process จากบทความที่แล้วให้เป็นตามภาพ
- โดยเพิ่ม Operator “Weight by Information Gain” เพื่อใช้คำนวน weight ของ attribute ด้วยเทคนิค Information Gain
- เพิ่ม Operator “Weight to Data” เพื่อแสดงค่า Weight
- รัน Process
- ผลการทำงาน
จากผลในตารางจะเป็นได้ว่า คะแนนความพึงพอใจ (satisfaction_level) มี weight สูงที่สุดนั่นคือมีผลต่อโมเดล มากที่สุด
รองลงมาก็คือ number_project, time_spend_company, average_montly_hours
เพียงเท่านี้ก็สามารถหาจุดที่ต้องแก้ไขเพื่อที่จะลด Turnover Rate ได้แล้ว
ขอบคุณที่ติดตาม แล้วพบกันใหม่ในบทความต่อไปนะครับผม
Feedback welcome : pichitchai.pim@gmail.com
#ShareForChange