วิเคราะห์ข้อมูลการใช้บัตรเครดิต (Credit Analytic)
บทความนี้เป็นส่วนหนึ่งของ Data Science Essential ของ Botnoi Classroom หัวข้อ Data Analytic ของกลุ่ม DSE3_G8
กลุ่มของเราเลือกการวิเคราะห์ข้อมูลการใช้บัตรเครดิตในประเทศไทย เนื่องจากการใช้บัตรเครดิตในปัจจุบันเข้าถึงได้ง่ายและรวดเร็ว การใช้บัตรเครดิตจีงเป็นหนึ่งในผลิตภัณฑ์ในการขับเคลื่อนทางเศรษฐกิจของประชากรในการจับจ่ายใช้สอย ความมุ่งหมายนี้เพื่อที่จะวิเคราะห์หาปัจจัยต่างๆที่สัมพันธ์กันของลูกค้าเก่าและลูกค้าใหม่ในการใช้บัตรเครดิต (Data set นี้เป็นเพียงส่วนหนึ่งของ บมจ.ธนาคารแห่งหนึ่ง)
ซึ่งมีข้อมูลดังต่อไปนี้
และมีข้อมูลเกี่ยวกับตัวผู้ใช้ คือ อายุ , จังหวัด และจำนวนปีในการเป็นลูกค้า
จากข้อมูลดังกล่าว เราจึงได้ทำการตั้งสมมุติฐานดังต่อไปนี้
- พื้นที่จังหวัดมีผลกับการถือบัตรเครดิตหรือเปล่า
- อายุมีผลกับการถือบัตรเครดิตมั้ย
- ลูกค้าแบบไหนที่มีแนวโน้มผิดนัดชำระหนี้
- อายุยิ่งน้อยมีแนวโน้มผิดนัดชำระหนี้
- กลุ่มอายุที่มีโอกาสเบิกเงินล่วงหน้าสูง
- อายุยิ่งมากจะมีการใช้จ่ายเยอะขึ้น
- ระยะเวลาการเป็นลูกค้านานเท่าไหร่ยิ่งมีการใช้จ่ายเยอะขึ้น
จากนั้นเราได้ทำการสร้าง datamart เลือกเฉพาะข้อมูลที่ใช้
การทำความสะอาดข้อมูล (Data Cleansing)
แล้วมาทำความสะอาดข้อมูลที่แปลกปลอม โดยมีหลักการในการทำความสะอาดดังนี้
- ดึงค่าว่าง(null) และค่าที่ไม่ควรเป็น ≤0 ออก เช่น credit limit, balance
- คลีนค่าอายุของผู้ใช้ที่ไม่ควรถือบัตรเครดิต (ต่ำกว่า 15 ปีบริบูรณ์)
- ลบค่า credit limit ที่มีค่าน้อยกว่า 81
4. ปรับค่าตัวเลขโดยใช้คำสั่ง round() และดึงค่า(drop)ที่มีค่า Min_payment เท่ากับ 0 และ Payment ไม่เท่ากับ 0 ออก
5. หลังทำความสะอาดข้อมูลทั้งหมดแล้วก็นำข้อมูลไปวิเคราะห์หาความสัมพันธ์ตามที่ตั้งสมมุติฐานไว้ในข้างต้น
วิเคราะห์หาความสัมพันธ์ (Exploratory Data Analysis)
1.พื้นที่จังหวัดมีผลกับการถือบัตรเครดิตหรือเปล่า
จำนวนผู้ถือบัตรเครดิตส่วนใหญ่จะอยู่ในพื้นที่จังหวัด “นนทบุรี” สูงที่สุด รองลงมาคือ “กรุงเทพและเชียงใหม่” ตามลำดับ
2.อายุมีผลกับการถือบัตรเครดิตมั้ย
จำนวนผู้ถือบัตรเครดิตในช่วงการเริ่มต้นการทำงาน จะมีจำนวนสูงกว่าจำนวนผู้ที่ทำงานมานาน ยิ่งอายุเยอะจำนวนการถือบัตรเครดิตยิ่งน้อย คือ ช่วงอายุ 23–26ปี จำนวนผู้ถือบัตรเครดิตจะเพิ่มขึ้นเรื่อยๆ หลังจากอายุ 27 ปี จำนวนผู้ถือบัตรเครดิตจะลดลงแปรผันตรงกับช่วงอายุที่เพิ่มมากขึ้น
3.ลูกค้าแบบไหนที่มีแนวโน้มผิดนัดชำระหนี้
เราจะอ้างอิงจากค่า Pct_full_payment ซึ่งจะแสดงถึงเปอร์เซ็นต์ในการชำระเงินเต็มจำนวน จังหวัดที่มีร้อยละของจำนวนครั้งที่จ่ายหนี้เต็มจำนวน แยกเป็นรายจังหวัดสูงที่สุด คือ “นครราชสีมา” ที่ต่ำสุดคือ “ภูเก็ตและเชียงใหม่”
4. .อายุยิ่งน้อยมีแนวโน้มผิดนัดชำระหนี้
ร้อยละของจำนวนครั้งที่จ่ายหนี้ครบหมดส่วนใหญ่จะอยู่ในกลุ่มอายุ 54–68 ปี
5.กลุ่มอายุที่มีโอกาสเบิกเงินล่วงหน้าสูง
ในกลุ่มคนวัยทำงาน ช่วงปลายการทำงาน จำนวนการเบิกเงินสดล่วงหน้าและจำนวนครั้งในการกดเงินสดสูงกว่ากลุ่มช่วงวัยเริ่มต้นและกลางของการทำงาน
6. อายุยิ่งมากจะมีการใช้จ่ายเยอะขึ้น
ยิ่งอายุเยอะจำนวนยอดชำระยิ่งสูงมีการใช้จ่ายมากกว่ากลุ่มอายุน้อย มีค่าสูงสุดในช่วง 62–67 ปี ซึ่งโดยจากจำนวนปีที่ถือบัตรระยะยาวการใช้จ่ายก็สูงตามไปด้วย โดยพื้นที่จังหวัดที่มียอดชำระสูงสุดคือ “นครราชสีมา”
7.ระยะเวลาการเป็นลูกค้านานเท่าไหร่ยิ่งมีการใช้จ่ายเยอะขึ้น
จากการวิเคราะห์ข้อมูลชุดนี้ในการใช้บัตรเครดิตของประเทศไทยจะเห็นได้ว่ากลุ่มช่วงอายุของการเริ่มต้นการทำงานจะมีแนวโน้มในการถือบัตรเครดิตสูงกว่าช่วงอายุอื่น แต่ในการใช้จ่ายในกลุ่มที่มีอายุและถือบัตรมานานจะมียอดการใช้จ่ายที่มากกว่ากลุ่มอื่น โดยพื้นที่จังหวัดคนที่ถือบัตรเครดิตส่วนใหญ่จะอยู่จังหวัดที่มีมูลค่าทางเศรษฐกิจสูง
สุดท้ายนี้เรายังสามารถทำการตลาดโปรโมชั่นต่างๆจากข้อมูลที่เราจะเห็นได้ว่ากลุ่มอายุน้อยนั้นเป็นกลุ่มที่การใช้จ่ายค่อนข้างน้อยซึ่งควรจะมีการทำโปรโมชั่นให้กับลูกค้ากลุ่มประเภทนี้เพื่อเร่งยอดการใช้จ่ายให้สูงยิ่งขึ้น
Link Colab : https://colab.research.google.com/drive/1RpnP4BllBrqNbm6V75cRE5DwuneBnvk6?usp=sharing
Credit Group 8
K.Bean
K.Ping
K. Suong
K. Pook
K. A
K. Jo
K.Glenn
K.Refilos