วิเคราะห์ข้อมูลการใช้บัตรเครดิต (Credit Analytic)

Worrawan Duanghong
botnoi-classroom
Published in
3 min readMay 8, 2021

บทความนี้เป็นส่วนหนึ่งของ Data Science Essential ของ Botnoi Classroom หัวข้อ Data Analytic ของกลุ่ม DSE3_G8

Photo by Avery Evans on Unsplash

กลุ่มของเราเลือกการวิเคราะห์ข้อมูลการใช้บัตรเครดิตในประเทศไทย เนื่องจากการใช้บัตรเครดิตในปัจจุบันเข้าถึงได้ง่ายและรวดเร็ว การใช้บัตรเครดิตจีงเป็นหนึ่งในผลิตภัณฑ์ในการขับเคลื่อนทางเศรษฐกิจของประชากรในการจับจ่ายใช้สอย ความมุ่งหมายนี้เพื่อที่จะวิเคราะห์หาปัจจัยต่างๆที่สัมพันธ์กันของลูกค้าเก่าและลูกค้าใหม่ในการใช้บัตรเครดิต (Data set นี้เป็นเพียงส่วนหนึ่งของ บมจ.ธนาคารแห่งหนึ่ง)

ซึ่งมีข้อมูลดังต่อไปนี้

และมีข้อมูลเกี่ยวกับตัวผู้ใช้ คือ อายุ , จังหวัด และจำนวนปีในการเป็นลูกค้า

ตัวอย่างชุดข้อมูล

จากข้อมูลดังกล่าว เราจึงได้ทำการตั้งสมมุติฐานดังต่อไปนี้

  1. พื้นที่จังหวัดมีผลกับการถือบัตรเครดิตหรือเปล่า
  2. อายุมีผลกับการถือบัตรเครดิตมั้ย
  3. ลูกค้าแบบไหนที่มีแนวโน้มผิดนัดชำระหนี้
  4. อายุยิ่งน้อยมีแนวโน้มผิดนัดชำระหนี้
  5. กลุ่มอายุที่มีโอกาสเบิกเงินล่วงหน้าสูง
  6. อายุยิ่งมากจะมีการใช้จ่ายเยอะขึ้น
  7. ระยะเวลาการเป็นลูกค้านานเท่าไหร่ยิ่งมีการใช้จ่ายเยอะขึ้น

จากนั้นเราได้ทำการสร้าง datamart เลือกเฉพาะข้อมูลที่ใช้

การทำความสะอาดข้อมูล (Data Cleansing)

แล้วมาทำความสะอาดข้อมูลที่แปลกปลอม โดยมีหลักการในการทำความสะอาดดังนี้

  1. ดึงค่าว่าง(null) และค่าที่ไม่ควรเป็น ≤0 ออก เช่น credit limit, balance
  2. คลีนค่าอายุของผู้ใช้ที่ไม่ควรถือบัตรเครดิต (ต่ำกว่า 15 ปีบริบูรณ์)
  3. ลบค่า credit limit ที่มีค่าน้อยกว่า 81
ทำการ drop ค่า Credit limit ที่น้อยกว่า 81

4. ปรับค่าตัวเลขโดยใช้คำสั่ง round() และดึงค่า(drop)ที่มีค่า Min_payment เท่ากับ 0 และ Payment ไม่เท่ากับ 0 ออก

ทำการ drop ค่า Min_payment

5. หลังทำความสะอาดข้อมูลทั้งหมดแล้วก็นำข้อมูลไปวิเคราะห์หาความสัมพันธ์ตามที่ตั้งสมมุติฐานไว้ในข้างต้น

วิเคราะห์หาความสัมพันธ์ (Exploratory Data Analysis)

1.พื้นที่จังหวัดมีผลกับการถือบัตรเครดิตหรือเปล่า

จำนวนผู้ถือบัตรเครดิตส่วนใหญ่จะอยู่ในพื้นที่จังหวัด “นนทบุรี” สูงที่สุด รองลงมาคือ “กรุงเทพและเชียงใหม่” ตามลำดับ

ผู้ถือบัตรเครดิตแยกเป็นรายจังหวัด

2.อายุมีผลกับการถือบัตรเครดิตมั้ย

จำนวนผู้ถือบัตรเครดิตในช่วงการเริ่มต้นการทำงาน จะมีจำนวนสูงกว่าจำนวนผู้ที่ทำงานมานาน ยิ่งอายุเยอะจำนวนการถือบัตรเครดิตยิ่งน้อย คือ ช่วงอายุ 23–26ปี จำนวนผู้ถือบัตรเครดิตจะเพิ่มขึ้นเรื่อยๆ หลังจากอายุ 27 ปี จำนวนผู้ถือบัตรเครดิตจะลดลงแปรผันตรงกับช่วงอายุที่เพิ่มมากขึ้น

ผู้ถือบัตรเครดิตแยกตามช่วงอายุ

3.ลูกค้าแบบไหนที่มีแนวโน้มผิดนัดชำระหนี้

เราจะอ้างอิงจากค่า Pct_full_payment ซึ่งจะแสดงถึงเปอร์เซ็นต์ในการชำระเงินเต็มจำนวน จังหวัดที่มีร้อยละของจำนวนครั้งที่จ่ายหนี้เต็มจำนวน แยกเป็นรายจังหวัดสูงที่สุด คือ “นครราชสีมา” ที่ต่ำสุดคือ “ภูเก็ตและเชียงใหม่”

ร้อยละของจำนวนครั้งที่จ่ายหนี้ครบหมดแยกเป็นรายจังหวัด

4. .อายุยิ่งน้อยมีแนวโน้มผิดนัดชำระหนี้

ร้อยละของจำนวนครั้งที่จ่ายหนี้ครบหมดส่วนใหญ่จะอยู่ในกลุ่มอายุ 54–68 ปี

ร้อยละของจำนวนครั้งที่จ่ายหนี้ครบหมดแยกตามช่วงอายุ

5.กลุ่มอายุที่มีโอกาสเบิกเงินล่วงหน้าสูง

ในกลุ่มคนวัยทำงาน ช่วงปลายการทำงาน จำนวนการเบิกเงินสดล่วงหน้าและจำนวนครั้งในการกดเงินสดสูงกว่ากลุ่มช่วงวัยเริ่มต้นและกลางของการทำงาน

ยอดการเบิกเงินล่วงหน้าจากบัตรแยกตามอายุ
จำนวนครั้งในการกดเงินสดล่วงหน้าตามช่วงอายุ

6. อายุยิ่งมากจะมีการใช้จ่ายเยอะขึ้น

ยิ่งอายุเยอะจำนวนยอดชำระยิ่งสูงมีการใช้จ่ายมากกว่ากลุ่มอายุน้อย มีค่าสูงสุดในช่วง 62–67 ปี ซึ่งโดยจากจำนวนปีที่ถือบัตรระยะยาวการใช้จ่ายก็สูงตามไปด้วย โดยพื้นที่จังหวัดที่มียอดชำระสูงสุดคือ “นครราชสีมา”

ยอดชำระแบ่งตามช่วงอายุ
ยอดชำระแบ่งตามอายุ
ยอดชำระแบ่งตามพื้นที่จังหวัด

7.ระยะเวลาการเป็นลูกค้านานเท่าไหร่ยิ่งมีการใช้จ่ายเยอะขึ้น

มูลค่าสูงสุดของการใช้บัตรเทียบกับจำนวนปีที่ถือบัตร

จากการวิเคราะห์ข้อมูลชุดนี้ในการใช้บัตรเครดิตของประเทศไทยจะเห็นได้ว่ากลุ่มช่วงอายุของการเริ่มต้นการทำงานจะมีแนวโน้มในการถือบัตรเครดิตสูงกว่าช่วงอายุอื่น แต่ในการใช้จ่ายในกลุ่มที่มีอายุและถือบัตรมานานจะมียอดการใช้จ่ายที่มากกว่ากลุ่มอื่น โดยพื้นที่จังหวัดคนที่ถือบัตรเครดิตส่วนใหญ่จะอยู่จังหวัดที่มีมูลค่าทางเศรษฐกิจสูง

สุดท้ายนี้เรายังสามารถทำการตลาดโปรโมชั่นต่างๆจากข้อมูลที่เราจะเห็นได้ว่ากลุ่มอายุน้อยนั้นเป็นกลุ่มที่การใช้จ่ายค่อนข้างน้อยซึ่งควรจะมีการทำโปรโมชั่นให้กับลูกค้ากลุ่มประเภทนี้เพื่อเร่งยอดการใช้จ่ายให้สูงยิ่งขึ้น

Link Colab : https://colab.research.google.com/drive/1RpnP4BllBrqNbm6V75cRE5DwuneBnvk6?usp=sharing

Credit Group 8

K.Bean

K.Ping

K. Suong

K. Pook

K. A

K. Jo

K.Glenn

K.Refilos

--

--