如何用機器學習方法提升客戶體驗-以保險業為例!

陳政廷(Tim)
Marketingdatascience
Jul 14, 2021

情境

若今天不小心遭逢了一場嚴重車禍,第一時間您會想到誰?

  1. 家人
  2. 朋友
  3. 心愛的人

而"保險業務員"往往才會是大多數人最後才想到的~!
但其實第一時間聯繫保險業務員,詢問並了解理賠內容,對於保障自身權益,及做適當的決策是非常重要且關鍵的一環。

這也是本篇文章中想要和大家分享的案例 — A保險公司,想要持續改善的方向,期待為每一位客戶提供最適合的產品並提升其顧客體驗。

A保險公司未來方向:打算建立一套自動的方法,用來預測發生意外時所產生的成本及索賠嚴重性。

A保險公司作法:運用保險業資料集中相關特徵變數(去識別化),進一步預測目標變數之值。

解決方法

首先,先來查看原始資料集的狀況,可以看到裡面所有特徵變數及目標變數都已進行了去識別化的處理。整體包含了116個類別變數欄位、14個連續變數欄位、1個客戶ID欄位與1個目標變數(Loss),也就是該案件發生後,會損失多少錢,如圖1所示。

圖1. 原始資料集

了解資料結構後,本文將以列點的方式陳述資料處理的步驟 :

  1. 敘述統計
    藉由觀察連續變數的四分位數以及偏態系數,建立對連續變數欄位的基礎認識。
  2. 資料視覺化
    (a) 透過查看類別變數中各種類的比例,了解普遍出現的狀況為何,假設其中一個特徵欄位”cat1"為保險險種,內容為其涵蓋的保障類別,便可以找出各險種的特色。
    (b) 掌握連續變數的分布情形,是否具有常態分佈的樣態。
  3. 將類別變數欄位變為二元變數欄位
    使用資料處理套件LabelEncoder,重新整理類別變數欄位。
  4. 針對目標變數(Loss)進行偏態修正(skew correction)
    將目標變數轉換成趨於常態的形式,以降低離群值所造成的影響(假設每個變數的值為X,將其變成log(1+X),底下有附上目標變數欄位(Loss)轉換前後給大家參照,如圖2圖3所示。
圖2. 目標變數(Loss)轉換前
圖3. 目標變數(Loss)轉換後

這邊一共使用了14個演算法進行建模,我們將依據演算法的差異進行以下分類,如果想進一步了解如何操作,請參考此連結

1.線性

  • Linear Regression
  • Ridge Regression
  • LASSO Linear Regression
  • Elastic Net Regression

2.非線性

  • KNN
  • CART
  • SVM

3.Bagging

  • Bagged Decision Trees
  • Random Forest
  • Extra Trees

4.Boosting

  • AdaBoost
  • Stochastic Gradient Boosting
  • XGBoost

5.深度學習

  • MLP

成果與應用

完成上述模型建置後,便可透過挑選預測效果最好的模型,來協助A公司在進行決策時能採取對應措施。例如:針對根據不同風險程度的客戶所預測出來的可能損失金額,如圖4的預估loss所示,除了提供不同費率外,更量身打造最有利的保險組合,讓顧客有更好的使用體驗。透過預測模型的建議,進一步提高客戶對於該公司推薦產品的信賴程度,嘗試用資料科學的方法達到雙贏的效果!!

圖4. 不同顧客(id)損失金額的預測數值表

作者:陳政廷(臺灣行銷研究特邀作者)、鍾皓軒(臺灣行銷研究有限公司創辦人)

本篇就到此結束囉~
看完後,如果覺得喜歡,不妨幫忙拍個手 !
我們下次見~

參考資料

Exploratory study on ML algorithms:
https://bit.ly/3b3tCry

作者:陳政廷(臺灣行銷研究特邀作者)、鍾皓軒(臺灣行銷研究有限公司創辦人)

【防疫新運動,直播學習一起GO!TMR暑期最新直播課程】

為了讓大家在防疫期間也能宅出數位競爭力、學習不間斷!
TMR推出直播課程,現在相揪上課還有團報優惠!
兩人團報,好友一起現享 95折
三人團報,多人共學現享 9折
一個人也別怕,還有早鳥獨享優惠價

◆◆◆Python 全系列課程◆◆◆

7/17+7/18
【Python 入門基礎實戰-找出VIP客戶】

7/31+8/1
【超速學習⚡STP行銷策略 Python 商業實務絕對上手班】

8/21+8/22
【實戰演練Python X 購物籃🛒多商品推薦組合分析】

◆◆◆Excel 全系列課程◆◆◆

7/24+8/7
【 行銷人必備⚡Excel商業分析儀錶板案例實戰】

8/14+8/15
【Excel Power BI 動態儀錶板⚡顧客分群 X 顧客樣貌 X 廣告效益評估】

8/28
【行銷核心關鍵⚡Excel Power BI 購物籃分析實戰】

◆◆◆《行銷資料科學家有話說》免費直播分享會◆◆◆

第一場:行銷資料科學家必學的行銷理論
時間:7/23(五) 20:00–21:00

第二場:行銷資料科學家必備十大技能之落地應用
時間:8/6(五) 20:00–21:00

💡 點此進入報名連結

— — — — — — — — — — — — — — — —

往後的文章都會持續在行銷資料科學粉絲專頁上發表喔,喜歡我們就趕緊追蹤吧!

同時再請大家多多follow我們的FB粉絲專頁,我們會在粉專上即時公布最新資訊,讓您重要消息不漏接!

FB粉絲專頁:行銷資料科學

官網:臺灣行銷研究

歡迎加入我們的Telegram獲取即時訊息!https://t.me/marketingdatascience
歡迎加入我們的Line@獲取即時訊息!https://line.me/R/ti/p/%40cde8265r

--

--

陳政廷(Tim)
Marketingdatascience

熱愛資料分析,目前仍在這塊領域耕耘與學習的管理學院畢業生