[Redash] Cohort
Cohort (同群分析) 常用在分析留存率的視覺化中,
之前在 Google Analytic、Mixpanel 常見這樣的圖表,
但一直不是很清楚該如何從圖中解讀數據,
趁此次機會熟悉一下:
找到網路上此篇文章「透過數字觀察客戶留存率,找出提升業績的方式-AppWorks」對 Cohort 圖表介紹的算滿容易懂的,
也使用此文章中的範例來做這次的 Redash Cohort 圖表研究。
此範例中,是以年月為群集、以往後的月份為不同的階段,
2018 年 01 月有 300 客人在此期購買商品,
這 300 人中在第二個月也就是 2018 年 02 月有 120 人回購,
而在 2018 年 02 月有 500 客人在此期購買商品,
其中有 120 人是老客戶(2018 年 01 月購買的)
要產生 Cohort 圖表,
每一列的資料為該期的年月、是第幾個月的回購、回購的總人數、該期購買客人總數,這裡以 Python Query 建立一個測試資料,用 csv 方式觀看會如同以下的狀況:
month,month_number,value,total
2018-01,1,300,300
2018-01,2,120,300
2018-01,3,90,300
2018-01,4,60,300
2018-01,5,50,300
2018-01,6,48,300
2018-02,1,500,500
2018-02,2,250,500
2018-02,3,150,500
2018-02,4,120,500
2018-02,5,100,500
2018-03,1,800,800
2018-03,2,240,800
2018-03,3,160,800
2018-03,4,120,800
2018-04,1,1200,1200
2018-04,2,500,1200
2018-04,3,200,1200
2018-05,1,1700,1700
2018-05,2,500,1700
2018-06,1,2000,2000
在 Visualization Type 選擇 Cohort,
- Date(Bucket) 的地方選擇 年月欄位
- Stage 則是第幾個月的回購
- Stage Value 是該月回購的數值
- Bucket Population Size 是回購的總人數,也就是該 Bucket 中每個 Stage 的分母
在 Options 分頁中,
要把 Time Interval 調成 Date(Bucket) 對應的格式,
此例中是每個月為群集,因此要調成 Monthly,
就會看到漂亮的 Cohort 留存率圖表了
ps. Time Interval 如果調成 Daily, Weekly 會發現有不少空值,
可配合 Mode 看是選則補零或是保留空值。
使用案例
公司實際上還沒使用過 Redash 的 Cohort,
但可以以此圖表做一些相關分析:
- 分析客人的回購狀況
(不過因為團體旅遊產品購買週期長,一個 Stage 可能要三個月以季來看) - 分析各頁面的留存率
(現在是有使用 Google Analytic 裡的分析圖表)
此為系列文章,傳送門在此