[Redash] Cohort

Mars Weng
MarsW-Redash
Published in
4 min readNov 7, 2018

Cohort (同群分析) 常用在分析留存率的視覺化中,
之前在 Google Analytic、Mixpanel 常見這樣的圖表,
但一直不是很清楚該如何從圖中解讀數據,
趁此次機會熟悉一下:

找到網路上此篇文章「透過數字觀察客戶留存率,找出提升業績的方式-AppWorks」對 Cohort 圖表介紹的算滿容易懂的,
也使用此文章中的範例來做這次的 Redash Cohort 圖表研究。

此範例中,是以年月為群集、以往後的月份為不同的階段,
2018 年 01 月有 300 客人在此期購買商品,
這 300 人中在第二個月也就是 2018 年 02 月有 120 人回購,
而在 2018 年 02 月有 500 客人在此期購買商品,
其中有 120 人是老客戶(2018 年 01 月購買的)

要產生 Cohort 圖表,
每一列的資料為該期的年月、是第幾個月的回購、回購的總人數、該期購買客人總數,這裡以 Python Query 建立一個測試資料,用 csv 方式觀看會如同以下的狀況:

month,month_number,value,total
2018-01,1,300,300
2018-01,2,120,300
2018-01,3,90,300
2018-01,4,60,300
2018-01,5,50,300
2018-01,6,48,300
2018-02,1,500,500
2018-02,2,250,500
2018-02,3,150,500
2018-02,4,120,500
2018-02,5,100,500
2018-03,1,800,800
2018-03,2,240,800
2018-03,3,160,800
2018-03,4,120,800
2018-04,1,1200,1200
2018-04,2,500,1200
2018-04,3,200,1200
2018-05,1,1700,1700
2018-05,2,500,1700
2018-06,1,2000,2000

在 Visualization Type 選擇 Cohort,

  • Date(Bucket) 的地方選擇 年月欄位
  • Stage 則是第幾個月的回購
  • Stage Value 是該月回購的數值
  • Bucket Population Size 是回購的總人數,也就是該 Bucket 中每個 Stage 的分母

在 Options 分頁中,
要把 Time Interval 調成 Date(Bucket) 對應的格式,
此例中是每個月為群集,因此要調成 Monthly,
就會看到漂亮的 Cohort 留存率圖表了

ps. Time Interval 如果調成 Daily, Weekly 會發現有不少空值,
可配合 Mode 看是選則補零或是保留空值。

使用案例

公司實際上還沒使用過 Redash 的 Cohort,
但可以以此圖表做一些相關分析:

  • 分析客人的回購狀況
    (不過因為團體旅遊產品購買週期長,一個 Stage 可能要三個月以季來看)
  • 分析各頁面的留存率
    (現在是有使用 Google Analytic 裡的分析圖表)

此為系列文章,傳送門在此

--

--