購物籃分析(Market Basket Analysis)的進階實務應用 — 將性別等維度資料當作虛擬商品來做分析

JC Chang
Oct 18, 2020

--

基礎篇 : 購物籃分析(Market Basket Analysis)的四種指標 — 用簡單的條件機率來找到原來啤酒和尿布一起賣得很好

使用分類法來克服維度問題

好處一 : 增進效能

有時候不只是想要知道兩種商品組合關聯,如果想要知道更多商品們之間的關聯時 ,這時候的計算方式跟兩個商品很類似

  • Support 為 : P(ABC)
  • Confidence 為 : P(C|AB)
  • Lift 為 : P(C|AB)/P(C)

但要計算出多商品的組合會需要大量的運算,如果有30,000個商品,要計算出雙產品的關聯就會有 4.5 × 10⁸ 個組合。如果要計算出三產品組合就大概會有 4.5 × 10¹² ,這時就可以使用分類法來降低產品數量。

通常實務上可能會加上一個條件:例如 Support 需要大於 1%。如果Support 太低的組合就不要去運算了,反正算出來的效益應該也不大…

好處二 : 避免發生機率太低,將多個商品包在一起

通常商家商品數量都會很多所以Support 會很低,像是大家購買 品牌A口紅1號色,或是 品牌A口紅2號色 … 等等共20號色的口紅的機率都很低。所以為了避免 Support 很低錯過一些有效用的產品關聯組合,可以將 品牌A口紅 的所有色號都算是一個產品來降低產品總數。

要注意的是如果將商品包在一起可能會損失每筆交易資料的細節

將顧客的特徵當作虛擬商品來做分析

由於我們想要知道, 例如男性跟某項商品的購買連結讓我們就可以把男性這個要素當作一個虛擬商品來算他們之間的關聯性。

但這樣很快就會遇到維度的問題計算會巨幅成長因此有一些假說是很重要的

另外有個常見的例子是,很常見的行銷手法是每週選幾項商品作為強大促銷,來吸引人們進店,但這些促銷商品往往毛利很低,甚至是賠錢貨,不過店家會期待大家不止會買這些強打促銷,也還會順便逛逛店裡的其他東西,所以可以將這些強打促銷作為虛擬商品來快速事後分析是否是個好的促銷策略。

時序分析

一般的購物籃分析都會將每筆的交易資料當作獨立事件,但實際上交易是有時序的,可能買了產險的人之後6個月會傾向買壽險。如果想要做時序的購物籃分析就需要去追蹤每位使用者的uu id (user identification)。

如果考量時序的話也會產生大量的預算如果同一個人有100筆交易資料就會產生C 100取二共450種可能,所以通常也會設定一個限制,例如說只考慮兩個月內的交易資料或者是前後筆交易資料。

參考資料 : Database Marketing by Blattberg, Robert C., Kim, Byung-Do, Neslin, Scott A.

--

--

JC Chang

Performance ad optimizer, data analyst, free diver, snow boarder…