市場區隔技術 — 集群分析(Cluster Analysis)

行銷資料科學
Marketingdatascience
4 min readMar 23, 2020

--

有一句俗話說,「物以類聚」,但是在行銷資料的世界裡,如果沒有人為的處理,性質相同的資料還是不會類聚。我們總要把類似的資料儘量排在一起,才能找到共同的端倪。而「集群分析」正是一種精簡資料的方法,依據樣本之間的共同屬性,將比較相似的樣本聚集在一起,形成集群(cluster)。

從視覺化的觀點來看,如果每一筆資料在縱橫座標軸上,是一個點。那麼通常以距離作為分類的依據,相對距離愈近,相似程度愈高,資料分群之後可以使得群內差異小、群間差異大。

換句話說,集群分析(Cluster Analysis)的目標,是將樣本分為不同的數個組,以使各組內的同質性最大化,以及各組之間的異質性最大化。這樣的概念,與市場區隔裡的「組內同質、組間異質」,不是很類似嗎?學者邁爾斯(Myers)與陶伯(Tauber)就發現,在市場區隔技術方面,集群分析優於因素分析。

集群分析能將N個樣本,集結成M個群體的統計方法,其中M<=N。

如果所有樣本最後被分為一組,代表這一組裡的成員彼此相對不可區分。

目前,集群分析技術主要有兩大類:階層式分群(Hierarchical Clustering)和切割式分群(Partitional Clustering)。

階層式分群(Hierarchical Clustering)不用指定分群數量,演算法會直接根據樣本之間的距離,將距離最近的集結在一群,直到所有樣本都併入到同一個集群之中。階層式分群的結果,可透過樹狀圖來呈現,如圖1所示。

圖1 集群分析 — 階層式分群

切割式分群(Partitional Clustering)則會事先指定分群數量,並透過演算法(如K-means)讓組內同質性和組間異質性最大化。

集群分析主要用於將人分群,所依據的變數通常是描述消費者的特徵(如,人口統計變數、態度、需求…等)。

再舉一個例子,美國職籃就曾將ESPN選出的前25名球星,包含得分、籃板、助攻、火鍋及抄截等資料。以集群分析法將25名球星分成五大類,分別是主力得分群、防守猛將群、控球後衛群、雙能衛與強力前鋒群,供球隊和經理和教練在選秀和調度時參考,這也是集群分析的主要運用方式。

值得一提的是,集群分析的結果,往往會隨著「時間」而有所改變,因此在透過集群分析做決策時,應該考慮到這一點。

作者:蘇宇暉(台科大管研所博士候選人)、羅凱揚(台科大企管系博士)

繪圖者:何晨怡

歡迎加入我們的telegram獲取即時訊息!https://t.me/marketingdatascience

您可能有興趣:

全台最多商務應用的Python基礎課程:

Python 0到1 基礎商業數據分析實戰

2020課程地圖:

AI行銷學講座:

實體課程:

Python機器學習商務實戰(報名獲🎖️免費3小時價值4,500元🎖️限時Python基礎線上課)

線上課程:

精選好書:

🏆狂賀!國內第一本「股票小祕書」專書

獲天瓏書局【暢銷排行榜 — 第 ⑦ 名!!】

附上購書網址~ 國外的朋友也可以使用博客來與金石堂的通路轉運到國外哦~!

  1. 天瓏書局:http://bit.ly/stock-secretaryBot
  2. 博客來:https://www.books.com.tw/products/0010833772

--

--

行銷資料科學
Marketingdatascience

Marketing data science. 台灣第一個行銷資料科學(MDS)知識部落,本粉絲專頁在探討行銷資料科學之基礎概念、趨勢、新工具和實作,讓粉絲們瞭解資料科學的行銷運用,並開啟厚植數據分析能力之契機。粉絲專頁:https://www.facebook.com/MarketingDataScienceTMR