市場區隔技術 — 集群分析（Cluster Analysis）

Published in

Marketingdatascience

4 min readMar 23, 2020

有一句俗話說，「物以類聚」，但是在行銷資料的世界裡，如果沒有人為的處理，性質相同的資料還是不會類聚。我們總要把類似的資料儘量排在一起，才能找到共同的端倪。而「集群分析」正是一種精簡資料的方法，依據樣本之間的共同屬性，將比較相似的樣本聚集在一起，形成集群(cluster)。

從視覺化的觀點來看，如果每一筆資料在縱橫座標軸上，是一個點。那麼通常以距離作為分類的依據，相對距離愈近，相似程度愈高，資料分群之後可以使得群內差異小、群間差異大。

換句話說，集群分析（Cluster Analysis）的目標，是將樣本分為不同的數個組，以使各組內的同質性最大化，以及各組之間的異質性最大化。這樣的概念，與市場區隔裡的「組內同質、組間異質」，不是很類似嗎？學者邁爾斯（Myers）與陶伯（Tauber）就發現，在市場區隔技術方面，集群分析優於因素分析。

集群分析能將N個樣本，集結成M個群體的統計方法，其中M<=N。

如果所有樣本最後被分為一組，代表這一組裡的成員彼此相對不可區分。

目前，集群分析技術主要有兩大類：階層式分群（Hierarchical Clustering）和切割式分群（Partitional Clustering）。

階層式分群（Hierarchical Clustering）不用指定分群數量，演算法會直接根據樣本之間的距離，將距離最近的集結在一群，直到所有樣本都併入到同一個集群之中。階層式分群的結果，可透過樹狀圖來呈現，如圖1所示。