何謂分群
對所有數據進行分類組合的操作,將相似的數據歸類在一起,這些個別的組稱作為「群集」 (Cluster)。通常以「距離」作為分類的依據,相對距離愈近,相似程度愈高。
補充:即使定義了數據間的距離,還是有各種分群的方法。可以依造設定的群集數量、群集內數據數量或是群集內各數據間距···等等之類的。
k-means 演算法
分群演算法的一種。事先決定群集個數來分組。
補充:k-means 演算法需先決定群集個數,設定個數不洽當的話,可能無法得到有意義的結果。即使群集個數相同,根據隨機設定的最初中心點位置不同,而得到不同的分群結果。分群演算法有很多種,最著名的為「階層式分群法」(hierarchical clustering),與k-means 演算法不同之處在於,一開始不需設定群集個數。也因為合併群集操作的定義方式衍生了「最短距離法」、「最長距離法」、「群平均法」···等各種演算法。