<演算法圖鑑>心得筆記-第六章

IgorChien
2 min readSep 12, 2020

--

前言

閱讀學習後紀錄下來,以增加自己的記憶及分享學習心得。

何謂分群

對所有數據進行分類組合的操作,將相似的數據歸類在一起,這些個別的組稱作為「群集」 (Cluster)。通常以「距離」作為分類的依據,相對距離愈近,相似程度愈高。

Clustering
補充:即使定義了數據間的距離,還是有各種分群的方法。可以依造設定的群集數量、群集內數據數量或是群集內各數據間距···等等之類的。

k-means 演算法

分群演算法的一種。事先決定群集個數來分組。

K-Means Clustering
補充:k-means 演算法需先決定群集個數,設定個數不洽當的話,可能無法得到有意義的結果。即使群集個數相同,根據隨機設定的最初中心點位置不同,而得到不同的分群結果。分群演算法有很多種,最著名的為「階層式分群法」(hierarchical clustering),與k-means 演算法不同之處在於,一開始不需設定群集個數。也因為合併群集操作的定義方式衍生了「最短距離法」、「最長距離法」、「群平均法」···等各種演算法。

--

--

IgorChien

Genius is one per cent inspiration, ninety-nine per cent perspiration.學無止盡