如何探索資料:視覺化中的元件
利用不同元件調整視覺化的外觀與添加資訊
Published in
14 min readJul 15, 2018
The simple graph has brought more information to the data analyst’s mind than any other device.
John Tukey
在如何探索資料:基礎視覺化一文中我們已經掌握如何描繪不同資料的特徵,進而從資料中挖掘富含價值的資訊;不過該文的重點是如何將資料進行處理並依照資料類型與探索需求,映射至對應圖形種類上,與資料無關的調整,像是圖表標題、色系或者刻度標籤等,並不在考量之中,這也表示我們在探索性資料分析(Exploratory Data Analysis)目的:讓資料科學團隊一目暸然資料特徵,尚有可以進步之空間。
摘要
本文簡介如何在 Python 與 R 語言使用視覺化套件中不同元件,適當調整圖形的外觀與添加資訊,進而讓視覺化可以完成探索性資料分析的目的;調整畫布的佈景主題、加入圖標題與軸標籤、加入註釋、調整座標軸、加入與調整圖例以及在一個畫布上繪製多個子圖形。
值得注意的是,視覺化中允許資料科學團隊自行調整的元件或延伸外掛如過江之鯽,因此能夠調整的元件絕對包含但不限於本篇文章所提及的內容。
調整畫布的佈景主題
調整畫布的佈景主題(theme)是讓視覺化立即改頭換面的捷徑,佈景主題涵蓋背景顏色、字型大小與線條樣式等整體外觀的調整。在 Python 中我們可以查看 pyplot
的 style.available
屬性,暸解能夠使用哪些佈景主題。
## 可以使用 25 個佈景主題。
## ['seaborn-dark', 'seaborn-colorblind', 'seaborn-muted', 'seaborn-pastel', 'grayscale', 'seaborn-dark-palette', 'seaborn-white', '_classic_test', 'seaborn-poster', 'seaborn-whitegrid', 'fast', 'seaborn-bright', 'seaborn-talk', 'seaborn-paper', 'Solarize_Light2'…