初探 Tableau — 運用 Open Data 繪製全臺灣各村里所得地圖
從無到有介紹 Tableau 資料視覺化,並且運用政府開放資料,快速繪製臺灣各村里所得地圖。
資料視覺化 (Data Visualization) 是商業資料分析的最後一哩路。有時只要一張圖表,就可以鮮明地說出巨量資料背後的故事,有效幫助管理層做出攸關企業獲利的最佳決策。
商業智慧領域百家爭鳴,常見的資料視覺化工具如 SAS Visual Analytics、Microsoft Power BI 等都早已建立其疆域。相較之下 Tableau 是其中較年輕的一員,但近年來聲勢快速攀升,Tableau 專注在資料視覺化的使用者體驗優化,養出了一群超級忠誠的粉絲社群。而其背後的公司 Tableau Software 在 2019 年被 Salesforce 以 US$ 157 億元收購,足以顯現其在資料分析領域的地位。
另外,國發會積極推動政府資料開放,提供各式 Open Data 供民眾使用,推薦讀者可以在不同政府機關的網頁找找,說不定會有意想不到的收穫!
【第一步】資料準備
這次的資料視覺化主要用到兩份開放資料:
- 地圖資訊:內政部村里界圖(TWD97經緯度)
點擊下載後解壓縮,會有一份 .shp 的檔案,裡面記錄了台灣地區將近 8,000 個村里的範圍資訊,稍晚我們會把這份資料匯進 Tableau。 - 收入資訊:106年所得得總額統計分析表-臺北市
政府的所得收入資料會晚 2-3 年公布,但其中資訊仍相當具參考價值。將連結中的資料拿下來,整理後存成 Excel 檔備用。
【第二步】Tableau Desktop 安裝
Tableau Desktop 服務是需要收費的,所幸官方推出免費試用的方案,可以直接到官方網站註冊後下載(Tableau 官方的政策可能會變,建議可以趁他還是免費的時候多利用)。
安裝完成後打開的介面如下(Mac OS 版)
【第三步】資料匯入並串連
在畫面左側 [連線] 選擇下,選擇 [空間檔案],選擇先前下載的圖資中的 .shp 檔案,匯入完成後就可以在下方預覽資料。
完成後點擊左側 [新增] ,選擇 [Microsoft Excel] 匯入先前準備好的所得收入資料(如果用其他資料格式儲存,就點擊相對應的檔案匯入方式)。
會出現下面的畫面,選擇 [左側](對資料分析稍微有一點概念的人應該對這幾個圖示不陌生,這邊就是選擇 Left Join 的意思)。
告訴 Tableau 你要如何將左邊的地圖資訊與右邊的收入資訊串連。這邊務必要確認「縣市對縣市、鄉鎮區對鄉鎮區、村里對村里」
如果只指定村里對村里,全台灣有 30 個《中山里》,這樣一來資料會錯亂
【第四步】資料視覺化繪圖
「接下來的動作會快到無法擋,一起來見識 Tableau 的威力吧!」
點擊畫面左下角 [工作表1]
將左側帶有地球圖案的 [幾何],拖曳到工作表中
至此已經可以看到一個完整的臺灣地圖了
同理,將左側 [縣市] 拖曳到 [篩選器]
以臺北市為例,選擇 [臺北市] 後按下 [確定]
將左側 [中位數] 拖曳到 [顏色]
報表會預設欄位加總,所以我們要按上方的 [分析] 取消勾選 [彙總度量]
精美的臺北市年收入中位數所得地圖就產生了(注意單位是千元)!
至此應該可以發現 Tableau 的操作非常直覺,不用多做介紹,簡單幾個步驟就已經可以繪製出相當精美的地理資訊視覺化圖表。
【第五步】圖表美化
點選右側的顏色,可以選擇 [編輯顏色…]
在此調整自己喜歡的顏色組合,[色板] 底下有許多預設的顏色組合可選,這邊選 [溫度發散],按下 [確定]
接著將左側的 [村里] 拖曳到 [標籤]
大功告成!
接下來就可以看看自己的年收入,在所住的地方有沒有過中位數啦…
Tableau 也提供多種的地圖呈現方式,例如衛星圖
【第六步】資料探勘
相信各位已經自己開始把玩這份圖表了,這邊就來看幾個有趣的地區
天母附近黃黃的一片,果然是天龍國中的天龍國啊…
政大附近的政大里一個紅通通,看來有不少有錢人…
內湖地區經常上新聞的寶湖里,據說住了不少內湖科技園區的大老
把鏡頭拉遠到新北市,可以看到華城里,印象中那邊是一片高級住宅區
相信各位已經熟悉 Tableau,那麼接下來要怎麼說出故事就各憑本事了。
喜歡的話請不吝給 50 個拍手,有任何問題也歡迎留言討論交流!