R語言是一種能用來做統計和資料分析的語言,此外也能進行網路爬蟲。所謂爬蟲就是將網頁上的資料下載回來,本文將示範如何撰寫R語言,進行簡易的爬蟲。
R語言環境:https://cran.r-project.org/bin/windows/base/
R開發工具:https://www.rstudio.com/products/rstudio/download/
在Google試算表,可以透過函數來抓取外部資料,如政府開放式資料、網頁表格、PTT頁面的文章。當資料來源改變,試算表的資料也會隨之更新。
一、抓取政府開放式資料
1.到政府開放式資料的網站,找尋一份有興趣的資料,複製其CSV連結