開始進入 Kettle 安裝的部分
Kettle 是一種 ETL 工具,我的用途是拿來將散落在各地的資料 ( 不管是資料庫或是檔案 ),抽取其中我想要的部分,然後回寫到自己的資料庫,以利我後續做資料的清洗和分析
OS環境 : CentOS-7-x86_64安裝方式 : 最小安裝即可FB社團 : LibreNMS 中文使用者社團
適合閱讀者 : 想學網路爬蟲的新手、馬上就看到成果的新手
閱讀時間 : 五分鐘
事前準備 : 因為我手邊本來就有 MS-SQL 的環境,故我這邊不再說明安裝過程與環境建置,如果需要的話請自行 Google <SQL EXPRESS 安裝 >
閱讀時間 : 十分鐘
如果環境準備好了,其實大概就完成80%的工作,因為環境的設定和安裝是比較複雜的,接下來只要學會 COPY & PASTE,然後再慢慢自行摸索和延伸應用,基本上應該可以有一點小小的成果可以見人
一直都想要學網路爬蟲,主要是因為覺得網路爬蟲可以幫忙在一些固定的地方抓取資料,加速搜尋和過濾資料的時間,去年還是有寫了一篇網路爬蟲的文章,那時候也只是單純 COPY & PASTE,然後就沒有下文了,這一次應該會把整個機制做的完整一點,然後真的可以開始收集一些資料