前人種樹後人乘涼
如果把 Data Pipeline 是資料處理系統的總稱,這個系統中的最小單位是 Stage/ Task,一個或多個 Stage/ Task 會組成一條基本的處理資料的 Job。有了這個基本認知後,再接下來細看每個東西是在幹嘛的。
大數據乾我p4?
資料科學家是近幾年出現的名詞(但是實際上已經存在於好幾十年),像是這篇“搶佔2013全球最性感行業”,以及曾經寫過的“資料科學家 vs…