什麼是Data Science?
Sep 4, 2018 · 3 min read
相信大家對於數據科學這個名詞應該是不陌生,所謂沒吃過豬肉也看過豬走路,沒學過數據科學也看過數據科學走路吧(誤

由Google Trend關鍵字趨勢我們可以了解到Data Science在全世界都超夯,既然這麼熱門,我們怎麼可以不深入探討呢 😤
這就來談談什麼是Data Science
數據科學(英語:Data Science),又稱資料科學,是一門利用數據學習知識的學科,其目標是通過從數據中提取出有價值的部分來生產數據產品。它結合了諸多領域中的理論和技術,包括應用數學,統計,模式識別,機器學習,數據可視化,數據倉庫,以及高性能計算。數據科學通過運用各種相關的數據來幫助非專業人士理解問題。 數據科學技術可以幫助我們如何正確的處理數據並協助我們在生物,社會科學,人類學等領域進行研究調研。此外,數據科學也對商業競爭有極大的幫助。-Wikipedia
看完維基百科的描述,相信跟JB剛接觸數據科學的時候一樣霧煞煞吧
簡單來說,就是利用數據來解決問題啦(有講跟沒講一樣
當然,一般狀況下的數據是無法達到解決問題的目的,所以數據科學家(data scientist)需要將收集來的數據做些繁複的處理和改造,流程大概就像這張圖一樣輕輕鬆鬆的 😆

Data Science需要會什麼?
perspective on data science : hacking skills, math and stats knowledge, and substantive expertise-Drew Conway

- Hacking Skills-也有專家把這個領域改為Computer Science,大致上主流的像是R、Python等等
- Math&Statistics- 面對資料的結構要有這項基礎才有解讀能力
- Substantive Expertise-必須要有其他領域的實務知識,從中找出問題,再藉著數據科學去解決
上述這位Drew Conway大大所提的並不是每個領域都需要專精,不過也是要有一定水準的知識才有辦法完成或者與其他數據科學家共同合作

