資料科學家被哈佛商業雜誌評為21世紀最性感的工作,那麼要如何才能擔任資料科學家呢?以我自身的工作經驗以及觀察來説,資料科學團隊裡面主要有三種人
在實務上我們在Train model時常常會遇到Overfitting的問題,也就是Model在Training的Data正確率很高,但是拿到Testing…
當要分析的資料大到一台電腦沒辦法處理(可能是檔案過大沒辦法載入單台電腦的記憶體、或是單台運算時間太長)的時候,通常有兩種解決方法。1.購買一台昂貴的超級電腦(96核 CPU, 1TB Memory…) 2.購買多台較便宜的一般電腦來分工處理原本的工作。
XGboost全名為eXtreme Gradient…
卷積神經網絡(Convolutional Neural Network)簡稱CNN,CNN是所有深度學習課程、書籍必教的模型(Model),CNN在影像識別方面的威力非常強大,許多影樣辨識的模型也都是以CNN的架構為基礎去做延伸。另外值得一提的是CNN模型也是少數參考人的大腦視覺組織來建立的深度學習模型,學會CNN之後,對於學習其他深度學習的模型也會很有幫助,本文將為示範如何使用CNN來達成99%正確度的手寫數字辨識。
這篇文章要教大家如何利用最基礎、簡單的機器學習知識加上Random…
支援向量機(Support Vector Machine)簡稱SVM這個名字光看字面三個字的意思都懂,但合起來就完全看不懂了。不過SVM概念很簡單,先聽我說個故事
有一天上帝給了你一個考驗,要你用一個棍子將這兩顆不同顏色的球分開
前面Perceptron 能夠讓我們成功達成二元分類,但我們只能知道預測結果是A還是B,沒辦法知道是A、是B的機率是多少。這種應用在我們生活中非常常見,比如說我們要根據今天的溫度、濕度、風向來預測明天的天氣,通常我們會需要知道明天是晴天的機率以及雨天的機率,來決定是否帶傘具出門。如果使用Logistic Regression就可以幫我們達成這樣的目標!