Kaggle是全世界公認最大的資料科學社群,在Kaggle上隨時都有各種資料分析的比賽正在進行,由於這些比賽都會提供高額的獎金,因此會吸引全世界優秀的資料科學家前來比賽,並有許多熱愛分享的科學家在比賽過後再討論區留下他們的當初…
支援向量機(Support Vector Machine)簡稱SVM這個名字光看字面三個字的意思都懂,但合起來就完全看不懂了。不過SVM概念很簡單,先聽我說個故事
有一天上帝給了你一個考驗,要你用一個棍子將這兩顆不同顏色的球分開
我們先介紹在機器學習領域最早被開發出來的演算法:感知器Perceptron(也稱為Perceptron Learning Algorithm簡稱PLA)、並教大家如何實作一個perceptron演算法來訓練Iris資料集,並成功分類。
首先要注意Perceptron這個演算法只有在資料是線性可分的形況下才能正確分類(演算法才會停止)。什麼是資料是線性可分呢?以2D的情況簡單來說就是可以在平面上找一條線去完全切出這兩群,3D的話就是可以在空間中找一個平面去切出兩…
前面Perceptron 能夠讓我們成功達成二元分類,但我們只能知道預測結果是A還是B,沒辦法知道是A、是B的機率是多少。這種應用在我們生活中非常常見,比如說我們要根據今天的溫度、濕度、風向來預測明天的天氣,通常我們會需要知道明天是晴天的機率以及雨天的機率,來決定是否帶傘具出門。如果使用Logistic Regression就可以幫我們達成這樣的目標!
卷積神經網絡(Convolutional Neural Network)簡稱CNN,CNN是所有深度學習課程、書籍必教的模型(Model),CNN在影像識別方面的威力非常強大,許多影樣辨識的模型也都是以CNN的架構為基礎去做延伸。另外值得一提的是CNN模型也是少數參考人的大腦視覺組織來建立的深度學習模型,學會CNN之後,對於學習其他深度學習的模型也會很有幫助,本文將為示範如何使用CNN來達成99%正確度的手寫數字辨識。
資料視覺化除了最後一步呈現你的成果之外,還可以在分析的過程中用資料視覺化來看出一些insight,比方說用熱點圖來看你的Deep learning的model是對圖片中哪一部分的看得較重要,或是可以降維之後將資料視覺化去看資料在空間中的分佈,來決定下一步的分析要怎麼做。
Python資料視覺化主要有三大套件:
這篇文章要教大家如何利用最基礎、簡單的機器學習知識加上Random…