Kaggle是全世界公認最大的資料科學社群,在Kaggle上隨時都有各種資料分析的比賽正在進行,由於這些比賽都會提供高額的獎金,因此會吸引全世界優秀的資料科學家前來比賽,並有許多熱愛分享的科學家在比賽過後再討論區留下他們的當初…
為什麼要關注這些人?就像你打籃球會看NBA關注Kobe Bryant, Lebron James, Stephen Curry一樣,雖然比起去籃球場練投籃或是去健身房做重訓,關注這些球星對於你的籃球技巧完全沒有直接的幫助。但長期來說關注這些大神可以讓你對這整個產業的近況更了解(像是籃球或是AI產業),在你不想打球時看幾場比賽之後又會燃起你心中的熱情,繼續努力練習、學習新知,也會有話題跟身旁的朋友聊。
接下來一系列的文章我們會開始說明要如何在Jupyter notebook裡面做簡單的資料分析。
分為:
第2.1講: 如何獲取資料? Sklearn內建資料集
第2.2講: 如何獲取資料? Google Map API
2018/08/10更新:
由於近期Google map api更新的關係,導致”[資料分析&機器學習] 第2.2講: 如何獲取資料? Google Map API “ 的內容跟程式有些微變化
原本google提供的places_radar…
資料視覺化除了最後一步呈現你的成果之外,還可以在分析的過程中用資料視覺化來看出一些insight,比方說用熱點圖來看你的Deep learning的model是對圖片中哪一部分的看得較重要,或是可以降維之後將資料視覺化去看資料在空間中的分佈,來決定下一步的分析要怎麼做。
Python資料視覺化主要有三大套件: