在這個project最後的篇章裡, 我將向各位介紹, 我們如何走過Data Scientist最重要的階段, 不僅藉由這個預測的結果, 我可以很有自信的說只要我有這一些features…
我們已經透過資料爬蟲, 清理, EDA, 特徵工程, 特徵選擇來將資料進行到最後建造模型的步驟了
前提:
接續上一篇討論EDA,我們會繼續接下來的步驟
大家好,在這次的文章裡,我將帶大家手把手的從’探索資料分析’開始,關於數據的獲得和清理各位可以從我上一篇文章取得相關的處理方式和代碼,如對本文章有興趣,希望了解完整的代碼,可以參考的我的github…
因為本人是詹皇死粉,這篇主要會用Lebron James的得分數據來對在ptt NBA板裡面著名的話題,今天擲了多少點做分佈分析和爆擊率,極端爆擊率,烙賽率和極端烙賽率做視覺化(Visulaization),用的Python…