hui509專案|Kaggle 鐵達尼號存活預測分析相信學習數據分析的朋友們都聽過【經典案例|鐵達尼號存活預測分析】,若這個主題是你第一個專案的話,應該不免會有點手忙腳亂,本文將搭配之前文章【自學|資料科學專案的流程指南】和大家逐步拆解分析流程,同時記錄自己本次練習的成果!話不多說,一起看下去吧!Nov 19, 2023Nov 19, 2023
hui509Pandas|資料視覺化 — SeabornPython 中,除了 Matplotlib 適合用於資料視覺化之外,Seaborn 也是一個好用的函式庫,兩者經常會放在一起介紹或者使用,今天就和大家聊聊 Seaborn 的厲害吧!Oct 8, 2023Oct 8, 2023
hui509Pandas|資料視覺化 — MatplotlibPandas 是 Python 生態系中,適合用來做資料分析或機器學習的套件,上一篇文章介紹 Pandas 中對新手相當友善的繪圖函數 plot( ) ,讓我們能夠快速完成資料視覺化,然而,有的使用者對於線條、圖形有更多想法需要更多自定義的操作,此時,可以搭配 Python…Oct 7, 2023Oct 7, 2023
hui509Pandas|一招 plot() 帶你快速製圖簡報時,我們常會聽到「用數字說話」這句話,面對主管、同事真的是講出每個數字就能讓聆聽者理解嗎?錯!大部分的人單看數字都容易眼花撩亂,想讓對方理解你的報告,圖表視覺化的能力就非常重要!今天,就帶大家用一招快速將複雜的數字變成簡單的圖表!一起來看!Oct 6, 2023Oct 6, 2023
hui509Pandas|如何在 VS Code 印出漂亮的 DataFrame?VS Code 的使用者應該有發現 Pandas 的輸出結果有時並不是那麼好閱讀,對於一個有版面強迫症的我來說,曾經因為 DataFrame 歪掉的格式十分煩惱,詢問前輩表示不用太在意,上網搜尋多推薦改用 Jupyter…Oct 5, 2023Oct 5, 2023
hui509Pandas|讓程式快速完成樞紐分析Excel 本身提供方便的樞紐分析,但你有想過用程式該如何撰寫嗎?今天就來分享一下 Pandas 中的樞紐分析:pivot_table( ) 一起透過交叉分析,快速解讀資料吧!Oct 4, 2023Oct 4, 2023
hui509Pandas|資料的分組和聚合在大型數據當中,有時我們會需要透過群組的方式概括整體資料,除了用以觀察之外,也能進一步深入處理,本文將分享如何使用資料的分組和聚合操作,內容包含: 1. 資料分組與檢視:groupby( )、get_group( ) 2. 資料聚合:agg( )Oct 3, 2023Oct 3, 2023
hui509Pandas|資料合併的三種常用語法在茫茫數據海當中,資料散布在各種不同的地方,可能是資料庫、網站、文件等,為了要有效統一資料集,方便後續的分析和報告,資料合併的操作是不可不學的,以下將以案例和大家分享資料合併的三種常用語法,內容包含: 1.水平或垂直合併:concat( ) 2.關聯合併:merge(…Oct 2, 2023Oct 2, 2023