python_countplot 直方圖

sns.countplot dxp.aggplot

--

在先前提到資料的類型,主要可區分為”Label”及"Figures"兩大種。而在名目資料Label中,我們最常使用Countplot來看不同Group間的分佈差異。

以前我慣用的作圖方式是Seaborn的sns.countplot,畫出來的結果如下:

countplot

可以發現這樣的作圖有個問題: 當Group的大小有差異的時候,就變得難以比較。案例中的"手機"人數約為"非手機"人數的3倍。因此,在公司的資料科學家的建議下: 以百分比的方式來看countplot。

查了一下seaborn好像沒有這種類型的圖表,後來發現dxp可以解決這個問題。語法如下:

其中hue代表想要區分的族群標籤,normalize代表要拿來作為100%的特徵值。因此橘色部分的加總為100%,藍色部分的加總也為100%。在比較上就變得比較清楚囉。

看更多python互動式圖表:

--

--

Tsai Kam
事業規劃單位的數據分析師 (grow with python)

好奇、愛觀察、喜歡自己動手做,是一個位在事業規劃單位(BU端)的數據分析師。從0程式基礎到能逐步將python應用於工作之中的小魯蛇。