python_countplot 直方圖
sns.countplot dxp.aggplot
Published in
2 min readJan 15, 2020
在先前提到資料的類型,主要可區分為”Label”及"Figures"兩大種。而在名目資料Label中,我們最常使用Countplot來看不同Group間的分佈差異。
以前我慣用的作圖方式是Seaborn的sns.countplot,畫出來的結果如下:
可以發現這樣的作圖有個問題: 當Group的大小有差異的時候,就變得難以比較。案例中的"手機"人數約為"非手機"人數的3倍。因此,在公司的資料科學家的建議下: 以百分比的方式來看countplot。
查了一下seaborn好像沒有這種類型的圖表,後來發現dxp可以解決這個問題。語法如下:
!pip install dexplot
import dexplot as dxpdxp.aggplot('value', data=df22, hue='Q1#', normalize="Q1#", aggfunc='count')
其中hue代表想要區分的族群標籤,normalize代表要拿來作為100%的特徵值。因此橘色部分的加總為100%,藍色部分的加總也為100%。在比較上就變得比較清楚囉。
看更多python互動式圖表: