python_互動式圖表
plotly.graph_objs * cufflinks 最簡單的互動式圖表
Published in
4 min readJul 5, 2020
在做EDA及作圖的時候,因為資料數量多,可能作圖都會擠在一起。這次我們來試著用互動式圖表用的套件來幫助我們找出insight。
#可以製作互動式圖表的套件
import chart_studio.plotly as py
import plotly.graph_objs as go
from plotly.offline import iplot,init_notebook_mode#為可以將pandas和plotly結合的套件
import cufflinks
cufflinks.go_offline(connected=True)
init_notebook_mode(connected=True)
我們以鐵達尼號資料集來做說明。稍微看一下各欄位是屬於連續資料(float)還是類別資料(object)。
#讀入資料,請注意檔案的儲存路徑。
df = pd.read_csv('D:\\dataimport\\T_train.csv')
df.head()
df.columns
df.dtypes
HIST 直方圖(連續資料)
#kind=’’為指定想要何種圖
#xTitle=’’ x軸的名稱 yTitle=’’ title=’’圖名df['Fare'].iplot(kind='hist',xTitle='Fare',yTitle='count',title='HIST_Fare')
如果我們很好奇Fare >500的情況,可以拖曳放大該區間。可以看到結果為票價505–514.9共有3人。
Scatter散佈圖(連續資料*連續資料)
df.iplot(kind=’scatter’,x=’Age’,y=’Fare’,mode=’markers’,xTitle=’Age’,yTitle=’Fare’)
Bar 柱狀圖(類別資料)
df['Embarked'].value_counts().iplot(kind='bar',xTitle='Embarked',yTitle='counts')
Boxplot 箱型圖(類別資料*連續資料)
df[[‘Pclass’, ‘Fare’]].pivot(columns=’Pclass’, values=’Fare’).iplot(kind=’box’,xTitle=’Pclass’,yTitle=’Fare’)