整合在不同資料夾中的檔案
Jul 21, 2017 · 2 min read
多期的資訊合併才能做數據分析
import pandas
imports os
dflist=[] #建立空的list 放大的dataframe
for f in os.listdir(‘lvrdata2’):#os.listdir=在lvrdata中每個資料夾名稱
<Tab>path=’lvrdata2/{}/A_lvr_A2.CSV’ #產生新的路徑,用{}填空的方式填入變動的資料夾
<Tab>df=pandas.read_csv(path.format(f),encoding=’big5’) #.format(f),f會放進在lvrdata中每個資料夾
用pandas.read_csv讀取入資料成為pandas dataframe格式
合併成大的dataframe
<Tab>dflist.append(df) #將df資料 用append加到dflist之中 這個delist包含多個dataframe
len(dflist) #查看有多少個dataframe資料
dfall=pandas.concat(dflist) #用pandas.concat合併delist,成為dfall
dfall.head() #顯示deal前五筆
dfall.describe() #顯示dfall敘述性統計
dfall.to_excel(‘lvr_data.xlsx’)#輸出dfall成lvr_data.xlsx(excel檔案),pandas可以輸出成各種格式
Reference From 大數學堂
