python_RE函數_正規式運算
Regular Expression, re.split()
Published in
Jan 21, 2020
資料處理中,有的時候會遇到要在欄位中取特定字出來的情況,舉例來說:我們想要取value欄位中,位於 【 】中的字詞,取出 類似【冰箱】這樣的文字,這個時候我們就會用到RE正規式運算( 功能:處理匹配字串)。
kk = []
for k in df33_Q3['value']:
g = re.split(r'【(.*?)】',k)[1]
kk.append('【'+ g+'】')
df33_Q3['Q3分類'] = kk
df33_Q3
簡單的代碼如上,基本上參考:
成品如下:
大家可以根據自己的使用情境來練習看看。
大家可以來這邊練習正規表達式:
網路爬蟲結合RE使用:
取得t3n1 or t3r1的table。import re
EPS_ratio = soup.find_all(‘td’, class_=re.compile(“t3[n|r]1”))