python_網路爬蟲_如何啟用Chrome擴充功能
selenium*Chrome extensions
最近在專案上想要同時快速搜尋yahoo, pchome, momo的價格,因此想要透過飛比價格的Chrome擴充應用來達成這個目的。簡單來說當我在momo網站搜尋到這個行車紀錄器價格為$4,290,同時我想要爬蟲下來飛比價格的其他電商平台金額。
後來發現中文資源的部份,很少人分享如何透過selenium去把Chrome的外掛套件叫出來。一般使用Selenium,都會是很"純"的無痕模式,非常乾淨,什麼都沒有QQ...
花了兩天,google了各大英文論壇,終於讓我試出來了XD
<script src=”https://gist.github.com/Kamtsai/cf1f6a1ff1ac817f951c6659057d9beb.js"></script>
關鍵是這三行,簡單說就是把擴充應用啟用在webdriver中。
chrome_options = webdriver.ChromeOptions()
chrome_options.add_extension('D:\\dataimport\\1.0.13_0.crx')
driver = webdriver.Chrome(chrome_options=chrome_options)
但…難得是:要如何取得crx檔案。一開始我試了很久,發現直接載下來的crx為版本2,但現在的Chrome瀏覽器只能支援版本3了。
就請大家依照下列步驟來做囉!
- 先找到原始擴充套件的路徑:
C:\Users\88693\AppData\Local\Google\Chrome\User Data\Default\Extensions\lmldjiibpfhdjjdjapcdlpjgeaihflpi\1.0.13_0(大概都會放在這個類似的位置。lmldjiibpfhdjjdjapcdlpjgeaihflpi是飛比價格的ID代碼。https://reurl.cc/rx1yVb)
2. 打開你的Chrome瀏覽器,到chrome://extensions/,點開開發人員模式,然後點選封裝擴充功能,
3. 再把剛剛那段路徑丟進去擴充功能根目錄,就完成囉!
最後會產生下面兩種檔案,而XXX.crx,就是最終會丟在程式碼中的crx檔案囉!大功告成!