python_網路爬蟲_如何啟用Chrome擴充功能

selenium*Chrome extensions

--

最近在專案上想要同時快速搜尋yahoo, pchome, momo的價格,因此想要透過飛比價格的Chrome擴充應用來達成這個目的。簡單來說當我在momo網站搜尋到這個行車紀錄器價格為$4,290,同時我想要爬蟲下來飛比價格的其他電商平台金額。

後來發現中文資源的部份,很少人分享如何透過selenium去把Chrome的外掛套件叫出來。一般使用Selenium,都會是很"純"的無痕模式,非常乾淨,什麼都沒有QQ...

花了兩天,google了各大英文論壇,終於讓我試出來了XD

<script src=”https://gist.github.com/Kamtsai/cf1f6a1ff1ac817f951c6659057d9beb.js"></script>

關鍵是這三行,簡單說就是把擴充應用啟用在webdriver中。

但…難得是:要如何取得crx檔案。一開始我試了很久,發現直接載下來的crx為版本2,但現在的Chrome瀏覽器只能支援版本3了。

就請大家依照下列步驟來做囉!

  1. 先找到原始擴充套件的路徑:

C:\Users\88693\AppData\Local\Google\Chrome\User Data\Default\Extensions\lmldjiibpfhdjjdjapcdlpjgeaihflpi\1.0.13_0(大概都會放在這個類似的位置。lmldjiibpfhdjjdjapcdlpjgeaihflpi是飛比價格的ID代碼。https://reurl.cc/rx1yVb)

2. 打開你的Chrome瀏覽器,到chrome://extensions/,點開開發人員模式,然後點選封裝擴充功能

3. 再把剛剛那段路徑丟進去擴充功能根目錄,就完成囉!

最後會產生下面兩種檔案,而XXX.crx,就是最終會丟在程式碼中的crx檔案囉!大功告成!

--

--

Tsai Kam
事業規劃單位的數據分析師 (grow with python)

好奇、愛觀察、喜歡自己動手做,是一個位在事業規劃單位(BU端)的數據分析師。從0程式基礎到能逐步將python應用於工作之中的小魯蛇。