[網路爬蟲]運用selenium開啟chrome瀏覽器

天道酬勤
4 min readJul 14, 2018

--

Chrome 自動化

簡介

說到爬蟲,不得不提Selenium,Selenium主要用於瀏覽器的自動化測試,使用Selenium時,就像是在控制一個機器人為您操作Chrome瀏覽器。

時下不少人會用selenium來爬取牌照匯率即時股價等資訊,如果讀者需要從網站下載大量且須即時更新的資料,那selenium會是個不錯的選擇。

以下將為大家介紹 第一個selenium教學-用selenium開啟chrome

分成三個環節 1.環境建置 2.程式演練 3.問題與討論

環境建置

selenium需要透過chromeDriver來控制chrome瀏覽器,所以必須要安裝chromeDriverselenium套件。

Step 1: 下載chromeDriver

請先到 http://chromedriver.chromium.org/downloads 下載最新版的ChromeDriver,以免發生與chrome瀏覽器版本不相容的問題。

選擇 chromedriver_win32.zip,此版本可支援32及64位元作業系統

下載完成後,解壓縮後,就會看到 chromedriver.exe了

Step 2:

還未安裝Anaconda者,可參考這篇教學文,[資料分析&機器學習] 第1.1講:Python懶人包 Anaconda 介紹&安裝

開啟Anaconda prompt,輸入pip install selenium

pip install selenium

成功後,顯示Successfully installed selenium.

程式演練

打開jupyter notebook,若對jupyter notebook操作不熟者請參考這邊教學,[資料分析&機器學習] 第1.2講:Jupyter Notebook介紹

開啟jupyter後,建立.py檔,並且把chromedriver.exe放到此目錄底下。

輸入這兩行程式碼

from selenium import webdriver  #從library中引入webdriver
browser = webdriver.Chrome() #開啟chrome browser

運行後,即可看到Chrome目前受到自動測試軟體控制,恭喜您完成第一個Chrome自動化專案!!!

問題與討論

Q1:為何我執行browser = webdriver.Chrome()之後,會顯示Message: ‘chromedriver’ executable needs to be in PATH.?

請把chromeDriver與您的.py檔放置同一個目錄下。

Q2:為何我執行browser = webdriver.Chrome()之後,Chrome瀏覽器會跳出後又立即閃退?

問題在於您下載的ChromeDriver不支援你目前的Chrome瀏覽器版本。詳細解決辦法可以參考 ChromeDriver 閃退原因

--

--