การใช้ Selenium บน Google Colaboratory
หลายๆคนที่ต้องการจะทำ Web Scraping ที่มีการ Render ด้วย Javascript ก็คงจะต้องเคยใช้เจ้า Selenium Web Driver เป็นตัวช่วยในการจัดการกับสิ่งเหล่านั้น
บทความนี้เราแค่จะลองใช้ Selenium บน Google Colaboratory เท่านั้น
✅ Step 1 — Install library
- Selenium : เป็น web drivder
- Chromium : เป็น web browser
✅ Step 2— Import library & Call website
โดยส่วนนี้เราก็จะทำการกำหนด chrome_options ซึ่ง option อย่างเจ้า “- -headless” เนี่ยเป็นการบอกว่า “not display windows” ซึ่งก็หมายความว่าจริงๆ แล้วเราจะ run selenium web driver แบบ server run ซึ่ง เมื่อเราทำการ .get(url) แล้วเราจะได้ page_source มาตามปกติ แต่จะไม่แสดง pop up ของ url ใหม่ที่เราสั่งเปิดไปขึ้นมาให้เห็นแบบที่เราใช้ Selenium on local นั่นเอง