Used-car Market Analysis Using Web Scraping (R) พร้อมแจก Data Set

Chaiyasit Bunnag
11 min readApr 14, 2019

สวัสดีครับ วันนี้เราจะมาใช้เทคนิค Web scraping เพื่อวิเคราะห์ตลาดรถยนต์มือสอง โดยเว็บไซต์ที่เราเลือกคือ www.one2car.com โดยสิ่งที่ผมชอบเกี่ยวกับเทคนิคนี้ก็คือเราสามารถหาคำตอบง่ายๆ เกี่ยวกับตลาดรถยนต์มือสองในปัจจุบัน เช่น

> Toyota หรือ Honda มีการประกาศลงขายมากกว่ากัน และรุ่นไหนที่ถูกปล่อยสู่ตลาดมือสองมากที่สุด?

> Price range ของรถยนต์แต่ละรุ่น ตัวอย่างเช่นถ้าพูดถึง Honda Civic ราคาที่ถูกประกาศขายนั้นอยู่ในช่วงใด? รวมถึงเปรียบเทียบกันระหว่าง Japanese brands (Toyota, Honda, etc.) และ Super car brands (Ferrari, Aston, etc.)

> ตลาดรถยนต์มือสองส่วนใหญ่แล้วราคาของรถไปกองอยู่ที่ช่วงราคาใด

🚗 .. 🚙 ~~~🚓

>> What is Web Scraping? <<

โคดคร่าวๆ คือการที่เราเขียนคำสั่งให้ไป Crawling elements ต่างๆ ที่อยู่บนหน้า Web page ให้เข้ามาอยู่ใน Development environment ของเรา (R, Python) หลังจากนั้น Transform ให้สิ่งที่เราดึงมาถูกจัดอยู่ในรูปของ Data frame เพื่อทำการวิเคราะห์ข้อมูลต่อ

รูปแบบ Data ที่อยู่บนเว็ปไซต์นั้นมันถูกออกแบบมาแค่ให้ User ดู (For consumption only) ไม่สามารถดึงออกมาวิเคราะห์ได้โดยตรง เราจึงต้องทำการ Scraping ในสิ่งที่เราสนใจหลังจากนั้น Transform สิ่งเหล่านั้นให้อยู่ใน Format ที่เราสามารถวิเคราะห์ได้ครับ ตัวอย่างเช่นถ้าเราจะทำการเก็บราคาประกาศขายของรถยนต์ 40,000…

--

--

Chaiyasit Bunnag

a Data Analyst with no related degrees T^T; an Analogical Thinker