爬蟲開始
我是用 Node.js 寫爬蟲的,用到的套件有下面這些:
let moment = require('moment'); // 常用的時間處理套件
let co = require('co'); // 用來寫漂亮的 flow-control
let rp = require('request-promise'); // 用來發 http request
let cheerio = require('cheerio'); // 用來做 html parser利用 request-promise 發出不帶 query 的 Ajax,我們就能拿到當月份的山屋資訊網頁。




接著再透過 cheerio 去爬出想要的資料,就完成了。

過程中比較有趣的部分有兩個
- 現在才發現原來 css selector 可以對 attribute 做 select!
- 成功使用了 Regexp 的 group 功能去爬出床位數字~ 耶耶!
至於如何繼續把下個月份的資料也爬出來,就等下一篇文章再說囉!
