Spidr 是一个Ruby 的网页爬虫库,可以将整个网站、多个网站、某个链接完全抓取到本地。
安装方法:sudo gem install spidr
代码示例:
Spidr.start_at('http://tenderlovemaking.com/')
Spidr.site('http://rubyinside.org/') do |spider|
spider.every_url { |url| puts url }
end
Spidr 是一个Ruby 的网页爬虫库,可以将整个网站、多个网站、某个链接完全抓取到本地。 安装方法:sudo gem install spidr 从一个网址开始爬 Spidr.start_at('http://tenderlovemaking.com/') 爬一个host: Spidr.host('coderrr.wordpress.com') 爬一个网站: Spidr.site('http: