RubyとNokogiriでスクレイピング!

RubyとNokogiriを使ってスクレイピングをしていきます。

RubyとNokigiriでスクレイピング

サンプルコードは以下の通り。

URLには適当なサイトURLを指定してください。


require 'nokogiri'
require 'open-uri'

url = '適当なサイトURL'

charset = nil
# webページにアクセス

#HTMLを取得
html = open(url) do |f|
 charset = f.charset
 f.read
end

# nokogiriで変換、サイトタイトル出力
doc = Nokogiri::HTML.parse(html, nil, charset)
p doc.title

このような感じでスクレイピングできます。

何か参考になれば幸いです(*^^*)