インターネットから情報を取得する場合にはほとんどにおいてHTML解析を行う必要があります。ということでRubyだと基本的にnokogiriライブラリを扱うことになります。 しかし、nokogiriではタグを指定するのにXPathを使います *1。これがいまひとつ分かりづらい。 ということで情報源を並べておきます。 ネットのなかの情報源 XPathチートシート XPathを扱う場合に最も役立つと思われる。とても便利。 XPath (XML Path Language) XPath学習の導入として最適。しかし誤記があるのが痛い。 xpath cover page - W3C 大本山の公式文書。例示も多いので意外に分かりやすい。邦訳はXMLパス言語 (XPath) スクレイピングのためのNokogiri利用メモ - それはそれ。これはこれ。 nokogiriの解説記事としてはやはりピカイチ。でも