Webスクレイピング

PHPQueryでXPathは使える使えない?

PHPQueryでXPathを使えるか使えないのかを調べてみました。PHPQueryでXPathは使えないという意見

WordPressからスクレイピングして、それを記事として投稿する策例。

WordPressからスクレイピングを行い、スクレイピングしたものを記事として投稿する策例を考えましたのでここに記しておきます。対象読者はとくにさだめておりません。必要なことはカバーするつもりですが、はしょられている感じる部分もあるかもしれません。 PHPでスクレイピングできることはわかったけどWordPressでスクレイピングしたい Word

OctoparseでWebサイトのテーブルをごっそり取得する方法

ウェブスクレイピングツールのOctoparseをつかってテーブルの要素がごっそり取得できたのでそのやり方を紹介したいと思います。※テーブルの要素を取得できても大した意味はありませんが、これはこれでもしかしたらなにかに使えるかもしれません。Octoparseの導入方法については下記の記事にまとめています。Octoparseは有料ですが無料でつかうこともできるウェブスクレイピングツールです。

Octoparse – スクレイピングツール。新規登録、ダウンロード、使い方まで実践解説

Octoparse スクレイピングツールの新規登録、ダウンロード、基本的な使い方まで解説していきます。スクレイピングとはスクレイピングとはネット上の情報を収集することをいいます。詳しくは以下を参照してください。一般的にはHTMLフォーマットからデータベースやスプレッドシートに格納・分析可能な構造化データへの変換に、より焦点が当てられてい

Screper – Webスクレイピングが簡単にできるChromeの拡張機能を紹介

簡単にWebスクレイピングすることができるChromeの拡張機能「Scraper」を紹介します。スクレイピングとはなにか?スクレイピングとはインターネットにある情報を収集することをいいます。次に疑問がわいてくることとしてWEBスクレイピングしたデータをなににつかうの?という疑問です。一般的な用途だと次のようなことが考えられるそうです。