エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
rubyでjavascriptの動作が必要なページをクロールする場合、 seleniumでやろうとしたんだけど、AWSのec2... rubyでjavascriptの動作が必要なページをクロールする場合、 seleniumでやろうとしたんだけど、AWSのec2だとfirefoxのwebdriverがインストールできなくて挫折w(ローカルのmacだと簡単だったけど) ちなみにここをみてもダメポだった そこで代わりにCasperJSを使ってみたら何とかなった。 (capybaraとpoltergistという選択肢もあったけど…) CasperJSはPhantomJSをもげもげするライブラリでseleniumに比べると 必要なソフトのインストールは楽。 インストール方法は下記が参考になった。 CasperJSで画面キャプチャをとる | Siguniang's Blog CasperJsでもげもげして該当ページのHTMLをファイルに保存して 使い慣れてるrubyのNokogiriで保存したファイルをパースしてスクレイピングする感