エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
データ分析の現場においては、使用するデータをWebから取得してこなければならないことが多々あります。... データ分析の現場においては、使用するデータをWebから取得してこなければならないことが多々あります。本記事ではマイナビBOOKSに対してRを用いたWebスクレイピング(Scraping)を行い、"コンピュータ書籍 人気ランキング100位まで"の情報を取得してみます。 1. はじめに データ分析を行うためには当然その元となるデータが必要です。 そのデータが、データベースに既に保存してある場合は、 Rから接続可能なデータベースドライバを経由して、そのままSQLなどを実行すれば問題ありませんが、欲しいデータがWebページ上にあり、かつ、そのサイトがAPIを提供してない場合には、 何らかの手段を用いてデータを取得しなければなりません。 もちろん、必要なデータの数があまり多くない場合には、Webページからコピー&ペーストすることでデータを抽出することもできますが、 データ分析の現場で使用するデータは