エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
最近スクレイピングしてないので素振りをすることにした。 今回は岡村靖幸のWikipedia記事内の経歴の項... 最近スクレイピングしてないので素振りをすることにした。 今回は岡村靖幸のWikipedia記事内の経歴の項目における人名を抽出して眺めてみたい。 以下の流れで進める。 1. ページを眺めて、スクレイピングの対象とする文章が埋め込まれている場所を特定する。 2. rvestパッケージを使ってスクレイピングを実行する。 3. gooラボの固有表現抽出APIを使って人名を抽出する。 ページを眺めて、スクレイピングの対象とする文章が埋め込まれている場所を特定する。 まず岡村靖幸のページを眺めてみよう。 https://ja.wikipedia.org/wiki/%E5%B2%A1%E6%9D%91%E9%9D%96%E5%B9%B8 衝撃的なデビュー、瞬く間にスターダムにのし上がった後の没落、3度の逮捕からの不死鳥のごとき復活、様々な想いが私の胸を去来する。 さて、記事一覧において、各記事のURL