エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
以前にBeautifulSoupの使い方を軽く紹介したが、文字コードについて大切なポイントを書くのを忘れていた... 以前にBeautifulSoupの使い方を軽く紹介したが、文字コードについて大切なポイントを書くのを忘れていた。 BeautifulSoupでHTML/XMLを読み込む時は、文字コードを明示的に指定しておくのが良いということだ。 例えば、取得先ページのHTML/XMLの文字コードが euc-jp なんかだった場合は、以下のようにすれば文字化けに悩まされなくて済むわけである。 utf8html = html.decode('euc-jp', 'replace') bs = BeautifulSoup(utf8html) ここはひとつポチっとよろしく。