エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
Pythonのcollectionsモジュールに含まれるdefaultdictを用いて大量のドメインを分類する方法について説... Pythonのcollectionsモジュールに含まれるdefaultdictを用いて大量のドメインを分類する方法について説明します。 マニュアルはこちら↓ 8.3. collections — 高性能なコンテナ・データ型 — Python 2.7ja1 documentation defaultdictはディクショナリ状のオブジェクトを返します。ディクショナリとは定義域(key)と値域(value)という2つの集合上で定義された対応を実現するデータ構造です。今回はドメインをピリオド(.)で区切って、ディクショナリを連結して木構造のようにします。 例えば、ドメインを"www.google.com"とすると、"www", "google", "com"に区切って、後ろの単語を親ノードとして木構造を形成します。つまり、トップレベルドメインが最上位のノードとなるわけです。 サンプルデータを以下の