機械学習に使える、オープンデータ一覧 ※随時更新
機械学習をやりたいんだけど、データがない!他のデータ使ってみたい! そんな方のために、機械学習に使えるオープンデータを集めました。
他にも、このデータセットオススメ!というものがあれば、是非ご紹介して頂けると嬉しいです。m(__)m
UC Irvine Machine Learning Repository
カリフォルニア大学アーバイン校が公開した、データセット。351件のデータセットがあり後述する DATA GO に比べれば少ないが、ほとんどがMachine Learning用のデータ・セットなので、かなりオススメ。
UCI Machine Learning Repository
かの有名なあやめの花(iris)のデータセットもここから見ることができます。
国立情報学研究所
yahoo,楽天,ニコニコなどのデータがあります。
DATA.GO.JP
日本政府が、保有しているデータを公開したもの。
ちなみに、一番人気は平成25年産野菜生産出荷統計
らしい。
DATA.GOV
DATA.GO.JPが参考にした、オープンデータサイト。こちらは、U.S. Government
のデータになります。
現在、185,967 DATASETS
という膨大なオープンデータを公開している。
※DATA.GO.JPは、17,105 件のデータを公開している。
土地代データ
日本全国の土地代と、その年間推移が載っています。
各種SNS
SNSはAPIを公開しているので、それを利用してデータを取得できます。