海外・国内それぞれで公開されているデータセットをまとめました。 情報推薦(推薦システム)に関する研究で利用することを想定し、アイテム(商品や映画等)とそれに対する評価情報がペアになっているものをピックアップしています。 <海外> GroupLens Dataset http://grouplens.org/datasets/movielens/ 映画に対する5段階評価 (1-5) 100,000 / 1,000,000 / 10,000,000 ratings 1,000 / 6,000 / 72,000 users 1,700 / 4,000 / 10,000 movies 最も有名で、最も利用されているデータセット。 データサイズは100k, 1M, 10Mの3種類が用意されている。 The Book-Crossing Dataset http://www.informatik.uni