エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
はじめに リコメンドシステムを作っている時に、類似度はどうせユークリッド距離を使っているものだと思... はじめに リコメンドシステムを作っている時に、類似度はどうせユークリッド距離を使っているものだと思っていました。しかし、レコメンドシステムの実装例を眺めていたら、ユークリッド距離ではなく、コサイン類似度というものを用いてました。気になったので、記事にしてみます。 ちなみにこれは、アイテムベース向きの尺度であります コサイン類似度とは コサイン類似度は、ベクトル同士の成す角度の近さを表現するため、三角関数のコサインの通り、1に近ければ類似しており、0に近ければ似ていないことになる。 以下の式で計算できる。 Pythonでの実装例 def cosin_similarity(x, y): return np.dot(x, y)/(np.sqrt(np.dot(x, x))*np.sqrt(np.dot(y, y)))