注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
なので、水色の面積(真陽性:病気の人を「病気」と判断)をなるべく大きくして、緑の面積(偽陽性:健康... なので、水色の面積(真陽性:病気の人を「病気」と判断)をなるべく大きくして、緑の面積(偽陽性:健康な人を「病気」と判断してしまう)を小さくすると、識別の性能が高いと言えます。 以上のデータからROC曲線を描くと下記のグラフになります。 これがどういうものかを、次項より説明していきます。 また、今回識別境界をx=27においていますが、これが良い境界であることは最初のグラフの2つの分布を引き算したグラフを描いてみるとわかります。正しい判定(水色面積:病気の人を病気と判断)を増やし、誤った判断(健康な人を病気と判断)を少なくするので、水色の面積は+、緑色の面積はーとなります。水色から緑を引いた曲線を描き、左から順に識別境界を右にずらして考えると、x=27のところより右はマイナスにしかならないので、面積が最大のところは下記のとおりx=27のところということがわかります。 2. ROC曲線の書き方
2015/05/11 リンク