注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
決定木とは、分類ルールを木構造で表したものです。分類したいデータを目的変数(従属変数)、分類する... 決定木とは、分類ルールを木構造で表したものです。分類したいデータを目的変数(従属変数)、分類するために用いるデータを説明変数(独立変数)といいます。目的変数がカテゴリデータなどの場合は「分類木」、連続値などの量的データの場合は「回帰木」と呼ばれます。 決定木の最大のメリットは、結果にグラフを用いることができるため、視覚的に確認できることです。 ここでは、R言語の「rpart」パッケージを用いて決定木について見ていきます。サンプルデータとして、Rに標準で含まれている「Titanic」を使います。このサンプルデータはタイタニック号の乗客の属性情報と生死の情報が含まれています。生死を分けた要因を属性情報から分類するとどのようになるのかを見ていきます。 まずは必要となるパッケージのインストールとロードを行います。「rpart」パッケージは決定木を行うためのものだが、「rpart.plot」と「pa
2019/10/17 リンク