今回の課題 Kaggleで時系列データ分析についてインプットをしていたところ、 ラグ特徴量という特徴量が出てきた。 使い所について、イマイチ理解ができなかったため、勉強することにした。 ラグ特徴量とは 今の時間の特徴だけに注目せずに、過去や未来の特徴を用いて、 現在のデータの特徴量を増やす方法。 ラグ特徴量を用いることで、機械学習モデルの予測精度を向上できる可能性がある。 (ラグ特徴量を追加するので、重回帰分析になる。) 過去のデータを特徴量として使い、機械学習モデルの予測精度を向上させたいときに使うことができる。 ※参考:【機械学習】時系列データの前処理 -ラグ特徴量作成- コード 1)関数を用意しておく #指定したカラム、指定した単位でgroupbyして集計してデータフレームで返す関数 def grouped(df, key, freq, col): # Grouperは、時系列をGr