はじめに オンプレからクラウドへリフト&シフト案件にて、 既存の監視ツールをそのまま移行している経験はありませんか。 OSレイヤーより上の監視を行う際はサードパーティの監視ツールをそのまま使用するケースがあるかと思います。 そういった監視サービスは便利な反面ライセンス管理・更新の手間/コストがかかるため極力導入を控えたいといった課題がある中、 本記事ではOSレイヤーより上のプロセス監視をAWSの機能を組み合わせて実現させた記事になります。 結論 以下サービスの組み合わせでプロセス死活監視/自動復旧が実現可能でした。 ※ただし、自動復旧のための再起動シェルは作成が必要です。 組み合わせたサービス 【死活監視検知/メール連絡】 「CloudWatchアラーム」⇒「SNS」 【死活監視検知/自動復旧】 「CloudWatchアラーム」⇒「EventBritge」⇒「SSM RunCommand」