「サービスオペレーション(以下、SO)」は、運用開始後のITサービスを効果的に提供するための手法をまとめたものである。クラウドサービスでは、インフラ部分の管理主体はクラウドベンダーである。IT部門は、クラウドベンダーに対する統制や、クラウドベンダーに委託していない部分(例えばIaaSならOSより上位)のシステム管理が主になる。IT部門はオペレーションの自動化を推進し余力を創出し、リソースの質的変換を実現することで、SO以外の分野の活動に注力することになる。
サービスオペレーションの自動化は大きく分けて、(1)監視・一次対応、(2)障害対応、(3)要求実現の三つに分類できる(図1)。
(1)監視・一次対応では、システムからのアラートを検知して問題を切り分け、エスカレーションまたは一次対応するという一連の作業を行う。仮想化技術の発展に伴い監視対象ノードは増え、開発部門からの監視要求は減らないため、運用現場は情報が氾濫している。それらを素早く切り分けて、適切に対応するには経験と勘による職人技が必要である。すでに人力による対応に限界が来ている現場も少なくないだろう。
これらの解決には、雑多に分散している情報を集約し、高度なフィルタリングおよび相関関係を考慮した自動切り分けが有効である。例えば、「アラートAとアラートBが発報されたときだけ対応Cを行う」というような複合的な切り分けを自動化することで、無駄な確認作業が減り大幅な効率化が図れる。情報の集約および複合的な自動切り分けを行うことにより、「サービスストラテジ(SS)」や「サービスデザイン(SD)」で定義したサービスレベル合意書の順守状況を常時把握するSLAMチャートや、障害を事前に予測する予兆検知、ITサービスの事業への貢献度を測定するビジネスインパクト管理など、一歩踏み込んだITサービスの見える化も可能になる(図2)。
このようにIT部門は、システムの維持管理だけでなく、ビジネス部門への貢献度も積極的にアピールしていくべきである。