はじめに
こんにちは、Google CloudでオブザーバビリティとSREの担当をしているものです。今日は去年仕事でやってたものがようやっと表にでたのでその紹介をします。
「SREエンタープライズロードマップ」がでました
Enterprise Roadmap to SREの日本語訳が公開されました。本レポートはSREに関して、その技術的立ち位置、導入する理由、必要なプロセス、文化、事例など、幅広く大局観を与えるコンパクトなレポートとなっています。ぜひご一読ください。#SRE #DevOps #GoogleCloudhttps://t.co/Lo1yY40CF4
— Google Site Reliability Engineering (@googlesre) 2023年1月25日
「SREエンタープライズロードマップ」はかねてより "Enterprise Roadmap to SRE" としてGoogle SREのウェブサイトで公開されていたレポートの日本語訳です。無料で公開されています。
(英語になってしまう人は画面右下の言語設定を「日本語」に設定してみてください)
このレポートは役員レベルを始めとする意思決定者の方々でSREに関心が少なからずあり、自組織でどのように適用していくかについて、手早く理解したいという方々を想定読者としています。
- SREとその他フレームワークや文化との関連性(ITIL、DevOps、アジャイル、リーン)
- なぜSREなのか
- SREの基本原則とはなにか。そのアンチパターンとは。
- SRE本の要旨
- SREをどう始め、どう継続するか
- Google以外での事例
このようなトピックを見て気になった方はぜひご一読ください。60ページ程度の小冊子ですので、時間のない方でもさっと読める分量だと思います。
さらに理解を深めたい方に
本レポートはSREの概要を理解するのには向いていますが、ここからさらに詳細を理解したいという方々には以下の書籍をおすすめいたします。
まずは本レポートの中でも参照されているSRE本こと「SRE サイトリライアビリティエンジニアリング」と、その演習向け書籍となる「サイトリライアビリティワークブック」です。
特に1冊目は書籍内で触れられている各プラクティスが共通言語として参照されることが多いので、通読はしなくても手の届くところにご用意いただくことをおすすめします。
次は明日発売開始の「オブザーバビリティ・エンジニアリング」です。
こちらは特にサービスレベル目標を決めた後に、実際に計装を行ったり、テレメトリーを分析するための基盤を考えたい、という方向けの書籍です。
また既存の監視システムからよりSREを目指した方向に発展させていきたい、という方には「入門 監視」をおすすめします。
この本は直接的にSREという名前は出していませんが、目指す方向性は一致した内容になっていますので、非常に参考になると思います。
本レポートの最後にあるGoogle以外でのSRE導入の事例をもっと見たいという方には「SREの探求」をおすすめします。各社事情が異なる状況からSREの導入を行い、どのようにその運用に至ったかを知る、良い書籍だと思います。