オブザーバビリティと私

この記事はpyspa アドベントカレンダー 2024の5日目です。

この夏くらいからずっとオブザーバビリティに携わってきました。

その前からトレースを使うくらいのことはしていましたが、夏ごろにオブザーバビリティスタックの管理担当者が忙しすぎてメンテができなくなり、そのタイミングでJaegerが落ちたので「じゃあ私の方でメンテを引き継ぎます」と言って、そこから本格的に勉強を始めました。

これは本当にベストな出会いのタイミングだったなと思っています。本当に自分が必要とする瞬間に勉強の機会が得られたので、オブザーバビリティの価値がどんどん頭に流れ込んでいきました。

今年1年で出会った技術トレンドの中で何を一番に挙げるかと聞かれたら、AIではなくオブザーバビリティと自信を持って答えられます。

私がオブザーバビリティに感動した理由は、私のビッグデータのバックグラウンドが関係していると思っています。

「データは嘘をつかない」という幻想

私がかつてビッグデータの世界に足を踏み入れたとき、データドリブンという言葉にとても共感していました。そのとき、「(人は嘘をつくかもしれないが)データは嘘をつかない」と信じていました。

しかし、これは後に自分自身でその信仰を否定することになりました。

まず第一に、どのデータをどのように取得するかは人間が決めることです。つまり、データは人間によって恣意的に収集されている、という現実があります。人間が決めている以上、そこには主観が入っています。なので、その時点でデータが完全な中立的概念ではなくなります。

次に、データの見せ方、つまり計算式やグラフや表などについても、人間の主張が入り込みます。データを絶対値でみせるのか割合で見せるのか、棒グラフで見せるのか(悪名高い)3D円グラフで見せるのかも人間が決めることです。データが正しくても見せ方によって主張が変わってきます。

そして、そのプレゼンテーションを見た人の解釈も人によって変わります。何に着目するかによって意味が変わってきます。

このようなことを学んでいった結果、データは嘘をつかないというのは幻想でしかなく、つまり大量のデータがあったところでそこから生まれるのは別の主観的情報でしかない、ということに気づきました。

オブザーバビリティの世界とデータドリブン

オブザーバビリティの世界も、その前提からは完全に逃れることはできません。しかし、少なくともビジネスデータを扱う世界よりもはるかに中立的なデータを取り扱うことができると感じています。「APIのリクエスト数」や「APIの実行時間」に恣意的な操作が入る余地はほとんどありません。

だからこそ、データから導き出される結論が比較的強固なものになるなと感じています。だれがどういう意図をもっていようとも、ある関数の実行時間がボトルネックになっていることや、あるAPIのエラーレートが高い、という事実は覆せないのです。

なので、オブザーバビリティの世界はデータドリブンの世界を理想としていた私にとってとても相性のいい分野だなと感じています。

次はどうするのか?

もうしばらくオブザーバビリティの世界を旅して、この分野について深く学んでいこうと思います。オブザーバビリティの概念は今後も長く使えるので、ここできっちりと学んでおいて損はない、と感じました。