一から学べる Google Cloud Networking リファレンス ガイド
2016年10月4日火曜日
私は最近、Google Cloud Platform(GCP)部門の所属となりました。テクニカル インフラストラクチャ部門に 9 年間在籍した後、最近このチームに加わり、お客様と協力して次世代のアプリケーションやサービスを GCP 上で構築する仕事に携わっています。
今の仕事をしていると、Google がどうやってシステムを構築しているかを内部から理解できますが、それは組織の外からはわかりにくいものだということに気がつきました。ただし、どこを見ればよいのかがわかってしまえば、さほど難しいことではありません。
私は時間をかけて、GCP サイト内にある Google Cloud Networking のページをあちこち見て回り、お客様が Google のアプローチをより深く理解できるような資料がないか探してみました。
そして、Google Cloud Networking について知りたい人のためにリンク集を作りました。それがこの投稿です。リンク先の記事はかみ砕いて書かれており、前のコンテンツに基づいて話が進むよう順に並べてあります。
はじめに
最初に、約 15 分で簡単に背景を把握していただくため、GCP の概要のページをお薦めします。ここには、GCP に取り組むにあたって必要なコンセプトすべてが 1 ページの概説として書かれています。その後、GCP サービスに関するドキュメントにも目を通すとよいでしょう。これも 1 ページで、主に顧客対応サービス(ネットワーキング サービスも含まれます)について書かれています。
少々わかりにくいのですが、GCP のネットワーキングは、Google Container Engine(Kubernetes)や Google Cloud Dataflow といった最新のマネージド サービスの基盤にもなっています。これらを読めば大まかな状況を把握でき、GCP を実際に使う準備ができたと言えます。
ネットワーキング関連の Codelabs
Google では Codelabs に特化した完全なサイトを用意しています。ここで重要な技術的コンセプトを学ぶのが、私のお気に入りの方法です。Cloud Codelabs のカテゴリーには、「Networking 101」と「Networking 102」という 2 つのネットワーキング関連の素晴らしい Codelabs が用意されています。これらをお薦めする理由はいくつかあります。どちらも全体を通して約 90 分で終わること、どちらもクラウド ネットワーキングで最もよく使われている機能をいくつか簡単に紹介していること、どちらもパフォーマンス関連の役立つヒントが書かれていることです。
そして最も重要なことは、これらの Codelabs を完了すると、GCP 上でクラウド ネットワーキングを実験するうえでとても優れたサンドボックスが出来上がることです。
Google Cloud Networking のリファレンス
Google Cloud Networking のリファレンス ページで一番いいものを知りたい方もおられることでしょう。Google Cloud Networking の機能に関するドキュメントは、メインとなる 2 つのランディング ページに分かれています。1 つは Cloud Networking 製品のページで、もう 1 つは Compute Engine のネットワーキングに関するページです。製品のページでは、Cloud Virtual Network や自動スケーリング、ロード バラシシング、グローバル DNS、Cloud Interconnect、Cloud CDN など主要な製品機能を紹介しています。各ページの一番下には、大変役に立つガイドやリソースへのリンクがあります。ここは見逃してしまいがちなので、下のほうまでスクロールして最後まで見るようにしてください。
Compute Engine のネットワーキングに関するページは、他では見つけられないさまざまな面白い詳細情報の宝庫となっています。ここには、ネットワークとサブネットワークがリージョンやゾーンとどう関係しているのかといった私が頭の中に描いている全体像や、割り当てに関する詳細、デフォルトとなる IP レンジ、デフォルトのルート、ファイアウォールに関するルール、内部 DNS の詳細、gcloud を使ったシンプルなコマンドラインの例などが用意されています。
このページで見かける宝石の例は、ネットワークのスループットを測定するうえでちょっとした宣伝のようになっており、クラウド プロバイダーを比較するためのオープンソース ベンチマーク ツール PerfKit Benchmarker へのリンクが貼ってあります(詳細は後述)。私はよくこのページを参照し、以前はよくわからなかったことが説明されているのを発見します。
さらに詳しく知りたい方は、GCP のドキュメント内にあるネットワーキング関連のチュートリアルや、非常に面白いインテグレーションに関するソリューションのドキュメントも参考にしてください。
また、AWS ユーザー向けの GCP ネットワーキングのページもぜひ読んでみてください。ネットワーキングに関する機能が非常にわかりやすく要約されています。
また、Compute Engine の料金ページには、それ以外に必要なコストに関する情報が書かれています。Codelabs で標準的なマシン タイプを使った場合の料金や、一般的なネットワーク料金へのリンクも用意されています。ページの少し下のほうには IP アドレスの価格もあります。さらには、一番下のリンクにある見積請求価格インボイスのページで、Codelabs にて利用した分の概要を見るのも便利かもしれません。
さらに詳しく知りたい方は、GCP のドキュメント内にあるネットワーキング関連のチュートリアルや、非常に面白いインテグレーションに関するソリューションのドキュメントも参考にしてください。
また、AWS ユーザー向けの GCP ネットワーキングのページもぜひ読んでみてください。ネットワーキングに関する機能が非常にわかりやすく要約されています。
価格とパフォーマンス
先に進む前に、無料クォータ(割り当て)分からネットワーキングの実験をさらに進めるにはどの程度コストがかかるかを知りたい人もいると思います。そのためには GCP の料金ページを参照してください(無料トライアルへのリンクも用意されています)。また、Compute Engine の料金ページには、それ以外に必要なコストに関する情報が書かれています。Codelabs で標準的なマシン タイプを使った場合の料金や、一般的なネットワーク料金へのリンクも用意されています。ページの少し下のほうには IP アドレスの価格もあります。さらには、一番下のリンクにある見積請求価格インボイスのページで、Codelabs にて利用した分の概要を見るのも便利かもしれません。
ここまで進めば、Codelabs で実施した簡単なパフォーマンスやレイテンシのテストについて考え始めてもよいでしょう。ネットワーキングとファイアウォールのドキュメントの中には、出口スループットのキャパシティに関する非常に有用なディスカッションがあり、PerfKit Benchmarker でスループットを試すことも可能です(ソースはこちら)。
このツールは、インスタンスのスピンアップにおける重労働をすべてこなしますし、クラウド プロバイダーがどのようにリージョンを定義しているかも把握するため、現実的な比較が可能です。PerfKit Benchmarker では、さまざまな分野で承認されたベンチマークを特定するという面倒な作業を他の誰かがすでに済ましているのです。
現実の世界でのユースケース
Google Cloud Networking の主なコンセプトや機能が理解できたら、次は他の人たちがどのように利用しているかを知りたくなると思います。最初の疑問はどうやって安全に設定するかということでしょう。「Securely Connecting to VM Instances」(仮想マシン インスタンスへの安全な接続)には、ファイアウォールや HTTPS / SSL、VPN、NAT、シリアル コンソールといった主要トピックの詳細や、gcloud の便利な例、Codelabs でざっと設定したものが反映された全体像など、さまざまなものが用意されています。
次に、GCP NEXT 2016 での素晴らしい講演ビデオを 2 つ紹介します。「Seamlessly Migrating your Networks to GCP」(シームレスにネットワークを GCP に移行する方法)と、「Load Balancing, Autoscaling & Optimizing Your App Around the Globe」(世界各国におけるロード バランシング、オートスケーリング、アプリケーションの最適化)です。
私がこの 2 本のビデオをお薦めするのは、パブリック クラウドの仮想ネットワークに関して皆さんが話題にする点をすべてカバーしているのと、アーリー アダプターの大半が一般的に利用している例を紹介しているためです。
クラウド ネットワーキング技術に関するよくある質問として、世界中でサービスを展開する方法が挙げられます。リージョンとゾーンのドキュメントでは、GCP のリソースが具体的にどこに置かれているのかを説明しています。
一方、Google の研究論文「Software Defined Networking at Scale」(大規模 SDN、後述)には、Google のグローバル CDN やデータセンター間にまたがる WAN などの地図型全体像があり、私も気に入っています。
また、Google のインフラに関するページには拡大可能な地図が用意されており、世界中の Google データセンターに印が付けられているほか、Google が 4 本の海底ケーブルをどのように利用し、文字どおり地平線の下でどのようにデータセンター間をつないでいるかがわかるようになっています(ブログはこちら)。
最後に、地域別データ管理法の話題を扱った非常に役立つ記事にも目を通してみるとよいかもしれません。私はこのページの下にあるソリューションを参考にして、複数のリージョンを効率的に使うヒントを得ようと思っています。
そのほか、GCP NEXT 2016 のビデオで私が共感したものとしては、GCP の設定や管理サービスに関するものがあります。GCP の設定や管理は、単一のグローバル型 Anycast VIP を使って最も近くの低レイテンシ インスタンスから利用すると、非常に簡単だというのです。この詳細については、ロード バランシングとスケーリングのコンセプトに関するドキュメントでトピックの概要をカバーしています。
さらに、ロード バランシングの初期調査については、ネットワーク ロード バランシングの設定に関するページを参照してください。
Google が CDN コンテンツのピア接続や提供をどこで実施しているのかが気になる方は、Google Edge Network/Peering や PeeringDB のサイトに詳細が書かれています。ピア接続インフラのページには、Google の Edge PoP やノードの情報がわかる拡大可能な地図が用意されています。
ベスト プラクティスは何か
Google Cloud Networking のベスト プラクティスに関しては、他にもさまざまなドキュメントが用意されています。私が好きなのは、「Best Practice for Enterprise Organizations」(エンタープライズ向けベスト プラクティス)の中にある「Best Practice for Networking and Security」(ネットワーキングとセキュリティのベスト プラクティス)と、グローバル サービスを構築する際に考えるべき便利な手法についての情報を提供している「Best Practices for DDoS Protection and Mitigation on Google Cloud Platform」(DDoS 対策のベスト プラクティス)です。そのほか、理解を深めるための主要コンセプトとして Cloud Identity & Access Management(IAM)のページをお薦めします。なかでも、ネットワークおよびセキュリティに特化した役割を紹介している「Understanding Roles」(役割を理解する)というドキュメントに目を通してみてください。
ここではサービス アカウントが重要な役割を果たします。「Understanding Service Accounts」(サービス アカウントについて)というページに概要があるほか、「Using IAM Securely」(IAM を安全に使用する)というページではベスト プラクティスが確認できます。
また、これらの方向性についてより詳しく知りたい方は、「Access Control for Organizations using IAM」(IAM を使用している組織のアクセス コントロール)を参照してください。
Google Cloud Networking のちょっとした歴史
こうして Google Cloud Networking に関して調べていくと、その歴史が気になる方もおられるでしょう。私自身、前述の「Seamlessly migrating your networks to GCP」の中で紹介されていた研究論文をいくつかあたってみたところ、とてもディープな印象を受けました。
それでも、Google Cloud Networking が過去 10 年間にどのような進化を遂げたのか、またこうした高度分散型サービスが、よく知られているようにパフォーマンスを保ちつつ競争力のある価格で提供できるのかについて、基本的な知識を得ることができました。
Google のネットワーク関連の研究論文は、次の 2 つのカテゴリーに分類されています。
クラウド ネットワーキングの基本
- Enter the Andromeda zone - Google Cloud Platform's latest networking stack(Andromeda ゾーンに侵入する - GCP の最新ネットワーキング スタック): ネットワーク仮想化の基本について詳しく書かれた 2014 年のブログ。
- Jupiter Rising : A Decade of Clos Topologies and Centralized Control in Google's Datacenter Network(Jupiter Rising : Clos トポロジーと Google のデータセンター ネットワークにおける集中管理の 10 年): 2015 年のこの論文では、Google のデータセンター ネットワークの進化がとてもうまく説明されています。
- Maglev : A Fast and Reliable Software Network Load Balancer(Maglev : 高速で信頼性の高いソフトウェア ネットワーク ロード バランサ): 分散型ロード バランシングの概要について書かれた 2016 年の論文。
ネットワーキングの背景
- A Guided Tour of Datacenter Networking(データセンター ネットワーキングのガイド ツアー): ハイレベルなシステム概要がわかる 2012 年の記事。
- B4 : Experience with a Globally Deployed Software Defined WAN(B4 : グローバル展開されたソフトウェア定義型 WAN): Google がよりシンプルでより効率的な WAN を追求したときの詳細について書かれた 2013 年の論文。
- Software Defined Networking at Scale(大規模 SDN): SDN モデルに関する 2014 年のスライド。
- A look inside Google's Data Center Networks(データセンター ネットワークに対する Google の取り組み): 2015 年のブログ。「Jupiter ファブリックは 1 秒間に 1 ペタビット以上のデータ送信が可能です。これは、10 万台のサーバーがそれぞれ 1 秒間に 10 ギガビットの情報をやりとりするのに十分な容量で、米国議会図書館所蔵図書の全スキャン データを 10 分の 1 秒未満で読み込めることになります」
Andromeda ネットワーク アーキテクチャ(ソースはこちら)
以上、この投稿がお役に立てば幸いです。ここで紹介したドキュメントをお読みになり、Google Cloud Networking の表と裏を深く理解していただければと思います。他に良いドキュメントがあれば、ぜひコメント欄に書き込んでください。
* この投稿は米国時間 9 月 28 日、Cloud Solutions Architect である Mike Truty によって投稿されたもの(投稿はこちら)の抄訳です。
- Posted by Mike Truty, Cloud Solutions Architect