仮想サーバ17万台、物理サーバ9万台 「ヤフオク!」「Yahoo! JAPAN」を支えるヤフーのITインフラ運用術(1/2 ページ)
「Yahoo! JAPAN」「ヤフオク!」などのWebサービスを運営するヤフー。大規模なトラフィックをさばくため、約17万台の仮想サーバ、約9万台の物理サーバを組み合わせ、独自のプライベートクラウド環境を構築・運用している。
国内最大級のポータルサイト「Yahoo! JAPAN」をはじめ、ECサイト「Yahoo!ショッピング」やオークションサイト「ヤフオク!」など、コンシューマー向けWebサービスを数多く運営するヤフー。同社はこれらのサービスを裏で支えるシステム基盤として、大規模なプライベートクラウド環境を自社で構築・運用している。
ヤフーの奥村司さん(クラウドプラットフォーム本部 プライベートクラウドチーム リーダー)が、クラウドインフラの運用管理者向けイベント「Cloud Operator Days Tokyo 2020」で明かしたところによると、その規模は、仮想サーバが約17万台、物理サーバが約9万台。物理サーバのうち2万台がIaaSの仮想化ハイパーバイザーとして使用されており、IaaSだけで1000台以上のラックが使われているという。
ヤフーはこの構成のインフラを、約20人のチームで効率的に構築・運用し、社内に提供しているというが、どのような工夫をしているのか。
工夫の1つに、奥村さんは「OpenStackクラスタの数の多さ」を挙げる。ヤフーはインフラの基盤ソフトウェアにオープンソースの「OpenStack」を採用し、「全社共通で利用するIaaS基盤以外にも、特定の環境やユーザーの利用に特化したIaaSクラスタを数多く用意している」という。
「例えば、本番用と開発用でクラスタを分けたり、広告システムやメールシステムといった大規模サービス用に専用のクラスタを作って社内に提供したりしている」
Openstackの他、仮想化ハイパーバイザーには「Kernel-based Virtual Machine」(KVM)を採用。一部では「VMware」も利用している。
サーバ選定、データ保管の工夫とは
このクラスタを構築する際の手順は「システム設計」「サーバの見積もり・購入」「設置」「セットアップ」「デプロイ」「テスト」――と一般的なものだが、個々のプロセスを簡略化し、人手による作業を軽減している。
まずサーバの選定・調達に際しては、運用管理を容易にするため、サーバごとの性能の平準化を図れるよう、取り扱うサーバの機種をなるべく増やさないよう心掛けている。具体的には、CPUの世代に合わせてサーバのスペックを統一し、それに合致しないサーバは調達しないようにしている。
このサーバ(または仮想化ハイパーバイザー)の上で動作する仮想マシンに割り当てるCPUリソースは、物理CPUのスレッド数の3倍まで許可している。やや多い印象だが、実際には問題はほぼ発生しないという。ただし、一部のCPU占有率の高いアプリケーションに関しては、専用サーバを用意するなどの対策を講じている。
データを保管するディスクは、ごく一部の例外を除き、共有ストレージではなくサーバの内蔵SSDを利用している。その理由について奥村さんは「内蔵SSDは処理スピードが速く、最近は導入コストも落ち着いてきている。また、サーバと共有ストレージ間のネットワークについて考慮せずに済むためだ」と話す。
ただ、この内蔵SSDはRAID構成(複数の外部記憶装置を組み合わせ、1つの外部記憶装置として冗長運用する構成)を組んでいない。そのため、ディスクトラブルに起因するデータ消失のリスクが常につきまとう。これに備え、ヤフーではサーバ側ではなくアプリケーション側でデータを分散配置して冗長性を担保する仕組みを採用し、データ消失を防いでいる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「君、今日からクラウド担当ね」 未経験者が1人で始めた、ファミマのAWS移行の舞台裏
「AWS Summit Tokyo 2019」のセッションに、ファミリーマートでクラウド移行の責任者を務める土井洋典さんが登壇。土井さんは、前任者が突然退職したため、ある日突然上司からクラウド担当を任された経験を持つ。たった1人でのスタートだったというが、どうやってAWS移行を成功させたのだろうか。「なぜクラウドなんだ」「今までのやり方を変えないで」――反発乗り越えAWSなど導入 京王バスを変えた男の交渉術
京王電鉄の虻川勝彦氏(経営統括本部 デジタル戦略推進部長)が、12月10日に開催されたイベント「NetApp INSIGHT 2019 TOKYO」に登壇。京王バスに出向していた当時に、周囲に反発されながらもクラウド導入を推進した際の交渉術を語った。コツは「止まっても謝れば済む領域から導入する」ことだという。ドコモの「IDaaS」導入秘話 「認証の仕組みは簡単」「自社開発できるでしょ?」と説く上司との戦い
企業では現在、認証サービスにクラウド型の認証基盤「IDaaS」(Identity as a Service)を利用する取り組みが活発化している。NTTドコモは、IDaaSベンダーの米Auth0に出資し、同社のサービスを「docomo sky」の認証基盤に採り入れている。その裏側で開発担当者は、「認証の仕組みは簡単」「自社開発できるでしょ?」と説く上司を説得していたという。豪雨で水没寸前だったサーバをクラウド移行 「獺祭」の旭酒造・桜井社長が語る「テクノロジーとの向き合い方」
日本酒「獺祭」の蔵元である旭酒造は7月から、顧客管理システムを米OracleのIaaSに段階的に移行している。2018年の西日本豪雨で被災し、BCPの重要性を実感したためという。旭酒造の桜井一宏社長に、今後のテクノロジー活用の展望を聞いた。琉球銀行、電話システムをクラウドに移行 定年後に復帰した62歳が担当 「まだできる」の声に奮起
琉球銀行が、オンプレミス環境に構築していた電話対応のシステムを、7月からクラウド型の「Amazon Connect」に全面移行。店舗にかかってくる電話を全て同システムに転送し、自動応答で用件を聞いた上で、オペレーターが対応する仕組みを取り入れた。構築したのは、同行を定年退職後に再雇用された62歳の喜納(きな)兼次郎さん。喜納さんに、導入の背景と経緯を聞いた。