ファーストサーバのレンタルサーバ「Zenlogic」、金曜夜からの全面サービス停止が解けず、いまだ停止中。ストレージ障害のためのメンテナンスで(追記あり)

2018年7月9日

ファーストサーバが提供しているホスティングサービス「Zenlogic」で、本日午前8時に終了予定だったメンテナンスが終わらず、月曜日の午前9時を過ぎた記事執筆時点でサービスが停止したまま、終了時間が未定になっています

(2018/7/9 15:47追記) 同社は障害の調査と平行して、基盤提供元のヤフー株式会社とともに別基盤の構築準備作業を実施していると報告しています。ただし「本日中に目途をお伝えするのは厳しい状況でございます。」とのことで、明日10日火曜日までサービス停止が継続する可能性を示唆しています。

(2018/7/9 22:50追記)同社は一時的にサービスの再開を発表、下記の記事を公開しました。
ファーストサーバの「Zenlogic」、7月9日夜10時20分に高負荷緩和でサービス一時再開。ただし障害は未解決のまま。利用者はいまのうちにバックアップなど自衛手段を - Publickey

(2018/7/10 16:25追記)メンテナンス完了が報告されました。
ファーストサーバの「Zenlogic」、メンテナンス完了。稼働状態は安定していると報告、引き続き経過観察へ
(追記ここまで)

Zenlogicは、同社によると中小企業や官公庁など約2万社が利用しているレンタルサーバサービス。

Zenlogicの障害・メンテナンスのページ「障害・メンテナンス情報」のページ。現時点で終了予定時間が消されたまま

Zenlogicは6月下旬からストレージに断続的な障害が発生。何度かメンテナンスを行ったにもかかわらず完全な復旧に至りませんでした。そのため、7月6日金曜日の夜8時から土日をはさんで7月9日月曜日午前8時まで異例の長時間、外部へのWebサイトの公開やメールの送受信、コントロールパネルの操作などを含む全サービスを停止し、メンテナンスを実行していました。

しかし本日午前9時時点での報告で、障害が解消しないためメンテナンスを延長する旨を次のように説明しています

サービス再開処理後、再度の高負荷発生を確認いたしましたため、大変申し訳ございませんが、不本意ながらメンテナンスを延長させていただくこととなりました。

ただしサーバー設定画面『コントロールパネル』は、利用を再開するとのこと。ホームページの閲覧、メールの送受信、サーバーへのファイル転送は停止したままです。

ストレージの高負荷が1週間以上解消せず

Zenlogicは、6月19日頃からストレージで高負荷が発生し、Webサイトの閲覧、メールの送受信、コントロールパネルの操作などが断続的に利用できなくなる障害が発生していました。

同社は6月22日にサーバを入れ替え、6月23日にストレージを増強、6月27日にストレージを緊急増強、6月29日にもストレージを緊急増強とパラメータの調整を実行、7月2日に緊急メンテナンスとパラメータの調整、3日以降も毎晩メンテナンスを実行してきましたが、障害の解消に至らず、7月6日から9日にかけての長時間全停止メンテナンスとなりました。

7月3日時点で、同社は障害の原因について、データの入出力が一部のシステムに偏っているためだと、次のように解説しています

  • 冗長構成しているストレージシステム(データ記憶システム)において、データ入出力の処理が一部のシステムに偏ったことにより、高負荷が発生。該当ストレージシステムの再起動が発生し、サービスが断続的に利用できない状態が発生しました。
  • データ入出力の処理が一部のストレージシステムに偏るのは、以下の点が原因と推測しております。
  • 突発的なアクセス集中が発生した際のパフォーマンス不足
  • ストレージシステム構築時のパラメーター設定が適切でない

自社でサーバインフラを持たないファーストサーバ

ファーストサーバは自社でインフラを持たず、ZenlogicはYahoo! JapanもしくはAWSのいずれかのインフラの上にファーストサーバがサービスを構築するアーキテクチャを採用しています。

ZenlogicはもともとYahoo! Japanのインフラの上で構築されサービス提供が開始されましたが、当初からインフラには依存しない仕組みになっているとされており、今年の4月にはAWSをインフラとした「Zenlogicホスティング Powered by AWS」の提供が開始されています

fig

今回障害が発生しているのはYahoo! Japanのインフラ上に構築されているZenlogicと見られます。そのため、原因究明と対策も同社と連係して行っていることをファーストサーバは明らかにしています。

ファーストサーバは2012年に大規模なデータ消失事故を起こしていることが知られています。

関連記事

あわせて読みたい

クラウド




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本


<!- script for simple analytics events -->