米アマゾン ウェブ サービス(Amazon Web Services)は2019年8月23日昼ごろからクラウドサービス「Amazon Web Services(AWS)」の東京リージョンで発生した大規模障害に関して、同日午後10時19分付けでリレーショナルデータベースサービス「Amazon RDS」を復旧させたとのコメントを発表した。それに先立って同日午後6時39分に仮想マシン「EC2」の大部分を復旧させたとのコメントを出しており、今回の大規模障害への対応をほぼ終えた。

AWSの「SERVICE HEALTH DASHBOARD」。東京リージョンで障害が発生した2サービスのステータスが「RESOLVED(問題解決済み)」となった
AWSの「SERVICE HEALTH DASHBOARD」。東京リージョンで障害が発生した2サービスのステータスが「RESOLVED(問題解決済み)」となった
(出所:米アマゾン ウェブ サービス)
[画像のクリックで拡大表示]

 AWSによると、大規模障害は東京リージョンを構成する4つのアベイラビリティーゾーン(独立性の高いデータセンター群)のうち1つで発生した。仮想マシン(EC2)の障害やディスクの性能低下、リレーショナルデータベース(RDS)の接続性の問題が起きたという。これによりユニクロ、楽天、PayPay、東急ハンズなどAWSを利用する多数の企業がシステムトラブルに見舞われた。

 EC2の障害の原因は「冗長化された空調設備の管理システム障害」による冷却装置の故障だという。EC2用の一部のホストサーバーがオーバーヒートしてシャットダウンし、仮想マシンやディスクに障害が生じた。RDSの障害の原因については同日午後11時時点で明らかにしていない。