写真 会見で頭を下げるNTT東日本の大木一夫副社長ネットワーク事業推進本部長(中央),吉村辰久取締役ネットワーク事業推進本部設備部長(右),安田雅美取締役コンシューマ事業推進本部営業推進部長(左)
写真 会見で頭を下げるNTT東日本の大木一夫副社長ネットワーク事業推進本部長(中央),吉村辰久取締役ネットワーク事業推進本部設備部長(右),安田雅美取締役コンシューマ事業推進本部営業推進部長(左)
[画像のクリックで拡大表示]

 NTT東日本は5月16日に記者会見を実施し,15日夕方から16日未明にかけて発生したフレッツ・シリーズやひかり電話の大規模障害の原因報告と対策を説明した。会見冒頭では,NTT東日本の大木一夫副社長ネットワーク事業推進本部長などが,「多くのお客さまに多大な迷惑をかけた。深くお詫びいたします」と陳謝した(写真)。今回のような,約239万ユーザーにおよぶIP網の障害は過去最大だという。

 NTT東日本の説明によると,障害原因はフレッツ網を構成するルーターの処理能力オーバー。古いバージョンのソフトウエアを搭載するルーターが,経路の再計算処理をしきれなくなり停止した。

 障害の発端は,東京都内に設置しているルーターのハード故障に伴うパッケージ交換だった。その際に,ハード故障したルーターをう回する経路の再計算をNTT東日本エリアの全ルーターが開始したところ,次々と処理能力オーバーが発生したという。ルーターは,新旧のソフトウエアのバージョンが混在しており,古いバージョンのソフトウエアを搭載しているルーターだけが処理能力をオーバーに陥った。

 NTT東日本エリアには,約4000台のルーターが設置されており,そのうち,約2000台のルーターが処理能力オーバーを起こした。それぞれのルーターが持つ経路は約1万5000ルートに及ぶ。パッケージ交換したルーターを予備系に切り替えた際に,約80経路分のルート変更を各ルーターが再計算し始めたが,その際に再計算処理しきれず自律停止してしまったという。「古いソフトウエアでも性能には十分なはずだったが,1万5000ルートという経路数の多さやルーターの処理能力,トラフィック状況などが複合的に重なって処理能力オーバーが起こったのではないか。書き換える経路数が約80というのは,数としては大きい」(吉村辰久取締役ネットワーク事業推進本部設備部長)。

 NTT東日本は,故障発生エリアを5月15日の20時19分に特定し,ルーターのリセットを開始。NTT東日本の全エリアのうち,処理能力オーバーを起こしたルーターを順次リセットして全面回復へこぎつけた。

  対策としては,(1)大量の経路情報を精査して減らし,ルーターの処理負荷を下げる,(2)古いソフトウエアのルーターを,10日ほどかけて新しいバージョンのソフトウエアへアップデートする――などの措置を主に実施する。

 今回は,東京23区と神奈川県,千葉県,埼玉県に障害の影響が出なかった。その理由は,「首都圏はトラフィック量が特に多いため,別網にするなど方式がやや違い,新しいバージョンのソフトウエアを首都圏の設備から導入しているため」(吉村取締役)だという。

 障害の発生時刻は,5月15日午後6時44分ころで,5月16日午前1時35分に全面復旧した。障害の影響エリアは,東京23区,神奈川県,千葉県,埼玉県を除く14都道県。影響が出たユーザーは,Bフレッツが約100万,フレッツ・ADSLが約126万,フレッツ・ISDNが13万と,フレッツ・サービス合計で約239万ユーザー。ひかり電話に関しては,Bフレッツ・ユーザーのうちの約50万ユーザーに影響があったとしている。

[最終報の説明資料へ]