共有
  • 記事へのコメント36

    • 注目コメント
    • 新着コメント
    その他
    kana321
     障害のきっかけはネットワークの構成変更作業におけるミスだった

    その他
    siso3
    『しかし今回は、同一リージョンの全AZを対象に提供されているEBSコントロールプレーンが応答不能となったことで、複数のAZにEBSへのアクセス不能状態が広がったことになる。』

    その他
    rochefort
    コントロ

    その他
    kennak
    ネットワーク拡張のための作業でヒューマンエラー  今回の障害は、「US EAST 1」リージョン内の特定AZで発生した(他のAZへの影響については後述する)。このAZでは、21日にメインネットワークの拡張作業が行われた。この

    その他
    rdfrk
    すごく丁寧に書かれてると思うんだけど、スキル不足で頭にすんなり入ってこない。もうちょっとインフラ系の知見も深めないとなぁ・・・ Reading: Amazon Web Servicesの障害はなぜ起こったのか - @IT

    その他
    deep_one
    意外と基本設計がよくないのかもしれないなぁ。ノウハウが世界的に足りないのか?

    その他
    yasyas
    RIghtScaleとか使って複数のXaaSベンダーを併用する使い方が増えるのかな。

    その他
    kabiy
    Amazon Web Servicesの障害はなぜ起こったのか アマゾンが詳細な経緯と対策を発表 − @IT

    その他
    wasai
    ちゃんと読んでおこう

    その他
    diveintounlimit
    『2経路のメインネットワークに流れているトラフィックを1経路に集約しようとして、誤って予備ネットワークに接続してしまった』ネットワークはこういう人為ミス起因のトラブルがあるから怖いねぇ。

    その他
    ming_mina
    ネットワーク絡みのヒューマンエラーは身に覚えがあるからな…恐ろしいこっちゃ

    その他
    mmasuda
    わはー。

    その他
    inforeg
    たまのヒューマン☆エラーはスパイスかもね

    その他
    shibacow
    ネットワーク接続ミスと言う人的なエラーが、EBSレプリカ作成モードの爆発と言う別のエラーを誘発する。JRで、一つの路線で遅れが生じると、複数の路線に伝播するのに似ている。巨大システムは似たような構造を持つ。

    その他
    koyossk
    140文字で要約できますでしょうか。 @takahiro317

    その他
    o_hiroyuki
    AWS障害

    その他
    qaz76
    『AWSがネットワークの構成ミスに気づき、ネットワーク接続を回復した際、多数のEBSノードが同時に空きスペースを探してレプリカを作成しようと試み始めた。』

    その他
    tsupo
    「メインネットワークのために冗長接続されている2台のルータを流れるトラフィックを、1台に集約しようとして、誤って予備ネットワークに接続してしまった」

    その他
    syanbi
    Zone別にして耐障害性上げていたはずだけどEBS側で複数Zone対象のサービスを立ち上げていたために障害が発生していないZoneへも影響が出た..か。EC2使ったことないから想像するしかねえな..

    その他
    michael-unltd
    障害

    その他
    tamu222i
    EBSも冗長化されてたのかー。つーか、報告内容がスゲーな

    その他
    airj12
    図解が欲しい。

    その他
    meets623
    Amazon Web Servicesの障害はなぜ起こったのか -

    その他
    georgew
    ネットワーク拡張のための作業でヒューマンエラー > わずかだがデータ消失もあった模様。

    その他
    lettas0726
    イロウル的なのを想像した

    その他
    creaism
    RT @hatebu: Amazon Web Servicesの障害はなぜ起こったのか − @IT (56 users)

    その他
    yamashyjpx
    結局、人為的ミスという・・・。

    その他
    kamei_rio
    詳細はイマイチ理解できてないけどヒューマンエラーらしい

    その他
    betelgeuse
    バックアップを取れ!お前もバックアップを取れ!そうだ全員がバックアップだ!電話が鳴ってますけど・・・いいからバックアップだ!

    その他
    otchy210
    単純な仕組みなら狭い範囲で収まったのに、高度な自動化のため、各ノードが「自己」最適を図った結果、被害が拡大したように思える。今後検討されるべきは「全体」最適をいかに自動化するか、という事かな?

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    Amazon Web Servicesの障害はなぜ起こったのか アマゾンが詳細な経緯と対策を発表 − @IT

    2011/04/30 米Amazon Web Services(AWS)は米国時間4月29日午後、同社のブロックストレージサービス「A...

    ブックマークしたユーザー

    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - 暮らし

    いま人気の記事 - 暮らしをもっと読む

    新着記事 - 暮らし

    新着記事 - 暮らしをもっと読む

    同時期にブックマークされた記事

    いま人気の記事 - 企業メディア

    企業メディアをもっと読む