AWS大規模障害の真の原因は未だ不明、内部メモではファイアウォールが”未知のソースによって圧倒されている”と警告
2021.12.08 Data Center Dynamics
アマゾン ウェブ サービス(AWS)のエンジニアは、12月7日に発生した大規模障害の原因をまだ完全には把握していないようです。
同社は、us-east-1の長時間にわたるダウンタイムは「ネットワーク機器の問題」が原因であると公式に発表していますが、流出した内部メモには、スタッフの間で多くの混乱と懸念が起きていることが見てとれます。
Business Insiderによると、同社は今回の障害の根本原因を「AWSの内部ネットワーク内での複数のネットワークデバイスの問題」であるとし、
「デバイスが処理可能なボリュームを超えるトラフィックを受信したことで、デバイスを通過するトラフィックのレイテンシーとパケットロスが増大した」としています。
しかし、なぜトラフィックが急増したのかについては明らかになっていません。この問題は、アマゾンの内部DNSに「明確な影響」を与えており、
あるAWS社員は「組織化されたDNS攻撃」ではないかと推測しています。
Business Insiderが見た内部メモには、「ファイアウォールが、未知のソースによって圧倒されている」と書かれており、
同社は現在 「ファイアウォール上で、トップトーカー/障害を引き起こしているホストからのトラフィックをブロックする」作業を行っているといいます。
また、別のSlackメッセージでは、この問題はAmazonのリアルタイムデジタル広告オークションに起因している可能性があると書かれています。
AWSのインフラストラクチャー部門VPのピーター・デサンティスは、当時続いていた障害について600人規模の社内電話会議を主導しましたが、
社内の問題である可能性を指摘する声もあれば、より悪質な何かを指摘する声もありました。
AWSは同社のステータスページで、「US-EAST-1リージョンの一部のネットワークデバイスに障害をもたらした根本的な問題は緩和した」とコメントしています。
https://cafe-dc.com/security/report-aws-uncertain-about-true-cause-of-massive-outage-internal-note-warns-of-firewall-overwhelmed-by-unknown-source/