Windows Updateで大渋滞のフレッツ網、自衛策は?:羽ばたけ!ネットワークエンジニア(20)(1/2 ページ)
2019年8月29日午前、Windows Updateに起因するフレッツ網の輻輳で、企業ネットワークは端末のタイムアウトなど大きな被害に遭った。このような場合、輻輳が収まるのを待ち続ける以外に対策はないのだろうか。
2019年8月29日の出社直後、筆者が運用する2000拠点を超える流通業のネットワークでは、ヘルプデスクがパンク状態になった。ネットワークが遅い、端末が落ちるといった申告が全国の店舗から殺到したからだ。このネットワークではバックボーンとしてキャリアのVPN(閉域網)を、店舗のアクセス回線としてNTTグループの「フレッツ 光ネクスト」を使っている。
監視センターから連絡を受けたとき、障害の範囲が広いこと、ネットワーク機器に異常がないことから、Windows Updateのトラフィックで輻輳(ふくそう)が起きているのだろうと推定した。
それにしてもこの日の障害はこれまでに経験したことのないひどいものだった。かなりの店舗で電子マネーやクレジットカード認証の業務がタイムアウトで使えなかったのだ。障害時間も長い。8時45分ごろから始まり12時ごろまで3時間以上続いた。もっとも深刻だったのは10時前後だった。
確かにフレッツはベストエフォートのサービスだ。速度が保証されているわけではない。しかし、遅いことは許されてもタイムアウトで「使えない」ことが許されるのだろうか、と憤りを感じた。ユーザーに自衛策があればよいのだが。
なぜ輻輳が起こるのか
そもそもこのような輻輳に起因する障害がなぜ起こるのだろう。図1のようにフレッツはインターネットサービスプロバイダー(ISP)やキャリアのVPNサービスのアクセス回線として使われている。フレッツ網と、ISPやキャリアとの接続は都道府県単位で行われている。接続方式にはIPv4 PPPoE(Point to Point Protocol over Ethernet)方式とIPv6 IPoE(IP over Ethernet)方式がある。現時点ではIPv4 PPPoE方式の方が多い。
フレッツ網のPPPoE網終端装置は図1のようにISPごと、キャリアごとに分かれている。そのためキャリアの網終端装置にインターネットからWindows Updateのトラフィックが直接流れ込んでくることはない。
しかし、多くの企業が収容されるキャリアの網終端装置には企業のデータセンターなどを経由したWindows Updateのトラフィックが集中するので輻輳が起きるのだ。これが筆者の運用するネットワークで輻輳が起きた原因だと思われる。
インターネットからのトラフィックが拠点のアクセス回線の帯域を消費して他の業務に影響を与えないようにする方法としてローカルブレークアウトが知られている。しかし、今回の場合、図2のようにPPPoEでローカルブレークアウトを適用して拠点のWindows Updateのトラフィックと基幹業務のトラフィックを分けても意味がない。基幹業務の通信が輻輳している網終端装置を通っているからだ。
Copyright © ITmedia, Inc. All Rights Reserved.