このブログでは特に取り扱わなかったのですが、先日発生したSkypeの大規模障害について詳細が明かされました。
リンク: Skypeログイン障害詳細 - Skype 日本語ブログ.
正常値を超える数の再起動によって、Skypeのネットワークリソースが影響を受け、これがログイン要求の殺到につながり、P2Pネットワークリソースの不足と相まって重大な結果をもたらしました。
いわゆる数の問題ですね。システムが大規模化していくとクライアントの限界数も予測するのが難しくなっていきます。なにしろ負荷試験も現実的でない規模なのですから。
今回Skypeが技術的詳細をきちんと報告したことは評価されるべきことだと感じています。もちろんこの内容をSkypeの全ユーザが理解できるとは思いませんが、"障害"って書いてあるだけで、全く情報をユーザに与えないサービスはだんだん不信感が溜まっていくだけだと思いますので。(その多くは広報担当者に技術的な理解がないことも原因の一端だと思いますけど)
障害中のご対応ご苦労様でした。そして詳細報告ありがとうございます。とSkypeの方々に向けて発信しておきます。
追記(2007/8/21):
多くのクライアントが一斉に再起動を始めたのはwindows updateのため、だったようですが、ほぼ同時にmac版skypeも新版がリリースされているんですよね。ベータ版なのでもしかすると導入したクライアント数はwindows updateでリブートしたクライアント数に比べたらごく少数なのかもしれないですけど。ちょっと気になりました。

最近のコメント