ひかり電話における輻輳の原因はプログラムミス

 NTT東日本が昨日の9月22日、ひかり電話の輻輳の原因はプログラムに不具合ががあったことを発表しました。プログラムミスそのものは複数の法人顧客用サーバーであったようですが、その中の1台で特定顧客に関する一部サービスの処理時間が長くなったことが引き金になったようです。NTT東日本のニュースリリースによると、最初に輻輳したサーバーは呼制御サーバーであるようです。

 報道によってはこのプログラムの不具合は通話を振り分けるためのソフトウエアであったという記事もありました。一部サービスの処理時間が長くなったということは、そのサーバーで処理をする通話の数が増えて、CPUなどの何かの資源でネックが発生したのでしょうか。

 そのサーバーの負荷を抑えようと自動的に通話量を制限し始めたことで普段は問題にならなかったプログラムの不具合が顕在化したように思われます。こちらはNTT東日本のニュースリリースによると「中継系呼制御サーバ」に影響が及んだようです。

 運が悪いことに、この中継系呼制御サーバを再起動した際に本来ならば初期状態に戻るべきところ、何らかの要因で不安定な状態を引き継いでしまったようで、20日にも問題を持ち越してしまっています。こちらの問題についてはまだ解析中で原因は発表されていません。


 従来から使われている交換機も初期の時代は交換手による手動交換に始まり、リレーを用いたクロスバー方式、そしてコンピューターを使用したデジタル交換機と変化してきています。

 このデジタル交換機は汎用のコンピューターではなく、あくまでも交換機として使用されることを想定した交換機なので、ソフトウエアとの組み合わせも検証しやすい面があるのではないかと思います。

 現在の固定電話は今回の「ひかり電話」のような問題が発生しないのは長年の歴史に支えられた実績と専用品を使用したことに伴う安定性の二つが寄与しているのではないかと思います。反面、専用品を使用するが故、コスト高になってしまいます。

 一方のIP電話ですが中継網で使用するネットワーク機器、たとえばルーターなどは汎用品を使用するようになり、頻繁にハードウエアのバージョンアップが行われたり、機械の調達についても入札をすれば毎回違う機種が導入されたりと、ソフトウエアとハードウエアの組み合わせ(相性)を完全に検証するのは難しくなってしまいます。

 汎用品であるがゆえ、機器の価格は安くなると思いますが、社会インフラとして使用するのに足りうる安定性を確保できるか否かといった点ではまだ未熟であるように思います。一般にハードウエアの二重化、三重化で冗長構成にしたり、一つの問題が出来るだけほかに波及しないように設計したりといったことが行われますし、たぶん、NTT東日本の「ひかり電話」で使用している設備についても同様の配慮がなされていたものと思いますが、社会インフラとして安心して使用できるようにするためには、まだ技術開発が必要なのでしょう。

 NTT東日本では輻輳でひかり電話網が不安定になることを防ぐために、将来にかけて予定していたハードウエアの増強工事を前倒しで実施する検討を実施しているという発表もあわせて実施されています。

デスマーチ 第2版 ソフトウエア開発プロジェクトはなぜ混乱するのか
日経BP社
エドワード・ヨードン(著)松原 友夫(翻訳)山浦 恒央(翻訳)
発売日:2006-05-03
発送時期:通常24時間以内に発送
ランキング:37820
おすすめ度:3.0
おすすめ度3 なぜプロジェクトはデスマーチと化すのか

コメント