↑ トップ頁へ

2006.10.2
 
 


IP電話トラブルを眺めて…

 「技術の錯綜」問題の話をした。
  → 「品質担保に於ける技術の錯綜問題 」 (2006年9月28日)

 続いて2つ目の話に移ろうと考えたら、とんでもない“トラブル”が突如発生した。
 2006年9月19日から21日まで、ほぼ毎日のように、IP電話がつながりづらくなったのである。
 この状況に遭遇した利用者は大騒動だったらしい。お客様と電話連絡がとれなくなると、それこそ一大事の業種もあるから当然だ。早速、旧来の電話に戻そうと動いている事務所もあるようだ。

 大変なことがおきた割りには、“トラブル”の原因は単純そのもの。(1)

 IP電話からIP網への接続点で、呼出し信号を制御していいるサーバが高負荷のため処理遅延を発生させただけのことだ。
 こうなったのは、ソフト上の問題と発表されている。キャパシティが毎秒10回コールでしかなく、プログラムで100回に変えたというのだが。もともと通信量に比して処理のキャパシティが小さすぎる機器だった上、ほとんど試験もしなかったとの印象は否めまい。
 もっとも、通信の集中は、一般電話でも、さして珍しい現象ではない。ただ、旧来の電話網なら、すぐに当該電話局が通信量制限を行うから、極く一部地域の現象で留まるのが普通だ。「電話が通じにくくなっています。」なるメッセージは、おそらくこうした対処策だと思うが、誰もそんなことに関心を払わない。通じにくくなっても短時間で復旧することが多いからだ。

 残念ながら、IP電話ではそんな“トラブル”対応はとれない。すべてが網の目のように繋がっている上、通話が始まったら、端末から信号が来ない限り処理は終了することもないから、厄介なのである。従って、IP電話からIP網への接続点のサーバで信号が溢れてしまうと、IP電話網と一般電話網への接続点のサーバにもその大混雑が移ってくる可能性は高い。
 こちらのサーバはダウンすると一大事である。下手をすると、連鎖反応で電話システム全体が止まりかねないからだ。
 これを防ぐには、接続点に繋がるIP電話網全体の通信量を制限する以外に手はなかろう。大規模なトラブルになるのは構造上致し方ない。

 こんなことが発生しかねないことは、一般電話網とIP電話網を繋げた時からわかっていた筈である。どう対処すべきかも決めていたのではなかろうか。
 にもかかわらず、早急に手が打てなかった。

 それだけではない。サーバにデータを残したまま再開して、全く同じトラブルに見舞われたのである。

 さらに驚かされたのは、原因究明がすぐにできない点。なんと、発表は6日後。
 一体、どうなっているのだろう。

 もともとソフトウエアには、バグはつきもの。ダウンを恐れていたら、新しいことなどできない。重要なのは、ダウンすることではなく、いかに早く回復させるかである。“トラブル”にどう対処するか、徹底的に練るのが原則だと思うが、この状況を見ていると、考え方が全く違うようである。

 国内の初めて「サービス品質保証」(2)導入に熱心なのは結構だが、これは、混雑しても十分な通信量割けるというミクロの話。細かなところで品質を担保しても、システム全体の品質をどう担保するかには、注力しなかったか、マネジメントができないということを意味しているとしか思えまい。
 細かな品質ばかりにこだわり、肝心の大所を考える人がいないのではないか。
続く → (2006年10月5日予定)

 --- 参照 ---
(1) http://www.ntt-east.co.jp/release/0609/060925a_1.html
  [仕様]http://www.ntt-east.co.jp/ipc/information/tech/pdf/ip_003_2.pdf
(2) http://www.ntt-east.co.jp/ipc/merit/reliable/sla.html


 技術力検証の目次へ>>>     トップ頁へ>>>
 
    (C) 1999-2006 RandDManagement.com