« バベル | トップ | ただ今、8% »

2007年05月24日

NTT東西間で「ひかり電話」が不通(ニュースの視点)

23日午前6時半ごろ、NTT東日本とNTT西日本の「ひかり電話」を接続する装置に障害が発生し、NTT東西間でひかり電話などの通話ができなくなり、総計で約317万回線に影響が出た。
その後原因は不明ながら、東西間接続装置(中継用サーバ)のソフトを再インストールすることで、約3時間後に回復した。
その後の調査で、東西間をつなぐNTT-MEの中継網内の呼制御サーバの保全作業でのミスが原因と判明した。
NTT東西は法的規制で直接接続することが禁じられている。そのため、NTT東の子会社であるNTT-MEが中継部分を請け負っている(入札による)。
NTT-MEは21日深夜から22日早朝にかけて呼制御サーバのハードディスクを予防的な保全作業の一環として交換したが、この時作業員がコマンド入力ミスをしてハードディスク内の一部データが損壊したと言う。23日午前6時25分、損壊したデータが呼制御サーバのメモリに読み出された結果、サーバがダウンしてしまった。
このサーバには待機系のサーバ・ハードディスクが用意されていたが、ハード的な故障の場合しか、自動的に切りかわらない。手動で切り替えることは可能だが、今回はそのような処置は取らず、ソフトの再インストールで回復した。

またまたである。
先日の東日本の障害とは原因が異なるが、ひかり電話とアナログ電話間や、他社回線間の呼制御サーバのトラブルと言えば、昨年も何度も起きている。おそらくその記憶があるからだろう、予備系に切り替えずにソフトの再インストールを実行したのは。
それにしても、コマンドの打ち間違いだとか、コマンド間違いでデータを壊しただとか、壊したデータを読み込んだだけで壊滅的な被害を出すなど、映画なら面白いかもしれないが、あまりにもお粗末過ぎる。
間違ったデータを読み込んだとしても、その部分だけ切り離して、他には影響を出さないような設計にすべきだし、そもそも定期的なメンテ作業で、手入力作業が組まれていること自体に驚きを禁じえない。

先日のフレッツ障害にしても、根本的にはルータの性能評価にミスっている(か、全然してない)としか思えないが、それ以前にルータを含めたネットの階層構造の設計に根本的な間違いがあるとしか思えない。それとお粗末過ぎるソフト・・・きちんとピーク性能を決めて設計したり、最大負荷による性能評価や実値テストをしているとは思えないのだが。

また、東西間の直接接続を法的に禁止すると言うのも、趣旨はわからなくはないが、あまりに形式的で方法論として間違っているような気がする。
この調子では、まだまだ問題は噴出するだろう。

投稿者 shoda T. : 2007年05月24日 22:13

トラックバック

このエントリーのトラックバックURL:
http://shoda.tk/MT/mt-tb.cgi/484

コメント

コメントしてください

名前とメールアドレスは必須です。メールアドレスはブログ上には表示されません。私に届くだけです。 TypeKey ID のサイン・インも必須ではありません。持ってる方だけサイン・インすればいいです。




保存しますか?

(書式を変更するような一部のHTMLタグを使うことができます)