22日、午前9時の立会取引が始まる前の寄付き時点から東京証券取引所の派生売買システムで板情報が配信できない状態が発生、午前9時21分にはほとんど配信されない状態になったため、業務規程などに従って立会取引を停止した。
派生売買システムは富士通の大型Linuxサーバで稼働しており、板情報の配信システムそのものは6台のゲートウェイサーバで稼働している。
派生売買システムは1月に全面刷新したが、直後の2月にもアプリケーションの不具合で一部取引ができなくなるトラブルが発生している。
今回問題となった板情報の配信システムは、先週末にアプリケーションの一部を変更しており、その影響ではないかとみて、原因がわからないまま変更前の状態に修正して復旧させ、午後1時45分に再開した。
東京証券取引所は同日の午後3時半から緊急会見を開き、障害について説明した。
それによれば、板情報の配信ソフトのメモリー領域の設定ミスがあり、問い合わせが殺到することで不具合が顕在化し、6台の板情報配信システムが次次とダウンした。
板情報の配信システムのプログラムは富士通が開発し、この1月に稼働しているが、前述のように先週末に修正されている。今回のバージョンアップは、現在2秒おきに配信している板情報の配信間隔を、将来的にもっと短い間隔に変更するための作業で、修正に際して行ったテストでは不具合を発見出来なかったと言う。
しかし今週は月曜が休日で、22日がバージョンアップ後の初日であり、本格稼働と同時に障害が発生したことになる。
具体的な原因は、東証の発表によれば次の通り。
板情報を配信するプログラムは、本来一銘柄当たり1280バイトの作業用メモリー領域を2万8000銘柄分(34.18Mバイト)確保しなければならないが、銘柄当たりを4バイトとしてしまったため、結果として89銘柄以上の板情報の問合わせが同時に発生すると作業用メモリーが足りなくなり、情報配信システムがダウンしたのだという。
会見した東証の鈴木義伯常務取締役CIOは『設定ミスしたのはベンダーの富士通』とした上で『多数の銘柄に対し板情報の問合わせがあった場合をテストケースに含んでいなかったのは我々の責任。もっと幅広くテストすべきだった」と陳謝した。
しかしこの発表には嘘があるのではないか?
1280バイト確保すべきメモリーを4バイトとしてしまったと言うのは、良くあるミスで(推測だが)データ領域として確保すべきものを、領域へのポインタ(場所を示すだけのデータ)としてしまうもので、初歩的バグの典型。
おそらく領域不足でダウンしたのではなく、確保した領域外への書き込みが他のデータを壊す結果となり、プログラムが異常終了したのだろう。
実際の現象としても、寄付きで問合わせ銘柄が89銘柄を超えたと思われる3台がダウン、その後に残りの内の2台のパフォーマンスが低下、午前9時15分ごろには最後の一台のパフォーマンスも低下したため、強制的に停止させられている。つまり個々の異常の現れ方が違うのだ。
いずれにしても、現在の銘柄数(約2万)に対して今後の銘柄増を見越して2万8000銘柄分まで確保したと云うがこの数字も中途半端だし、板情報を配信するだけのシステムなのに、全銘柄分の領域を必要とするソフトの設計も稚拙。
あるいは「現在2秒おきに配信している」とあるところから推測すれば、問合せには関係なく2秒毎に全銘柄のデータを派生売買システムから転送しているのではないだろうか。取引が始まる前に不具合により次々と6台が一気にダウンしていることからも、その可能性の方が高いと思うのだが。
テスト時に問題が出なかったのは、もしかすると派生売買システムとの接続は行わなかったのかも知れない。修正は小規模だとして、修正部分だけの簡単なテストで済ませた可能性もある。もしそうだとしたら・・・
原因がどうであれ、こんな素人然としたソフトに莫大な予算が投入されていると思うと情けないと言う気持ちを通り越して怒りを覚える(-_-;)
...
投稿者 shoda T. :
21:45
|
コメント (0)
|
トラックバック