日々の記録や雑感を書いていきます。


by stocktora

東証のシステム障害についての独り言

今日の東証のシステム障害、あれはビックリしましたねぇ。
システム障害といっても、いろんなものがあり、ざっと考えられるだけで、

・ハードウェア
・ネットワーク
・データベース

ハードウェアだったら、サーバそのものがぶっこわれた、
というもので、これはハードを替えないとダメです。
ただ、こういったことを想定して、予備サーバぐらいは作ってあるはずで、
切り替え作業をするだけなので、ここまで大きなトラブルにはならないはず。

ネットワークだったら、接続がうまくいかない、から始まって、
設定がおかしくなっている、DNSサーバがいかれた、というものや、
物理的にルーターやハブ、スイッチが壊れた、おかしなものでは
LANケーブルをネズミにかじられた、までいろいろありますが、
こういう場合は原因が見つけにくいのでかなり時間はかかります。

データーベースの整合性がある拍子に壊れたりつながらなくなる
ことも復旧には時間がかかるものです。

ニュースでは「システム障害」「システムが起動しなかった」という
話だったので、その三つを考えていて、「うーん??」と思ってたんですよ。
最悪の場合、今日だけでは復旧できない可能性が高いかも、と。

結局、東証のシステムは復旧し、市場が動き出したので良かったですが、、。

システムがとまった原因を東証が説明してましたが、
「証券会社のコードを参照するデータの場所が違っていたため」とのこと。
つまり、単なる設定ミスってことですよ。
なんていうこったい!!

例をちょっと書いてみますね。
①証券コードを参照するパスを以下のように設定しておきます。
(単なる例で、あくまでも仮想のものです)
参照先;C:¥proguram files ¥ tosho ¥ data ¥ code

②ところが、Cドライブの空き容量が減ってきたので、Dドライブにデータを移します。
そうなるとデータの場所が変わりますね。
D:¥proguram files ¥ tosho ¥ data ¥ code

③データの場所が変わっているので、それをシステムに教えてあげる必要が
あります。
参照先:D¥proguram files ¥ tosho ¥ data ¥ code

これで移行は完了です。

今回の場合、③の作業を怠っていた、という設定ミス。
そりゃ、③の作業をしなければ、システムは「データがありません」
「データがありません」と言わざるを得ませんね。
これは典型的なイージーミスですね。うーん。

ただ、これだけではエラーメッセージが出るだけで終わりますし、
「システムが再起動できない」という事態にはならないので、
他にも連鎖的にエラーがあったものだと思われます。
しかしながら、「エラーの主原因が設定ミス」というのなら、
我々はいまいち腑に落ちないところもあるのです。

まぁ、今回のシステムダウンにはいろんな話がありまして、

・ベンダーのF社、H社、データベースのO社がうまく
連携が取れてなかったのでは?

という話も出てきていますが、実際の所はどうなんでしょうか、、。

ただ、IT業界で働いてきた者の目からすると、いささか
「東証が無理やりなスケジュールでシステムを組ませたんじゃないか」
「東証が大幅なトランザクションの増加を予想してなかったんじゃないか」
というシステム発注者の不備によって起こった事象かなとも思うんですよ。

IT業界でも、ここんところ、納期は短くなり、単価は減り、で、
仕事をこなしてもこなしても稼ぎは少ない、といった現状があります。
仕事が減っては食っていけないので、どうしても、単価が安い仕事でも
取ってこざるを得ず、その負担が現場にどかっときます。
無理な予算と無理なスケジュール、さらに、それをピンハネする
SIer、、。今回、作業したのも、おそらく下請けの業者さんだと思われます。

無理なスケジュールで作業をさせると、どうしてもイージーミスが多くなります。
特に、工場だと、作っているものが目で見えるので、おかしければ外からみれば
わかりますが、相手がシステムだと目で見えないので、頭の中での勝負になって
きます。

ところが、頭の中の勝負になってくるのに、無理なスケジュールで睡眠不足だったり、
脳が機能が低下している中で、仕事をしているため、単純なミスを気づかない状態
になってきます。(先ほどの例で言えば、③の作業をするだけでミスは防げます。
作業する時間はそんなにはかかりません。が、③の作業をしないとシステムは
エラーを出すわけです)

そういったミスが積もり重なっているシステムなため、見かけは
立派でも不安定なシステムができてしまいます。
そのシステムがあるきっかけをはじめとして、連鎖的に崩れていく、、、。
こういうのは今回の東証だけではなく、いろんなシステム開発の現場で起こっている
ことなんです。

こういった現状をよりよくするために、システム発注者はもう少し余裕のあるシステム
やスケジュールを立ててほしいし、それに対する見通し(今回の場合は、出来高の急増)
も余裕を持って考えてほしいと思います。

特に、東証という会社(市場と区別しなくてはいけないので分けました)は
数字を重視するあまり、「人」や「人間」に投資する事を軽視してきたフシがあり、
私は嫌いです。

最近、東証の会長が「教員は給料をもらいすぎだ!校長が事務次官より年金が高いとは
何事か!地方公務員よりも給与が高いのはおかしく、給料を一緒にすべきだ」と発言
してましたが、これも、「人間に投資する」ことを軽視する風潮の現れではないでしょうか。

教員は「人を育てる」仕事をしてますが、これも将来の社会を担う子どもを育てようと、
残業手当などなく、土日も返上で頑張っている方々も多い上に、必要な経費は落としにくく、
自腹で教材を買ったりしているので、実入りはそんなに多くはありません。
そういった現場を全く見ないで、「給与が高すぎでカットすべき」とはなんたることでしょう。
一見したら高く見えますが、自腹で出す持ち出す分がかなり多く、カツカツなことが多い、
とよく聞きます。

同じことがシステム発注の際にもいえます。
おそらく、システム発注の際にも数字しか見ず、
「え、これ、なんで1人月こんなのかかるの?もっと安くていいじゃん。
それに、人もこんなにいらないよ。もっと削減して」
とかいって、必要な人員をかなり減らして、現場に無理をしいたんじゃ
ないのかなぁ、と。

今回の件を今後の糧とするためにも、東証には

・余裕のもったシステム開発
・数字だけで判断せず、現場で働く人間も考慮にいれること

を考えてもらいたいと思います。

また、「人を軽視する」東証の会長は、「人を育てる」場所である教育関連の
委員を辞めてほしいし、不用意な発言をしないでほしいと思います。

今日のところはこの辺にしときますね。
[PR]
by stocktora | 2005-11-01 17:16 | 株式