東証が新事実、ファームウエア設定不備でNASの冗長化が機能せず

https://xtech.nikkei.com/atcl/nxt/column/18/00001/04693/

 ※ 新事実が判明した…。

 ※ 「設定ミス」「単なるヒューマン・エラー」とも、言えない側面もあるようだ…。

 ※ 前の投稿の、「修正」の要素もあるようなんで、上げておく…。

 ※ オレの「PC組み立て」の方は、一応組み終わって、まだバラック状態だが、「OSインストール」は済んだ…。しかし、一部の機能が使えない(ケース前面のUSB2が、使えない…。マザボとの結線、間違ったようだ…。違うところに挿しているようだ…。USB3は、OK)…。それでも、まあまあ動いている…。

 ※ しかし、インターネットへの接続で「てこずって」いる…。詳しい説明は、省略するが、ルーターの設定に起因するかも知れん…。

 ※ 今日は、ルーターに「入って」、手動で設定を試みてみる予定だ…。

 ※ まあ、「ヤレヤレ…」と、「トホホ…」の連続だよ…。

『東京証券取引所で2020年10月1日に起きたシステム障害の全容が徐々に見えてきた。障害の原因は、富士通が納入したNAS(Network Attached Storage)のファームウエアの設定不備にあった。2台構成のNASでメモリー故障に起因する障害パターンが発⽣した際、NASの冗長化が機能しない設定になっていた。

 東証で10月1日に起きたシステム障害は、全銘柄の売買を終日停止するという未曽有の事態を招いた。東証が取引を全面的にシステム化した1999年以降、システム障害で全銘柄の売買を終日止めたのは初めて。これにより、3兆円規模の売買機会が失われた。』
『NASのメモリー故障が発端
 システム障害の発端は、東証の株式売買システム「arrowhead(アローヘッド)」のNASに搭載したメモリーの故障にあった。業務サーバーで使うユーザー情報などを格納するNASは2台あり、Active-Active構成で冗長化していた。このうちの1台のメモリーが故障し、本来なら1台のみの運用に自動で切り替わるはずが、うまくいかなかった。

関連記事:東証システムの「切り替え失敗」は設定値の誤り、テスト行程で見抜けず
 原因はNASのファームウエアの切り替え用設定値の不備にあった。東証はarrowheadを2019年11月に刷新する際、事前のテストで2台のNASの死活監視を途絶えさせて、自動で切り替わることを確認していた。だがその際、今回の設定不備は見抜けなかった。設定作業そのものは富士通が実施していたという。』
『問題の設定を変更し本番適用済み
 テストなどで設定の不備を見つけられなかった理由は今のところ分かっていない。東証の田村康彦IT開発部トレーディングシステム部長は「なぜこの事象を事前のテストで確認できなかったのかは引き続き検証していく」と話す。

 東証は原因判明を受け、ファームウエアの設定を変更。これにより、メモリー故障に起因する障害が起きても、NASの冗長化が機能することを確認済みだ。具体的には、10月3日にセカンダリセンター(バックアップセンター)で検証したうえで、10月4日にプライマリセンターの本番システムに適用した。

 東証の親会社である日本取引所グループは10月5日、システム障害の原因究明や再発防止策の実効性を高めるため、独立社外取締役で構成する「システム障害に係る調査委員会」を設置した。委員長には弁護士で日比谷パーク法律事務所代表の久保利英明氏が就いた。調査委員会では、システム障害の責任の所在も調べる。

 今後の焦点は、今回のシステム障害の原因となったNASのファームウエアの設定不備を見抜けなかった経緯だ。稼働前のテストに不十分な点がなかったかどうかなどを明らかにする必要がある。さらに、東証は証券会社側のさらなる混乱を避けるため、終日売買停止を決めたが、この判断そのものや決定のタイミングが適切だったのかも焦点になりそうだ。』