東証システムの「切り替え失敗」は設定値の誤り、テスト行程で見抜けず

東証システムの「切り替え失敗」は設定値の誤り、テスト行程で見抜けず
岡林 凛太郎 日経クロステック/日経コンピュータ
(2020.10.06)

https://xtech.nikkei.com/atcl/nxt/news/18/08897/

 ※ オイオイ…、という話しだ…。

 ※『「何らかの原因で実施したテストと同じ事象になっていなかった」』とか、一体何のための「テスト」なんだ…、という話しだ…。

 ※ 結局は、「設定ミス」というヒューマン・エラーか…。「大山鳴動して鼠一匹」…、という話しか…。

『東京証券取引所は2020年10月5日、株式売買システム「arrowhead(アローヘッド)」で10月1日に発生したシステム障害について、メモリー故障が起きた共有ディスク装置1号機を2号機に自動で切り替えられなかった原因を説明した。共有ディスク装置1号機が備える制御機構の設定値の誤りだったと明らかにした。

 東証はアローヘッドの運用系ネットワークで使う共有ディスク装置を、1号機と2号機の構成で運用している。メモリー故障に起因する障害が起きた場合に自動的に2号機に切り替えができない設定値になっていたという。

 共有ディスク装置1号機と2号機の死活監視が切れた場合に自動で共有ディスク装置が切り替わることはテスト行程で確認していた。今回の事象でも共有ディスク装置1号機のメモリーが故障した時に死活監視が切れたと考えられ、自動で2号機に切り替わるはずだったが「何らかの原因で実施したテストと同じ事象になっていなかった」(東証の田村康彦IT開発部トレーディングシステム部長)。

 設定値の誤りをテスト行程で防げなかった理由については現在も調査中という。共有ディスク装置でほかの設定に誤りがないかについては「富士通と検証して問題ないことを(既に)確認している」(同)とした上で、さらに検証を進めるとした。』