米銀システムが一時停止 決済など、FRB「操作の誤り」

https://www.nikkei.com/article/DGXZQOGN2502D0V20C21A2000000/

『【ニューヨーク=大島有美子】米連邦準備理事会(FRB)が提供する米国の銀行システムが24日、数時間停止した。銀行間や預金者が日々の決済に使う複数のシステムが一斉に停止したため、金融機関をはじめ産業界にも影響が生じたとみられる。FRBは「操作上の誤り」と説明しており、サイバー攻撃は確認されていないという。

FRBによると、米東部時間午前11時15分(日本時間25日午前1時15分)にサービスが停止しているのを担当者が認識した。ACHと呼ばれる小口の決済網、即時の電子決済、小切手決済、FRBと預金取扱機関の間での現金の処理など、サービス停止は金融機関が通常の業務で使う多数のシステムに及んだ。午後4時半時点でほぼすべてのシステムが復旧した。

金融機関や企業において給与や社会保険、税の還付から家賃まで、期日を定める支払いに影響したとみられ、FRBは24日の一部サービスの処理終了時刻を延長して対応している。米メディアによると、ACHでは2019年、1日に約6200万件もの決済を処理した。

すべての記事が読み放題
有料会員が初回1カ月無料

有料会員に登録する
https://www.nikkei.com/r123/?ak=https%3A%2F%2Fwww.nikkei.com%2Farticle%2FDGXZQOGM010QT001022021000000&n_cid=DSPRM1AR07

無料会員に登録する
https://www.nikkei.com/r123/?ak=https%3A%2F%2Fwww.nikkei.com%2Farticle%2FDGXZQOGM010QT001022021000000&n_cid=DSPRM1AR07#free

ログインする
https://www.nikkei.com/login

富士通、東証問題で信頼失墜 根本から組織見直し

富士通、東証問題で信頼失墜 根本から組織見直し
富士通 再起動なるか(1)
https://www.nikkei.com/article/DGXZQOFK1585X0V10C21A1000000/

 ※『後日判明した障害の原因はネットワーク接続ハードディスクのマニュアル不備だった。システムを開発した富士通が、米企業からOEM(相手先ブランドによる生産)供給を受けていたストレージの仕様が変更されていたのにもかかわらず、マニュアルと設定値は従前のまま変わっていなかった。』

 ※ 日本の「IT関係」「コンピューター関係」全般に、ずっと纏わりついている話しだ…。

 ※ 「ハード」も、「ソフト」も、全て「舶来」「外来」のものだ…。

 ※ 何とか、「翻訳」して、「使いこなそう」としている…。

 ※ 上級幹部は、それなりに「英語力」も備わっているんだろう…。

 ※ しかし、末端の「実働部隊」は、どうなのか?OEM供給先から渡された「英文マニュアル」を、読みこなせるだけの「英語力」備えているのか?

 ※ 今の時代、別に、個人で備える必要はない…。ネットに上がっている文書(.html .pdf)だったら、Google翻訳にかけることができる…。

 ※ それができなければ、テキスト抽出して、「機械翻訳ソフト」にかければいい…。

 ※ 末端の実働部隊、そういう才覚・能力があるのか? そういう「機器、ソフト」は、備えているのか?

 ※ そこが改善されない限り、こういう問題は、繰り返し繰り返し、起きるだろう…。

『富士通が変わろうともがいている。コンピューターや通信機器で電機産業をけん引したのは今や昔。ハードからシステム構築、サービスへと時代の潮流が変わるのに乗り遅れ、2020年10月の東京証券取引所のシステム障害では世間の信頼も損なった。「大企業病」の克服には、組織体質から働き方まで根本から変えなければならない。富士通は再起動できるか。

「またか」社外取から厳しい指摘
「金融業界はまたかとあきれている」「タガが…

この記事は会員限定です。登録すると続きをお読みいただけます。

残り2904文字

すべての記事が読み放題
有料会員が初回1カ月無料

有料会員に登録する
https://www.nikkei.com/r123/?ak=https%3A%2F%2Fwww.nikkei.com%2Farticle%2FDGXZQOGM010QT001022021000000&n_cid=DSPRM1AR07

無料会員に登録する
https://www.nikkei.com/r123/?ak=https%3A%2F%2Fwww.nikkei.com%2Farticle%2FDGXZQOGM010QT001022021000000&n_cid=DSPRM1AR07#free

ログインする
https://www.nikkei.com/login

20年12月3日夕、富士通の臨時取締役会はリモート形式にもかかわらず、異様な熱を帯びた。出席した4人の社外取締役から次々と投げかけられる厳しい指摘に、社長の時田隆仁(58)はただ黙って耳を傾けていた。

20年10月の東証システム障害では終日売買停止となり、調査委の報告書には「富士通の責任は重い」との文言が盛り込まれた

その2カ月前の10月1日、日本株の売買インフラを担う東京証券取引所で大規模システム障害が発生した。終日、全銘柄の取引が停止し、3兆円規模の売買機会が失われた。入社以来、システムエンジニア(SE)として金融畑を歩んできた時田は、10年に稼働した東証システムの運用にも関わった。「起きてはいけないことが起きてしまった」。事の重大さに青ざめた時田は自ら資料を取り寄せ、対応を指示した。

後日判明した障害の原因はネットワーク接続ハードディスクのマニュアル不備だった。システムを開発した富士通が、米企業からOEM(相手先ブランドによる生産)供給を受けていたストレージの仕様が変更されていたのにもかかわらず、マニュアルと設定値は従前のまま変わっていなかった。

富士通に「帰責性」認定

東証システムトラブルについて、オンライン記者会見で謝罪した富士通の時田社長(20年10月)

「マニュアル記載の誤りの原因および責任は作成者にある」。東証を傘下に持つ日本取引所グループの社外取締役で構成する独立調査委員会は報告書をまとめ、「富士通に帰責性があるといわざるをえない」と指摘した。

「想定が足りなかったとしか言えない」。システム障害対策チームを束ねる富士通副社長の古田英範(62)は唇をかむが、東証システムを巡る失態は今回が初めてではない。SEによるプログラムの設定ミスで全銘柄の取引が一時停止した05年、12年に続き3度目となる。

「ようやく変わろうとしている」

無策だったわけではない。「11・1を忘れるな」。05年のシステム障害が起きた11月1日に合わせ、富士通では毎年、顧客システムの保守や運用体制を総点検してきた。幹部が一斉に顧客先を訪れ、SEの役割分担や働きぶりなどをつぶさに調べたが、今回問題となったOEM製品のマニュアル記載はチェック項目から漏れ、見直されることはなかった。

20年12月3日の臨時取締役会では責任問題に話が及んだ。議長を務める、産業創成アドバイザリーシニア・アドバイザーの阿部敦(67)は東証社長の宮原幸一郎(63)が辞任したことに触れ、社外取に考えを問うた。「とどまって再発防止に取り組むべきだ」。全員がそう答え、時田を4カ月間の50%減俸とするなどの社内処分が決まった。阿部は言う。「富士通はようやく変わろうとしている。システム障害で痛みを感じたトップだからこそ責任をもって改革をやりきれるはずだ」

伸び悩むニッポンITの雄

富士通は1970年代、大型汎用コンピューターの開発で一躍、世界企業へと成長した。しかし、かつてのけん引役だったハードディスク装置、パソコン、携帯端末、半導体製造事業を次々と売却。20年3月期の連結売上高はピークだった01年3月期比3割減の3兆8577億円まで縮んだ。

足元では高速通信規格「5G」の基地局向け事業が好調で、21年3月期の連結純利益は過去最高となる1770億円を見込む。ただ、主要事業では対応の遅れが目立つ。

機器類に代わって力を入れたシステム構築では、特定のベンダーに仕様設計から開発、構築まで丸投げする日本特有の商慣行からシェアを伸ばした。障害を起こしても東証システムを担当し続けたのはこうした理由からだ。だが政府が省庁横断システムに米アマゾン・ドット・コムのクラウドの採用を決めるなど、足元では低コストの外資系の勢力に侵食されつつある。

新たに市場が立ち上がったデジタルトランスフォーメーション(DX)支援では戦略系コンサルティング企業の後じんを拝する。いずれも既存事業で一定のシェアを持つ分、環境変化に柔軟に対応できなかった。

時田は19年の社長就任の前から改革の必要性を肌で感じていた。きっかけは17年の英国駐在。1年ごとの成果を厳格に評価される現地社員は、シビアな環境ゆえに仕事へのこだわりが日本人社員より強く、変化にも柔軟に対応する。「本当に同じ富士通の社員なのか」。驚きから次第に、欧米では一般的な、ポストごとに最適な人材を充てる「ジョブ型雇用」こそが再浮上のカギを握ると確信するようになった。

ジョブ型導入、年功序列崩す

19年6月、社長に就いた時田が手をつけたのは徹底的な組織・人事改革だった。組織の硬直化を招いた年功序列を崩そうと、ジョブ型雇用を導入。新しい風を吹き込む狙いから外資系の幹部人材を積極登用した。

社員の行動原理である「Fujitsu Way」も12年ぶりに改訂した。社会における存在意義を自社の「パーパス」とし、担当企業ばかりに目を奪われ、たこつぼになっていた企業風土を変えようと動いた。

いずれの改革にも共通するのがオープン化だ。制度上の、あるいは心理的な壁を徹底的にぶち壊し、融通無碍(むげ)な状態になれば「人が自由に移動し考え方が広まる。そうすれば企業風土も変わる」と時田は強調する。

テレワーク拡大は後戻りせず

東証のシステム障害は時田の富士通改革に影を落とした。やり玉に挙がったのがSEのテレワーク拡大だった。SEの大半は通常、顧客企業の一室を間借りし、数年単位で客先に常駐しながらシステム開発や改良、運用などの業務に当たる。時田はSEとしての経験から業界慣例であるこの「客先常駐」を改められると確信し、金融機関などと話し合いを進めてきた。

「うちでも同様の障害が起こるのではないか」。東証問題を機にSEが近くにいないことに対する不安が広がったが、あしきなれ合いの解消にもつながると考え、揺るがなかった。「常駐を解除したらチェックが甘くなるわけではなく別次元の話」と、客先常駐プロジェクトの7~8割をテレワークに切り替えた。

客先常駐がなくなりテレワークで働くSEの近藤氏

富士通でSEとして働く近藤瑞樹(24)も当初は客先常駐の解除に懐疑的だった。だが実際にテレワークへと切り替え、「むしろ業務の精度が高まった」と感じている。

近藤の顧客企業には約50人のSEが働く。同じオフィスにいても相手側の担当者との連絡は主に電話が使われていた。テレワークと同時にチャットツールでやりとりできるようになり、「仕様の擦り合わせ、資料の細かなニュアンスも気軽に確認できる。互いにコミュニケーションを重視するようになり、同じオフィスにいた時よりもやりとりは密になった」と話す。

「現場も同じ課題を認識」

人が変われば会社も変わる。言うは易しだが、東証システム問題での信頼失墜や新型コロナウイルスの逆風下に、国内外で13万人の社員を抱える大企業を変えるのは容易ではない。

時田は言う。「社長になって分かったが、実は現場の社員も同じような課題認識、問題意識を持っていた。私はそのスイッチを押すだけ」

入社年次ではなくジョブ型で次代の成長を担う最重要事業のトップを抜てきしたのはその一例だ。東証問題で失った信頼を取り戻すためにも、自己破壊の手は緩めない。

=敬称略、つづく

(林英樹、水口二季が担当します)

東証システム障害の一部始終と残る疑問、NAS故障と切替設定の不備が重なる

東証システム障害の一部始終と残る疑問、NAS故障と切替設定の不備が重なる
山端 宏実、岡林 凛太郎、長倉 克枝、金子 寛人 日経クロステック/日経コンピュータ
https://xtech.nikkei.com/atcl/nxt/column/18/00001/04708/

※ まあ、当分は揉めるだろう…。

※ この記事で言われていることは、そもそも「実際には、NASのファームウエアの切り替え用設定値に誤りがあり、メモリー故障に起因する障害パターンが発生した際はNASの冗長化が機能しなくなっていた。」という事実が、「大抜かり」ではないのか、という「システムの運用・管理」の手際(てぎわ)に関する批判が一つ…。

※ もう一つは、その場合に「終日取引停止」とした「総合的判断」への批判だ…。

※ 関係各方面に「ヒアリング」した結果、「そっちの方が、傷は浅い、と判断した。」ということなんだが、その「ヒアリング」自体が、「適正手続きを踏んだもの」だったのか…。早速、「オレのところには、問い合わせが来て無いぞ。」という話しが、出ているようだ…。

※ 話しは、「証券各会社」間の競争へとも広がって行くような様相も見せている…。そういう「東証のシステム障害」をも、織り込んだ「料金設定」「顧客への事前通知・承諾の体制」となっているのかどうか…。そこら辺も、含んでの「競争力」「証券会社間の優劣」だろ…、という話しだ…。「護送船団方式」じゃないんだから、という話しだ…。

『 東証の売買システム「arrowhead(アローヘッド)」で取引に支障をきたす大規模なシステム障害が発生したのは2018年10月以来。システム障害により全銘柄の売買を終日停止する事態は東証が取引を全面的にシステム化した1999年以降初めてだ。

 これにより、3兆円規模の売買機会が失われた。影響は東証だけにとどまらず、arrowheadを使用している名古屋・札幌・福岡の各証券取引所でも10月1日の取引が全銘柄で終日にわたり停止となった。

設定不備で切り替えできず
 同社が最初に異常を検知したのは、午前9時の取引開始を約2時間後に控えた午前7時4分だ。arrowheadを構成する運用系ネットワーク内で、同社が「共有ディスク装置」と呼ぶNAS(Network Attached Storage)1号機のメモリーに故障が発生した。

NASは、arrowheadの複数のサブシステムが共通で使用する認証用のデータなどを格納している。1号機と2号機をActive-Active構成で運用しているが、1号機の障害発生時に2号機のみの運用へ自動で切り替える機能が正常に働かなかった。

 この影響で、本来はarrowheadのサブシステムの1つである「情報配信ゲートウエイ」を通じ、同日午前7時0分に送信すべき電文の送信ができなかった。別のサブシステムである「売買監視サーバー」や監視端末へのログインも不可能になるなど、NASの停止による影響はarrowheadを構成する複数のサブシステムに広がった。

 証券会社など外部に異変を通知したのは約1時間後の午前8時1分。さらに午前8時30分すぎに、午前9時からの取引を停止すると通知。午前8時54分には障害の影響が東証以外のシステムに波及しないよう、arrowheadと証券会社間の発注系経路を遮断。

原因究明と復旧作業を進めたが、結局午前11時45分に終日売買停止を発表した。原因となったメモリーが載った基板を同日中に交換したうえでシステムを再起動し、翌10月2日午前9時から売買を再開した。

 その後の調査で、富士通が納入したNASのファームウエアの設定不備が大規模障害につながったことが判明した。2台構成のNASの1台で障害が発生しても、本来はもう1台のみの運用に自動で切り替えてarrowhead全体の運用に支障が出ない設計だった。

 しかし実際には、NASのファームウエアの切り替え用設定値に誤りがあり、メモリー故障に起因する障害パターンが発生した際はNASの冗長化が機能しなくなっていた。

東証はarrowheadを2019年11月に刷新する際、事前のテストで2台のNASの死活監視を途絶えさせて、自動で切り替わることを確認していた。だがその際、今回の設定不備は見抜けなかった。設定作業そのものは富士通が実施していたという。

 東証と富士通は2020年10月4日までにファームウエアの設定を修正したが、なぜNASのファームウエアの設定不備を見抜けなかったのかが今後の焦点となりそうだ。

終日停止の東証判断は適切なのか
 今回のシステム障害では別の問題も浮き彫りとなった。実は午前9時26分の段階で、共有ディスク装置2号機への強制切り替えを完了しており、システムを再起動すればarrowheadを復旧できる状態となっていた。しかし東証は再起動を見送り、午後0時30分からの午後の取引もせずに終日取引停止とすることを正午前に発表した。

 同日夕方の会見で東証の宮原幸一郎社長はこの判断について「複数の市場関係者と協議した結果、(仮に取引時間中に復旧できても)システムを再起動すると(証券会社などから送信済みの注文の扱いなどを巡り)投資家などに混乱が生じることが想定され、終日売買停止することにした」と説明した。

これに対しauカブコム証券の斎藤正勝社長は「当社にそのような(協議の)問い合わせは来ていない。当社はイレギュラー対応でデータを修正すれば注文の失効手続きができる。平常時の手数料だけでなく障害対応も含めてサービス品質だ」とする。

 そのうえで斎藤社長は、証券会社はシステム障害が起こりうると見越してイレギュラー対応で迅速に取引再開できるよう、システム投資や事業継続計画(BCP)の整備を進めるべきだと指摘する。

 「一部の証券会社が障害への備えを怠り、東証もそうした一部証券会社に合わせて再開を見合わせるならば、BCPは画餅と化す。対応可能な証券会社だけでも早期に市場を再開させることこそ、東証が投資家に対し提供すべきサービスではないか」と疑問を呈する。』

東証が新事実、ファームウエア設定不備でNASの冗長化が機能せず

https://xtech.nikkei.com/atcl/nxt/column/18/00001/04693/

 ※ 新事実が判明した…。

 ※ 「設定ミス」「単なるヒューマン・エラー」とも、言えない側面もあるようだ…。

 ※ 前の投稿の、「修正」の要素もあるようなんで、上げておく…。

 ※ オレの「PC組み立て」の方は、一応組み終わって、まだバラック状態だが、「OSインストール」は済んだ…。しかし、一部の機能が使えない(ケース前面のUSB2が、使えない…。マザボとの結線、間違ったようだ…。違うところに挿しているようだ…。USB3は、OK)…。それでも、まあまあ動いている…。

 ※ しかし、インターネットへの接続で「てこずって」いる…。詳しい説明は、省略するが、ルーターの設定に起因するかも知れん…。

 ※ 今日は、ルーターに「入って」、手動で設定を試みてみる予定だ…。

 ※ まあ、「ヤレヤレ…」と、「トホホ…」の連続だよ…。

『東京証券取引所で2020年10月1日に起きたシステム障害の全容が徐々に見えてきた。障害の原因は、富士通が納入したNAS(Network Attached Storage)のファームウエアの設定不備にあった。2台構成のNASでメモリー故障に起因する障害パターンが発⽣した際、NASの冗長化が機能しない設定になっていた。

 東証で10月1日に起きたシステム障害は、全銘柄の売買を終日停止するという未曽有の事態を招いた。東証が取引を全面的にシステム化した1999年以降、システム障害で全銘柄の売買を終日止めたのは初めて。これにより、3兆円規模の売買機会が失われた。』
『NASのメモリー故障が発端
 システム障害の発端は、東証の株式売買システム「arrowhead(アローヘッド)」のNASに搭載したメモリーの故障にあった。業務サーバーで使うユーザー情報などを格納するNASは2台あり、Active-Active構成で冗長化していた。このうちの1台のメモリーが故障し、本来なら1台のみの運用に自動で切り替わるはずが、うまくいかなかった。

関連記事:東証システムの「切り替え失敗」は設定値の誤り、テスト行程で見抜けず
 原因はNASのファームウエアの切り替え用設定値の不備にあった。東証はarrowheadを2019年11月に刷新する際、事前のテストで2台のNASの死活監視を途絶えさせて、自動で切り替わることを確認していた。だがその際、今回の設定不備は見抜けなかった。設定作業そのものは富士通が実施していたという。』
『問題の設定を変更し本番適用済み
 テストなどで設定の不備を見つけられなかった理由は今のところ分かっていない。東証の田村康彦IT開発部トレーディングシステム部長は「なぜこの事象を事前のテストで確認できなかったのかは引き続き検証していく」と話す。

 東証は原因判明を受け、ファームウエアの設定を変更。これにより、メモリー故障に起因する障害が起きても、NASの冗長化が機能することを確認済みだ。具体的には、10月3日にセカンダリセンター(バックアップセンター)で検証したうえで、10月4日にプライマリセンターの本番システムに適用した。

 東証の親会社である日本取引所グループは10月5日、システム障害の原因究明や再発防止策の実効性を高めるため、独立社外取締役で構成する「システム障害に係る調査委員会」を設置した。委員長には弁護士で日比谷パーク法律事務所代表の久保利英明氏が就いた。調査委員会では、システム障害の責任の所在も調べる。

 今後の焦点は、今回のシステム障害の原因となったNASのファームウエアの設定不備を見抜けなかった経緯だ。稼働前のテストに不十分な点がなかったかどうかなどを明らかにする必要がある。さらに、東証は証券会社側のさらなる混乱を避けるため、終日売買停止を決めたが、この判断そのものや決定のタイミングが適切だったのかも焦点になりそうだ。』

東証システムの「切り替え失敗」は設定値の誤り、テスト行程で見抜けず

東証システムの「切り替え失敗」は設定値の誤り、テスト行程で見抜けず
岡林 凛太郎 日経クロステック/日経コンピュータ
(2020.10.06)

https://xtech.nikkei.com/atcl/nxt/news/18/08897/

 ※ オイオイ…、という話しだ…。

 ※『「何らかの原因で実施したテストと同じ事象になっていなかった」』とか、一体何のための「テスト」なんだ…、という話しだ…。

 ※ 結局は、「設定ミス」というヒューマン・エラーか…。「大山鳴動して鼠一匹」…、という話しか…。

『東京証券取引所は2020年10月5日、株式売買システム「arrowhead(アローヘッド)」で10月1日に発生したシステム障害について、メモリー故障が起きた共有ディスク装置1号機を2号機に自動で切り替えられなかった原因を説明した。共有ディスク装置1号機が備える制御機構の設定値の誤りだったと明らかにした。

 東証はアローヘッドの運用系ネットワークで使う共有ディスク装置を、1号機と2号機の構成で運用している。メモリー故障に起因する障害が起きた場合に自動的に2号機に切り替えができない設定値になっていたという。

 共有ディスク装置1号機と2号機の死活監視が切れた場合に自動で共有ディスク装置が切り替わることはテスト行程で確認していた。今回の事象でも共有ディスク装置1号機のメモリーが故障した時に死活監視が切れたと考えられ、自動で2号機に切り替わるはずだったが「何らかの原因で実施したテストと同じ事象になっていなかった」(東証の田村康彦IT開発部トレーディングシステム部長)。

 設定値の誤りをテスト行程で防げなかった理由については現在も調査中という。共有ディスク装置でほかの設定に誤りがないかについては「富士通と検証して問題ないことを(既に)確認している」(同)とした上で、さらに検証を進めるとした。』

富士通社長が謝罪 東証システム障害

富士通社長が謝罪 東証システム障害
「原因究明と再発防止に全力」
https://www.nikkei.com/article/DGXMZO64607090V01C20A0000000/

『富士通の時田隆仁社長は5日、東京証券取引所で1日にシステム障害が発生し、全銘柄の取引が終日停止されたことについて「障害の原因となった機器の納入、システムを構築した企業のトップとして、多くの皆様に多大なるご迷惑をおかけしたことを心よりおわびする」と謝罪した。問題発生以降、時田社長がシステム障害について言及するのは初めて。

自社のデジタルトランスフォーメーション(DX)に向けた取り組みを紹介するオンライン会見の冒頭、システム障害について謝罪の言葉を述べた。「原因究明と再発防止に全力で取り組む」と話し、東証と連携して速やかに再発防止策を講じるとした。

東証で1日に発生したシステム障害は、売買注文を受け付ける基幹システム「アローヘッド」が引き金となった。運用をつかさどる記憶装置のうち1台で、制御用のメモリー(主記憶装置)が故障した。故障が発生すると本来は自動的に代替機に処理が切り替わるはずだったが、機能しなかったという。東証は1日の会見で、「富士通と共同で原因の解明を進めている」と説明した。

東証は2012年にもアローヘッドのシステム障害を起こしている。このときはサーバーで故障が発生し、適切に代替機に処理が切り替わらなかった。富士通は当時も東証と共同で原因究明にあたり、再発防止策を講じた。装置の種類は異なるが、代替機に切り替わらなかった点は今回も共通する。

金融庁は2日、日本取引所グループと東証に対し、金融商品取引法に基づく報告徴求命令を出した。装置の点検が十分だったかや、内部管理体制などについて報告を求める。』

東証売買停止、バックアップに不備 メモリー故障が発端

https://www.nikkei.com/article/DGXMZO64506130R01C20A0EA2000/

※ いろいろ、言われている…。その「共有ディスクシステム」の「コントローラー」が、「完全に死なず、半分死んで「ゾンビ状態」だった(つまり、「オレは、死んだ」というアラートが出なかった)からじゃないか…。」、と言っている人がいた…。

『東京証券取引所で1日起きた売買の終日停止は、システムのバックアップが機能しなかったことが主因だ。きっかけは基本的な情報などを格納するディスク内のメモリーが故障したことだが、もう一つのディスクへの切り替えがうまくいかなかった。2012年のシステム障害でもバックアップが機能しない問題が発生しており、同じ要因が繰り返された。システム全体が止まりやすい構造に問題が無いか、究明が必要になる。

【関連記事】
東証社長「市場運営者として責任痛感」 終日売買停止
東証売買停止、投資家に5つの影響
富士通「ご迷惑かけおわび」 東証のシステム障害で

「『ネバーストップ』を合言葉に市場の安定的な運営を心がけてきた。このような事象が起き、深くおわび申し上げる」。東証の宮原幸一郎社長は1日夕の記者会見でこう陳謝した。コンピューターの処理速度だけではなく、安定性と信頼性を重視したシステムを目指してきたが、取引は終日止まってしまった。

東証によると、2010年に導入した高速取引システム「アローヘッド」では、銘柄名やその日の基準値段など基本的な情報を格納しているディスクが2つあり、「共有ディスク装置」と呼ばれる。今回は午前7時4分に1号機のディスクの故障を検知。通常は、1号機と同じ情報を書き込んでいる2号機に自動的に切り替わるが、バックアップがうまくいかなかった。

システムのバックアップを巡っては、東証では12年2月にも情報配信システムで障害が発生している。1台のサーバーに障害が発生し、別のサーバーに処理を切り替えたつもりだった。ところが、実際には失敗しており、同日午前中の一部銘柄の取引停止につながった。

今回、故障した機器はわかっていたため、ディスクを交換してシステムを手動で再起動をすれば売買再開は可能だった。ただ証券会社からの注文を受け付けていたため、再起動した場合、こうした注文がリセットされてしまう。

注文を出す証券会社側でも通常とは異なる処理が発生する可能性が高かった。そのため「大手や外資、ネット証券など市場参加者の意見を聞いて、混乱を回避するために終日の売買停止を決めた」(株式売買を担当する川井洋毅執行役員)。

原因の究明はこれからだ。故障したディスクやメモリーは富士通製。東証でシステム部門を統括する横山隆介常務執行役員は「ハードの故障自体は想定している。富士通に機器を持ち込み、なぜ自動的に2号機に切り替わらなかったのかという点を調べる」と話した。

富士通は、アローヘッドの設計・開発を一貫して手がけてきた。約350台のサーバーで構成する大規模システムで、今回故障したディスク装置や、正常に作動しなかった2号機への切り替えシステムも手がけていた。

共有ディスク装置は、アローヘッドを刷新した19年11月に導入したものだ。メモリーの故障が発生したのは今回が初めてという。「テストでは正常に切り替えができていた」(東証の横山氏)が、1日は作動しなかった。

【関連記事】
東証システム障害、取引一極集中の危うさ露呈
東証、3兆円の取引機会失う 売買停止で
東証、情報開示に遅れ 投資家への説明も不足

まだ原因は判明していない。ただ、情報処理推進機構ソフトウェア・エンジニアリング・センターの元所長の鶴保征城氏は「重要システムにとって、障害を早期に見つける機能の信頼性確保は最後の課題だ」と指摘。「切り替えがきちんと動作するか、頻繁にテストしなければならない。その意味では残念ながら東証の怠慢と言わざるをえない」と話す。

東証では明日からの取引再開を目指すが、当面はディスク装置を人手で監視して、強制的に切断するなど取引に影響が起こらないように対応するという。東証の宮原社長は、富士通に損害賠償は求めない方針を示した。

富士通は1日、「当社の納入したハードウエアに障害が生じて多くの関係者の皆様に多大なるご迷惑をおかけしたことを、おわびいたします」とコメントした。

金融の大規模システムの設計に詳しい技術者は「障害を発生させないようにする設計が時代遅れだ」と話す。一部の機能が故障しても取引が止まらないように設計すべきだと指摘している。』

ライブ映像 東証でシステムトラブル 全銘柄で取引停止 宮原幸一郎社長ら記者会見

https://www3.nhk.or.jp/news/realtime/rt0003680.html?utm_int=all_contents_realtime_001

 ※ まだ会見は続いている…。

 ※ 原因について、語ったことを要約すると、次のような内容のようだ…。

 ※ ここのシステムは、大きく分けて、「売買を処理するシステム」と「取り引き情報を顧客に配信するシステム」に分かれている。今回のトラブルは、後者の「配信システム」の「ハード」に生じたらしい…。

 「共有ディスクシステム」というハードがある…。そこの「コントロール・システム」に「故障」が発生した…。
 この「コントロール・システム」は、「マザボ」「CPU」「メモリ」などから成り立っている…。
 どうも、そのうちの「メモリ」に故障が発生したようだ…。

 それで、そういう「ハード」に故障が発生した場合には、「バックアップ」システムのほうに「自動で切り替わる」体制にしてある…。しかし、今回なぜか「自動で切り替わらなかった」…。
 その原因は、現在ハードの納入業者(富士通らしい)を呼んで、解析してもらっている(どうも、乗っかっている「ファームウエア」が原因じゃないか…、というような話しになっているらしい…)。

 それで、「バックアップ体制」に自動で切り替わらなかったんで、顧客に取り引き情報を配信できない状態になった…。さらに、「故障したハード」を交換して、システム全体を「再起動」するとなると、相当の時間が掛かってしまう…。
 中途半端に「取り引き」を行うよりも、「終日取り引き停止」の処置を取る方が、却って「傷は浅くて済む」と総合的に判断した…、というような話しだった…。

 なお、ログの解析(常時、観察している)などから、「サイバー攻撃」の可能性は低い…、と判断しているということだった…。