全銀ネット障害、メモリー不足が要因 事前テスト甘く

全銀ネット障害、メモリー不足が要因 事前テスト甘く
https://www.nikkei.com/article/DGXZQOUB163SX0W3A011C2000000/

『三菱UFJ銀行など10金融機関で約250万件の送金が滞った全国銀行データ通信システム(全銀システム)の障害は、各金融機関と同システムをつなぐ機器の容量(メモリー)不足が要因だったことがわかった。機器の更新で処理量が増え、想定の容量を超えてパンクした。事前のテストが不十分だった可能性もあり、検証が求められる。

全銀システムを構築するNTTデータなどは16日までに中継コンピューターのメモリー不足が…

この記事は有料会員限定です。登録すると続きをお読みいただけます。』

『全銀システムを構築するNTTデータなどは16日までに中継コンピューターのメモリー不足が障害の要因だったと金融機関に説明した。同システムを運営する全国銀行資金決済ネットワーク(全銀ネット)の辻松雄理事長が18日に記者会見し、障害の詳しい原因や再発防止策について説明する予定だ。11月末までに金融庁に報告する。

今月10日朝に発生した障害では三菱UFJ銀やりそな銀行など10の金融機関で他の金融機関向けの送金ができなくなった。復旧までに2日間かかり、児童手当や保険金の受け取りなど生活に影響が広がった。

全銀ネットは今月7〜9日の3連休中に同システムとそれぞれの金融機関をつなぐ「中継コンピューター」の更新作業を実施。銀行間の送金手数料が適正かチェックする機能に不具合が生じた。

今回の更新では一度に処理できる情報量(ビット)を32ビットから64ビットに増やした。ビット数が上がると、メモリーを増やす必要がある。

正常な状態であれば、銀行から送られた手数料のデータは中継コンピューターのプログラムで全銀ネットの形式に書き換えられる。書き換えられたデータは共有メモリーと呼ばれる「黒板」に書き込まれ、銀行間手数料をチェックするアプリケーションによって正しい値かチェックされる。

一連の処理中に異常値が混入し、障害が起きた。国立情報学研究所の佐藤一郎教授は「エラーが発生した真因はわからないが、事前のテストでわかりえたエラーであった可能性が高く、テストが甘かったと言わざるを得ない」と話した。

全銀ネットは7〜9日の更新作業を前に計7回のテストを行ったが、網羅的なテストを実施していなかった。テストに必要なデータが足りず、事前の想定が十分だったか検証が求められそうだ。

全銀システムは1973年に稼働を始めた。顧客に影響が出るシステム障害は今回初めて。金融庁は全銀ネットに対し、資金決済法に基づく報告徴求命令を13日付で出した。

【関連記事】

・全銀システム過信のツケ 復旧まで2日、障害の想定甘く
・金融庁、全銀ネットに報告徴求命令 送金障害で

ニュースレター登録

多様な観点からニュースを考える
※掲載される投稿は投稿者個人の見解であり、日本経済新聞社の見解ではありません。

山崎俊彦のアバター
山崎俊彦
東京大学 大学院情報理工学系研究科  教授
コメントメニュー

ひとこと解説 CPUのクロックとか、メモリの容量とか、HDD/SSDの容量とか、どういうこと?と質問を受けることがあります。

私はいつもCPUの性能は人間の頭の回転速度、メモリは作業机の広さ、HDD/SSDは本棚の容量に例えます。

今回の障害の原因が何かはさておき、どんなに処理能力が高くても作業机が狭いと作業が進まないばかりか、次から次に来る書類でどうしようもなくなるであろうことが想像できます。
2023年10月17日 8:36いいね
37

佐藤一郎のアバター
佐藤一郎
国立情報学研究所 教授
コメントメニュー

分析・考察 記事にコメントを載せていただき、御礼申し上げます。

さて本記事は確度の高い情報をもとにされているはずですが、現状、障害時に起きた不具合は徐々にわかりつつあっても、諸要素が多く、特に各不具合の原因に関しては推測しかいえない段階のはず。

障害そのものはメモリ不足に起因したとしても、例えばメモリ不足に至った原因は、想定される処理量を見誤ったのか、何らかの異常・不具合がメモリ不足を招いたのか、メモリ管理の問題なのかなど、複数の可能性がありえます。

 全容がみえない状態ですが、金融を含めた経済新聞として、記事にできる範囲で記事にされたことは意義があったはずですし、今後の追加記事を期待したいです。

2023年10月17日 0:00いいね
153

浅川直輝のアバター
浅川直輝
日経BP 編集委員
コメントメニュー

分析・考察 IT機器のメモリー容量不足は、予期せぬシステム不具合の原因になりやすいものです。

2021年2月に起きたみずほ銀行の大規模システム障害も、そのきっかけはサーバーのメモリー不足でした。

特に設計が古いソフトウエアを使っている場合、メモリーの不足を別の装置(ストレージ)でカバーする仕組みがなく、メモリー不足が即障害につながることがあります。

記事中で佐藤教授がコメントしている通り、本番と同規模のデータを使った事前テストで不具合を発見できた可能性はあります。

企業の決済処理が増えるゴトウ日の直前になぜシステム更新を実施したのかも含め、手続きの検証が求められます。

2023年10月16日 20:16 』