スパコン「富岳」、世界4冠へ貫いた信念とは?

スパコン「富岳」、世界4冠へ貫いた信念とは?理研・松岡氏が明かす開発の舞台裏
浅川 直輝 日経クロステック/日経コンピュータ

https://xtech.nikkei.com/atcl/nxt/column/18/00677/080600058/

『「スパコンは使われてなんぼ」。理化学研究所計算科学研究センターの松岡聡センター長は、かねてこう公言してきた。スーパーコンピューター「富岳」の開発でも信念を貫いた。性能ランキングの世界4冠を達成した決め手は何だったのか、最先端技術を開発する国家プロジェクトのあるべき姿とは。開発をけん引した松岡氏に直撃した。

(聞き手は浅川 直輝=日経コンピュータ編集長)

改めて「富岳」の世界4冠獲得、おめでとうございます。開発プロジェクトにおいて最も重視したことは何でしょう。

 アプリケーションファーストの設計思想を貫くことです。企業や研究機関が実際に使う様々な科学技術計算用アプリケーションを、最高の性能で動かす。これを一番の目標に掲げて徹底しました。

 我々は富岳の開発過程で、社会的・科学的に意義が大きく重点的に取り組むべき「重点課題」を9つ設けました。いくつかの課題については既に現状の100倍以上のアプリケーション実効性能を発揮しています。重点課題全体の平均でも数十倍ですね。

 何か1つの分野ではなく様々な分野のアプリケーションを最高の性能で動かすために、我々が知る限り最善のマシンを作りました。結果としての世界4冠だと考えています。

 開発に当たり、特定のベンチマークで1位を目指すつもりは全くありませんでした。およそ10年の開発期間を通じて、設計についてベンチマーク性能とのトレードオフを迫られた際にベンチマーク性能を選んで設計を変更したことは、今まで一度もありません。

演算パターンの多くをカバー
富岳が1位をとった4つの指標のうち、TOP500(LINPACK演算性能)以外の「HPCG」「Graph500」「HPL-AI」の意義を教えてください。

 HPCGは自動車や飛行機の空力設計、構造計算といった産業用アプリケーションの性能を測る代表的な指標です。

 Graph500は文字通り大規模なグラフ、すなわち多数の頂点と枝から成るデータ構造を解析する性能を評価する指標です。実社会の複雑な現象を表現する際に、グラフをよく使います。ソーシャルネットワークや各種のビッグデータなどです。

 最後のHPL-AIはCNN(たたみ込みニューラルネットワーク)をはじめとする深層学習(ディープラーニング)の性能評価の指標です。2019年にできたばかりのベンチマークですが、今後は従来の伝統的な数値計算をある程度置き換わるものになるでしょう。

 これらとTOP500を加えた4つのベンチマークで世の中の演算のパターンをかなりカバーできています。これらのベンチマークに関する富岳の演算性能が評価されたのは、私たちが掲げた開発方針に照らして大きな意義があると考えています。

(写真:菅野 勝男)
[画像のクリックで拡大表示]
汎用性を高めるため、京の「SPARC」に代えて「Arm」を採用しました。決断には曲折があったのでは。

 Armの採用を決定するまでにはすごい戦いがありました。理研側は絶対Armにしようと言っていました。

 京の失敗の1つは売れなかったことです。エコシステム(普及促進に向けた生態系)を作れず、ソフトウエアが出てこなかった。

 最終的にArmに決めてよかったと思っています。富士通にとっても、CPUの重要な部分を外部から吸収できたのはベネフィットがあったのではないでしょうか。

Armのエコシステムにはどう貢献すると考えますか。

 社会的インパクトが大きいと思います。今やスマートフォンのCPUとして誰でもArmを使っているわけですから。スパコンというお化けみたいなArm搭載機が登場したのは、Armの特徴を分かりやすく示した例と言えるでしょう。

 クラウドをはじめとする様々な分野のエコシステムにArmが採用される道が開けたと考えています。富岳に使ったバージョンか将来のバージョンが、クラウドのデータセンターで大規模に使われる可能性は十分にあるでしょう。動画配信は得意分野ですし、AI向けの用途も期待できます。

(写真:菅野 勝男)
[画像のクリックで拡大表示]
富岳の開発プロジェクトにおいて最も苦労したことは何でしょう。

 メンバーごとに違うと思いますが、私としては消費電力の目標を達成するのに最も苦労しました。むちゃくちゃアグレッシブな目標でしたから。

 消費電力に関しては、1ワット当たり十数ギガフロップスの性能を達成しないとマシンを作れないと分かりました。これは当時としては常識外の(省エネの)数字でした。当時の世界トップクラスのGPUマシンと比べても3倍の開きがあった。これをCPUでやらなくてはならなくなったのです。

 京は1ワット当たり1ギガフロップス以下でしたから、これは大変なことだと。当時の(GPUを採用した)TSUBAME2.5でも3ギガフロップスくらいでした。

半導体技術の見直しが奏功
目標を達成するためにどんな工夫を?

 ポイントは半導体の設計にあったと考えています。あれこれアセスメントした結果、このままでは目標に届かないという結論に達しました。そこで製造を委託した台湾の半導体大手TSMCからの詳細な設計データを基に議論を重ねました。

 その結果、半導体のアーキテクチャーを見直しました。当初の富岳用チップは(京の派生スパコン)FX100に近い設計でしたが、現在は大きく変えています。

半導体の設計レベルで見直したと。

 その通りです。富士通の貢献が大きかった。

省電力性能を競う「Green500」は4位でした。結果をどう評価しますか。

 富岳の順位は4位でしたが、消費電力効率の値そのものはトップと2割ほどしか違わないんですよ。パワポ(Microsoft PowerPoint)まで動く汎用性を確保したうえで、たかだか2割しか違わないのはすごいことです。

 Green500向けに富岳のハードやソフトをチューニングする時間がまったくありませんでした。だから今回のGreen500の結果は、本当の実力ではありません。

富岳の世界4冠は日本のコンピューター産業の発展や人材の育成にどう貢献すると考えますか。

 まず富士通が素晴らしいプロセッサーを作ったことをみなさんに分かっていただきたい。なぜ実現できたのかと言えば、国プロ(国家プロジェクト)として取り組んだからです。民間企業としてのビジネス目的だけだったら、絶対に無理だったでしょう。

 民間では担保できないリスクマネーを国が投入して、オールジャパンでつくり上げたからできたんです。ある意味、ムーンショット(月面着陸のような革新的な取り組み)と言えるのではないでしょうか。

 IT産業は民間が主導している印象があるかもしれませんが、民間だけで本当の最先端技術を開発するのはリスクが大きすぎます。ソフトウエアなどの既存資産がありますから。民間はむしろ、最先端技術の研究開発にコンサバティブになる面がある。一方である程度アグレッシブな技術や製品を開発しないと、世界では競争できません。

国家プロジェクトが必ずしも成功するわけではありません。むしろ失敗とされる事例が多いのでは。

 おっしゃる通りです。IT産業に国が口を出して失敗した例はたくさんあります。ただ、あまりに失敗の印象が強いため、国がそういうところに何か参加して、リスクマネーをばらまいても意味がないんじゃないかと捉える風潮があるような気がするんです。

 もちろん投資すべき分野の見極めは必要です。国プロの評判が悪くなったのは見極める力や人材が不足していたのも一因でしょう。

(写真:菅野 勝男)
[画像のクリックで拡大表示]

 富岳に関しては私は当事者ですが、やはりプロジェクトの過程や結果を客観的に分析すべきです。勘所の方程式をまとめ上げて、ITや他の分野に適用していく必要があります。こうした取り組みを重ねれば、日本の産業は世界の中でより競争力を高められるのではないでしょうか。』