スパコン富岳、世界一の計算力で革新的AI開発に挑む

https://www.nikkei.com/article/DGXZQOHD163KW0W1A210C2000000/

『スーパーコンピューターで膨大なデータを学ばせ、創薬や材料開発、自動運転車などの画期となる人工知能(AI)を実現しようとする研究が進む。理化学研究所は世界最高峰のスパコン「富岳」の全計算能力を使って技術革新を目指す。欧米でも同様の動きは盛んで、計算力がAI競争の行方を握っている。

理研は2022年度にも富岳の全ての計算能力を使い、世界最大のAIを試作する。富岳は16万個のCPU(中央演算処理装置)を…

この記事は会員限定です。登録すると続きをお読みいただけます。

残り1607文字

春割ですべての記事が読み放題
今なら2カ月無料!

春割で申し込む
https://www.nikkei.com/promotion/?ak=https%3A%2F%2Fwww.nikkei.com%2Farticle%2FDGXZQOGM11C1B011032021000000&n_cid=DSPRM1AR08_promo

無料会員に登録する
https://www.nikkei.com/r123/?ak=https%3A%2F%2Fwww.nikkei.com%2Farticle%2FDGXZQOGM010QT001022021000000&n_cid=DSPRM1AR07#free

ログインする
https://www.nikkei.com/login

富岳は16万個のCPU(中央演算処理装置)を持ち、例えばAIに使うと、1秒間に約2エクサ(エクサは100京)回の計算ができる。これを全て使い、創薬や材料開発、自動運転など分野ごとに画期的なAIの実現を目指す。

AIの開発は一般に、創薬や自動運転など目的ごとに関係するデータを大量に計算機に入力して学ばせる。データ量を増やしても性能が高まらなかったり、間違った判断をしたりする場合があった。だが近年、学習法の研究が進んで、データ量や計算機を増やせば性能を高められることが機械翻訳などでみえてきた。

現在では、スパコンの計算能力、学ばせるデータ量、計算結果を左右する項目「パラメーター」の数が重要と注目されている。パラメーターとは例えば病院の診断用のAIならば性別や年齢、既往歴といった項目だ。

スパコンを使うのは、大量のデータを学ばせる必要があるからだ。例えば自動運転車を開発する場合、1台が1年間走ると、カメラや光センサーから約2ペタ(ペタは1000兆)バイトものデータが集まるといわれる。

松岡聡・理研計算科学研究センター長は「創薬や自動運転、翻訳などでは、ペタバイト以上のデータを扱うことが普通になった。それだけのデータを使ってAIを作るには、優れたスパコンが不可欠だ」と話す。

理化学研究所のスパコン「富岳」(理研提供)

目指すのは画期的なAIの開発だ。米マイクロソフトの支援を受ける研究企業、オープンAIが20年6月に公開したAI「GPT-3」は、人に近い自然な文章を作れてイノベーションを起こしたといわれる。1750億ものパラメーターを扱う大規模な計算モデルを使って性能を高めた。

富岳は計算能力では現在世界1位だ。GPT-3が学習に使ったデータの約114倍にもなる5120テラ(テラは1兆)バイトのデータを学習したAIを動かせる。パラメーターの数も同等以上にはなる見込みだ。

松岡氏は「画像や化合物の構造データを大量に作ったり、高速でAIに覚えさせたりする。スパコンで作ったAIでないと画期的な創薬研究などはできない」と話す。足りないデータをAI自体に作らせ、効率的に学ばせる手法は今の主流だ。

理研は富岳で、病気に関わる体内のたんぱく質の構造を詳細に解析し、薬の候補物質を探す。コンピューター断層撮影装置(CT)などの医療画像を使い、がんの早期診断を目指す。30年代に実現が見込まれる「レベル5」と呼ばれる完全自動運転車を実現するAIの開発にも取り組む。

スパコンをAI開発に使う取り組みは、11年に米グーグルと米スタンフォード大学が始めた。現在は米中が先頭を走り、企業も目立つ。「米エヌビディアやマイクロソフトは世界トップ10に入るスパコンを持つ。中国の百度も取り組んでいる」(松岡氏)

欧州では、イタリアの約100の大学と公的機関が構成する研究者の組織「CINECA(シネカ)」が、世界最速のAI向けスパコン「レオナルド」を作る。1秒間に10エクサ回計算できる能力で、22年に運用を始める予定だ。サンツィオ・バッシーニ・ディレクターは「新型コロナウイルス感染症の治療に既存薬を転用する研究や、豪雨や地震などの予測に役立つ」と話す。

期待は大きい。米アルファベット傘下の英ディープマインドは20年11月、半世紀にわたる生物学の難題を解くAIを開発した。創薬につながるたんぱく質の立体構造を短時間で予測した。

今後も競争は続く見込みだ。オープンAIの試算によると、AIを作るのに必要な計算能力は約3.5カ月ごとに2倍になるという。産業技術総合研究所の小川宏高・人工知能クラウド研究チーム長は「今後もスパコンを使ったAIの開発競争は激しくなる」と言う。

勝ち抜くには、スパコンへの投資と人材育成が必要だ。産総研などは講習会を開き、人材育成に取り組んでいる。小川チーム長は「国内企業はスパコンにほとんど投資していない」と話す。大規模なAIを作る潮流に乗り遅れれば、日本の産業競争力をさらに落としかねない。(草塩拓郎)

多様な観点からニュースを考える
※掲載される投稿は投稿者個人の見解であり、日本経済新聞社の見解ではありません。

山崎俊彦のアバター
山崎俊彦
東京大学 大学院情報理工学系研究科 准教授
コメントメニュー

ひとこと解説 スパコンがなぜ必要かという実例を1つご紹介します。記事でも言及があるGPT3の学習には”It was estimated to cost 355 GPU years and cost $4.6m.”とされています。約5億円のコストをかけねばならず、1枚のGPUだと355年もかかってしまう膨大な計算が必要です。

How GPT3 Works – Visualizations and Animations
https://jalammar.github.io/how-gpt3-works-visualizations-animations/

2021年4月2日 12:55いいね
0

竹内薫のアバター
竹内薫
サイエンスライター
コメントメニュー

別の視点 京は計算速度をウリにした結果、社会からあまり支持が得られませんでした。富岳は、その名のとおり、広い裾野を意識し、さまざまな分野で実際に活用してもらおうという姿勢が鮮明ですね。日本のAI開発はいまだ周回遅れと言われていますが、オールジャパン体制で巻き返しを図ってもらいたいです。

2021年4月2日 12:41いいね
1

慎泰俊のアバター
慎泰俊
五常・アンド・カンパニー株式会社 代表取締役
コメントメニュー

別の視点 AIの構成要素はデータと演算性能とアルゴリズムであり、これらは相互補完的に強くなります。例えば、計算機の性能があがり、デジタル化されたデータが大量に集まったことで、アルゴリズムも進歩しているわけです。

ですので、演算性能が高いコンピューターがあるだけでは不十分で、大量のデータやアルゴリズムを開発する人材が必要なわけですが、この二点についてはすでに米中に大幅に遅れを取っており、現在のフェーズでのキャッチアップはもう難しいと思います。

ですので、次のフェーズで勝つために必要なものが何かを見極め、そこにリソースを割いていくべきではないでしょうか。

2021年4月2日 11:46いいね
6