『米国時間2024年3月18日に行われたGDC 2024の技術セッション「Advanced Graphics Summit: GPU Work Graphs: Welcome to the Future of GPU Programming」において,AMDとMicrosoftは共同で,DirectX 12の新機能「Work Graph」を発表した(関連リンク)。本稿では,Work Graphとは何で,どのような利点をもたらすのかを解説したい。
さて,今回の本題であるWork Graphという用語が,ピンと来ない人もいることだろう。 ここでいう「Graph」とは,「グラフ構造」を意味している。マスで表される「ノード」と「ノード」を連結させたフローチャートのようなネットワーク構造では,あるノードの処理系で特定の条件が成立すると,成立条件ごとにそれぞれ別の接続先ノードに処理系が移る。処理が移るときは,上流のノードが出力したデータが,下流のノードに入力されていく。 Work Graphにおけるノードとは,GPUのタスクを表す。それは処理系の実行命令(dispatch)に相当するコマンドであったり,単一スレッドで動作するシェーダプログラムであったり,あるいは同一のシェーダを並列で動かすグループスレッドのような場合もある。 Work Graphのメリットは,これまではGPUが処理するときに,オーケストラにおける指揮者のような役割をしていたCPUの関与が,ほとんど不要になること。GPU自身が,自発的に各処理系の実行を進められるのだ。
一方で,Work GraphをPlayStation 5やXbox Series X|Sといったゲーム機のGPUで利用できるかは不明だ。現状,AMDは「Work Graphは,Radeon RX 7000系(RDNA3ベース)のGPUからの対応」としているので,RDNA2系のGPUを搭載するPS5やXbox Series X|Sでは対応できない可能性がある。
統合型シェーダーアーキテクチャを採用したNVIDIA GeForce 8シリーズではWindows / Mac OS X / Linux用の標準的な汎用Cコンパイラ環境 (CUDA) が提供され、一方ATI Radeon HD 2000シリーズではハードウェアに直接アクセスできる環境 (Close to Metal(英語版)) が、そしてRadeon HD 4000シリーズ以降ではATI Stream(Brook+言語と抽象化レイヤーであるCAL)によるアクセス手段が用意されている[6]。
実態としては最上位でもミドルクラスの性能であり、Resizable BAR 非対応のマシンでのパフォーマンスの大幅低下やドライバの完成度の低さやアイドル時の電力効率の低さなどで主要2社の製品に劣るものの、既に十分使える製品となっているため、主要2社に対するカウンターとしての存在感を示すことには成功したと言える。
AMDのGPUは、Radeon HD 2000~HD 6000シリーズにおいてVLIWを採用していたが、HD 7000シリーズ以降では、グラフィックスだけでなくGPGPUでも性能を発揮できるようにするために、非VLIWなSIMDとスカラー演算ユニットにより構成されたGraphics Core Next (GCN) アーキテクチャを採用している[32]。AMD GPUではWavefront単位(64ハードウェアスレッド)での並列処理実行が特徴となっている。
^ 小口哲司他 (1987年). “μPD7220後継のグラフィックス・コントローラLSI, コピーや塗りつぶし機能を強化 - 日経エレクトロニクス1987.2.23” (PDF). Oguchi R&D. 2020年11月15日閲覧。
^ Microsoft releases DirectX 7.0 | Windows Server content from Windows IT Pro
^ Schechter, Greg (2006年3月19日). “DWM's use of DirectX, GPUs, and hardware acceleration” (英語). Greg Schechter's Blog. 2009年2月14日閲覧。
^ 【レビュー】初の統合型シェーダーアーキテクチャ「GeForce 8800シリーズ」を試す (1) 新アーキテクチャで登場したG80 | マイナビニュース
^ a b 日経エレクトロニクス 2007/10/8 「プロセサはマルチ×マルチへ」
^ AMDのGPGPU戦略は新章へ - ATI Streamの展望、DirectX Compute Shaderの衝撃 (1) Radeon HD 4000シリーズでネイティブGPGPU | マイナビニュース
^ MicrosoftがGPGPU開発向けC++の拡張「C++ AMP」を発表 - 多和田新也(AFDSレポート)、PC Watch、Impress(2011年6月17日付配信、2012年3月24日閲覧)
^ テッセレーションの概要
^ 現実路線へ修正されたAMDのFUSION - 後藤弘茂のWeekly海外ニュース、PC Watch、Impress(2007年12月25日付配信、2012年3月24日閲覧)
^ Intelの次期CPU「Ivy Bridge(アイビーブリッジ)」を裸にする - 後藤弘茂のWeekly海外ニュース、PC Watch、Impress(2012年3月2日付配信、2012年3月24日閲覧)
^ Intel NehalemとAMD FUSION 両社のCPU+GPU統合の違い - 後藤弘茂のWeekly海外ニュース、PC Watch、Impress(2007年10月11日付配信、2012年3月24日閲覧)
^ CPUとGPUの境界がなくなる時代が始まる2009年のプロセッサ - 後藤弘茂のWeekly海外ニュース、PC Watch、Impress(2008年12月2日付配信、2012年3月24日閲覧)
^ 5981_High_Bandwidth_Memory_HBM_FNL - High-Bandwidth-Memory-HBM.pdf
^ 【レビュー】初のHBM搭載ビデオカード「Radeon R9 Fury X」を試す - PC Watch
^ これが“4096”の性能だ:“Fiji”と“HBM”の実力を「Radeon R9 Fury X」で知る (1/5) - ITmedia PC USER
^ Hot Chips 27 - AMDの次世代GPU「Fury」 (1) HBMを採用したAMDのGPU「Radeon R9 Fury」 | マイナビニュース
^ 株式会社インプレス (2018年3月20日). “【後藤弘茂のWeekly海外ニュース】 Intelなどプロセッサベンダーがけん引するHBM3規格” (日本語). PC Watch 2018年11月12日閲覧。
^ NVIDIA® OptiX アプリケーション・エンジン | NVIDIA
^ NVIDIA® OptiX Application Acceleration Engine | NVIDIA
^ GTC - NVIDIA「OptiX」を解説、レイトレーシングはインタラクティブの時代へ (1) なぜ、今、レイトレーシングなのか | マイナビニュース
^ 4Gamer.net ― PowerVRのImaginationが“ハイエンドGPU”の設計に着手。ハイブリッドレンダリングハードウェア,そして新API「OpenRL」とは?
^ “GPU Shortage, Affordable Robodog, Humanizing Large Language Models, and more” (英語). GPU Shortage, Affordable Robodog, Humanizing Large Language Models, and more (2023年8月17日). 2023年10月30日閲覧。
^ NVIDIA TESLA: A UNIFIED GRAPHICS AND COMPUTING ARCHITECTURE P.44 IEEE 2008年
^ ホワイトペーパー; NVIDIA の次世代 CUDA™コンピュートアーキテクチャ: Fermi™
^ An Introduction to Modern GPU Architecture P.44 NVIDIA
^ NVIDIA GPUの構造とCUDAスレッディングモデル
^ a b c d e f g h i j k l m n o p NVIDIA (2009年). “Whitepaper; NVIDIA's Next Generation CUDA™ Compute Architecture: Fermi™ (V1.1)”. pp. 7-8. 2015年12月5日閲覧。
^ a b c ■後藤弘茂のWeekly海外ニュース■ DirectX 11でも強力なNVIDIAの新GPU「GF100」 PC Watch 2010年1月19日
^ a b c d e f GPU Computing Applications P.42 NVIDIA 2011年
^ NVIDIA (2009年). “Whitepaper; NVIDIA's Next Generation CUDA™ Compute Architecture: Fermi™ (V1.1)”. p. 11. 2015年12月5日閲覧。
^ 4Gamer.net ― NVIDIA,Fermi世代の次期GeForce「GF100」グラフィックスアーキテクチャを発表
^ AMD's Graphics Core Next Preview: AMD's New GPU, Architected For Compute P.3 2011年12月21日
^ a b c d e f g h i j k l m n o p q r s t u v w AMD GRAPHIC CORE NEXT P.10 AMD 2011年7月
^ a b c d e f g h i j k l m n AMD GRAPHIC CORE NEXT P.39 AMD 2011年7月
^ a b c AMD GRAPHIC CORE NEXT P.24 AMD 2011年7月
^ AMD GRAPHIC CORE NEXT P.33 AMD 2011年7月
^ 【特別企画】歴代家庭用ゲーム機を軒並み分解――TGS2008「ゲーム科学博物館」より(7ページ目) | 日経 xTECH(クロステック)
^ 後藤弘茂のWeekly海外ニュース - PLAYSTATION 3のグラフィックスエンジンRSX
^ PS Vitaで採用されるGPUコア「PowerVR SGX543MP4+」のImaginationに聞く「+」の意味。PowerVRは次世代ゲーム機への採用も目指す!? - 4Gamer.net
^ 【西川善司】Wii UのGPU性能と新型コントローラに秘められた「コアゲーマー求心」の裏戦略 - 4Gamer.net
^ [CEDEC 2012]3DSはまだその実力を100%発揮できていない!? 3DSが搭載するGPUコア「PICA200」の詳細 - 4Gamer.net
^ 後藤弘茂のWeekly海外ニュース - NVIDIAチーフ・サイエンティスト インタビュー(下)
^ 3Dグラフィックス・マニアックス (5) GPUとシェーダ技術の基礎知識(5) | マイナビニュース
^ NVIDIA Gaming Technology Powers Nintendo Switch | NVIDIA Blog
^ Conformant Products - The Khronos Group Inc
^ 【後藤弘茂のWeekly海外ニュース】PlayStation 4のAPUアーキテクチャの秘密 - PC Watch
^ CreativeからGeForce 256搭載ビデオカードが登場 - AKIBA PC Hotline! 1999年10月9日号
^ GeForce 256
^ 3Dlabs Wildcat VP760 Datasheet
^ ATIがDirectX 9に対応したVPU「RADEON 9700」をリリース
^ 5G時代のエッジに求められるVPUとは?米インテル担当者に聞く | 日経クロステック(xTECH)
^ Intel、次世代のMeteor LakeにVPUを統合予定。第13世代CoreでLE Audio対応も - PC Watch
^ 【後藤弘茂のWeekly海外ニュース】CPUとGPUのメモリ空間を統一するAMDの「hUMA」アーキテクチャ - PC Watch
^ 【後藤弘茂のWeekly海外ニュース】AMD Kaveriのメモリアーキテクチャと今後のAPU進化 - PC Watch
^ CPU と GPU の比較: 違いを理解する | Intel
^ GeForce RTX 30 シリーズ ノート PC - NVIDIA
^ Razer Core X - Thunderbolt™ 3 eGPU
^ Mac で外付けのグラフィックプロセッサを使う - Apple サポート (日本)
^ Mac で Blackmagic eGPU を使う - Apple サポート (日本)
^ Matrox、NVIDIAのカスタム版Quadroを採用したビデオカード - PC Watch
^ Appleから利用停止宣告を受けたImaginationの今 - EE Times Japan
^ 4Gamer.net ― ATIにお別れ。AMD,ATIブランドを統合し,GPUは「AMD Radeon」に
^ ASCII. “インテルとATIが広範なクロスライセンス契約──RADEON統合チップセット登場も”. ASCII.jp. 2023年6月22日閲覧。
^ Intergraph - 古典コンピュータ愛好会
^ Macronix - VideoChips
^ ASCII. “業界に痕跡を残して消えたメーカー CG業界を牽引したSGI (1/4)”. ASCII.jp. 2023年6月22日閲覧。
^ “sgistuff.net : Hardware : Graphics”. www.sgistuff.net. 2023年6月22日閲覧。
^ EETimes (1999年8月10日). “SGI graphics team moves to Nvidia”. EE Times. 2023年6月22日閲覧。
^ 1991年 もっと大きい画面が欲しい よりリアルに高速描画したい(アイ・オー・データ機器)
(c) The Financial Times Limited 2023. All Rights Reserved. FT and Financial Times are trademarks of the Financial Times Ltd. Not to be redistributed, copied, or modified in any way. The Nikkei Inc. is solely responsible for providing this translation and the Financial Times Limited does not accept any liability for the accuracy or quality of the translation.
【図2】2022年のTechFieldDay 25におけるRobert Blum氏(Sr. Director, Mktg and New Business, Silicon Photonics Product Division)のスライドより。ちなみに氏の現在のポジションは現在Applied MaterialsのHead of Product Line Management, Photonics Platforms Business.
こうしたハードウェア面のみならず、ソフトウェア面では「NVIDIA AI Enterprise」という4,000以上のソフトウェアパッケージを提供。中でも「NeMoフレームワーク」は、生成AIモデルの構築からカスタマイズ、展開まで可能なエンドツーエンドのものとなっており、基盤モデル構築の際の課題を解決し、トレーニングの高速化を実現するという。
スタンフォード大学のAndrej Karpathy氏らの論文「Automated Image Captioning with ConvNets and Recurrent Nets」からの抜粋。写真を見せられた学習型AIがかなり的確な英作文を披露する事例。学習した知識にないものが示されると間違えることもある。「赤ちゃんの例」はそのささやかな誤り例。
またAMDは、次世代APUシリーズに向けて、CPU管理下のメモリ空間とGPU管理下のメモリ空間を論理的に共有一体化させたGPGPUプラットフォームとして、HSA(Heterogeneous System Architecture)を提唱。 NVIDIAがGPGPUに舵を切った2010年前後、AMDはGPGPUよりもヘテロジニアス(異種混合)コンピューティングの実現に未来を感じ、「Fusion」プロジェクトを推進した