AI時代にさらなる注目を集める「GPGPU」の基本を徹底解説-GPUの並列処理能力を活かして処理能力を向上

近年のAI技術の進化やビッグデータの普及に伴い、「GPGPU(General-Purpose computing on Graphics Processing Units)」という言葉を耳にする機会が増えてきました。GPGPUは、従来のコンピュータの処理能力を向上させる技術として、企業や研究機関だけでなく、個人のゲーミングや映像編集などの分野にも利用が広がっています。

しかし、GPGPUとは一体何なのか、そしてどのように活用されているのか、具体的に理解している人は少ないのではないでしょうか?

そこで今回は、GPGPUの基礎知識から、具体的な注目ポイントや活用例などを中心に、GPGPUについて解説していきます。

1.GPGPUの基礎知識

1-1.GPGPUとは?

GPGPU(General-Purpose computing on Graphics Processing Units)とは、本来グラフィックスの処理に特化したプロセッサーであるGPUを、グラフィックス処理以外の汎用的な計算に利用する技術のことです。

詳細については後述しますが、GPGPUが活用されるようになったのが、GPUの並列処理能力が飛躍的に向上したことが大きな理由。現在では、科学技術計算、ディープラーニング、金融工学など、様々な分野で活用されています。

Silent Master Graphicsシリーズ

1-2.CPUとGPUの違いからGPGPUを理解する

GPGPUの仕組みを知るためには、まずCPUとGPUの違いを理解することが重要です。一般的に、CPUは汎用的な計算処理を行い、GPUはグラフィックスに特化した処理を行うプロセッサですが、それぞれの仕組みを見てみると、CPUは少数の高性能なコアを搭載し、複雑な処理を得意とするのに対し、GPUは多数のコアを利用して、単純な計算を並列に処理することに長けています。

GPGPUは、このGPUの持つ高い並列処理能力を活用する技術です。CPUに対して、GPUのコア数は非常に多いのが特徴です。例えば、「Intel Core Ultra 9 285K」は、PコアとEコアを合わせて24個のコアを搭載していますが、「NVIDIA GeForce RTX 4090」は、16,384個のCUDAコアを備えています。

そして、GPGPUは主としてワークステーションの分野で活用されることが多いソリューションですが、ワークステーションと組み合わされるプロフェッショナル向けの「NVIDIA RTX」シリーズや「Radeon PRO」シリーズには、さらに多くのコアを備えたラインナップが用意されている場合があり、例えば「NVIDIA RTX 6000 ada」は、「NVIDIA GeForce RTX 4090」を上回る18,176個のCUDAコアを備えています。

大量のデータに対して比較的単純な処理を繰り返す場合は、大量のコアで同時並行的な計算が行えるGPUのほうが有利であり、機械学習や科学計算といった、並列処理が求められる分野において、GPGPUが広く利用されるようになったのです。

1-3.GPGPUが注目されるようになった背景

GPGPUは、2000年代初頭に誕生した比較的新しい技術。GPUに搭載されたプログラマブルシェーダーの進化に伴い、GPUの並列処理能力を活かして汎用計算を行うGPGPUとしての試みがスタートしました。

そして、2006年にNVIDIAがCUDAを発表したことが大きな転機となり、GPGPUが一気に普及。その後、OpenCLなどのオープンなGPGPUプログラミング環境が登場したことに加え、ビッグデータの処理や仮想通貨のマイニング、AIにおけるディープラーニングなどに最適であることが追い風となり、GPUはその描画処理性能以上に、GPGPUとしての並列処理能力に注目が集まるようになりました。

そして現在では、データサイエンスやビッグデータの解析には不可欠な技術であり、AI処理の重要性もより高まっていることから、GPGPUの需要はさらに増大していくと予想されます。

1-4.CUDAとOpenCLの比較

GPUをGPGPUとして利用するためには、GPUに対してどのように処理を実行させるかを指示するためのプログラミングインターフェースが必要であり、現在では「CUDA」と「OpenCL」が広く利用されています。

GPGPUの普及に一役買ったCUDAは、NVIDIAが開発したGPU向けの並列コンピューティングプラットフォーム。プログラミング言語はC/C++を拡張したCUDA C/C++が使用されます。CUDAは、NVIDIA製GPUに特化しており、GPUコンピューティングのための豊富なライブラリやツールも提供されています。

一方、OpenCLは、Khronos Groupが策定したオープン標準規格で、NVIDIA、AMD、Intelなど、様々なメーカーのGPUに対応するだけでなく、マルチコアCPUでも動作可能となっています。プログラミング言語はC言語をベースにしたOpenCL Cを使用。クロスプラットフォームでの開発を重視しており、様々なハードウェアで動作可能な点が大きな特徴となっていますが、特定のハードウェアに最適化されていないため、CUDAほどのパフォーマンスを発揮できない場合もあります。

2.GPGPUの注目ポイント

2-1.並列処理能力の高さ

GPGPUのもっとも大きな特徴は、並列処理を活かした高速な計算能力です。並列処理は、画像・動画編集、ゲーム、AI処理など、大規模なデータセットや計算量の多いタスクにおいて特に効果を発揮します。

例えば、動画編集ソフトでエフェクトやフィルターを適用する場合、GPU(GPGPU)を活用することによって、CPUのみで処理する場合に比べて、大幅に処理時間を短縮することができます。

2-2.高いコストパフォーマンス

GPGPUを活用するワークステーションの分野では、DirectXに最適化されたゲーミング向けの「NVIDIA GeForce RTX」シリーズや「AMD Radeon RX」シリーズではなく、「NVIDIA RTX」シリーズや「AMD Radeon PRO」シリーズといったプロフェッショナル向けのビデオカードが利用されます。

プロフェショナル向けのビデオカードの最大の特徴は、VRAM(ビデオメモリ)の容量が多いことで、ゲーミング向けの最上位モデルとなる「NVIDIA GeForce RTX 4090」や「AMD Radeon RX 7900XTX」のVRAM容量がそれぞれ24GBであるのに対し、プロフェッショナル向けの最上位モデルとなる「NVIDIA RTX 6000 ada」や「AMD Radeon PRO W7900」は48GBとなっています。大量のデータ処理が求められるGPGPUの世界においては大容量のVRAMが利用できるメリットは非常に大きくなります。

なお、ワークステーションの分野ではプロフェッショナル向けビデオカードが多く利用されますが、プロフェッショナル向けというだけあって、「NVIDIA RTX」シリーズや「AMD Radeon PRO」シリーズのビデオカードは非常に高価です。そのため、プロフェッショナル向けもゲーミング向けもGPUの構造自体は基本的に同じということもあり、ゲーミング向けのビデオカードがGPGPUとして活用することでコストパフォーマンスを高めることも可能です。

※NVIDIA製はCUDAコア、AMD製はストリーミング プロセッサの数

2-3.消費電力を抑えられる

かつてGPGPUは消費電力を抑えられると言われていましたが、ビデオカードの消費電力が増大し、その一方でCPUの消費電力が抑えられつつある昨今では、なかなかGPGPUは省エネであるとは言いにくいのですが、GPGPUの圧倒的に高速な処理能力を考慮すれば、処理時間あたりの消費電力はかなり抑えることができます。

特にビッグデータの解析や科学計算などは、長時間の運用が基本となりますので、同じ時間で大量のデータを処理できるGPGPUのほうが、結果として消費電力を抑えることができるわけです。

ただし、消費される電力自体は多く、発熱も大きくなりますので、冷却面については十分な注意が必要となります。

3.GPGPUの活用例を紹介

3-1.生成AIや機械学習への活用

Midjourney、Stable Diffusion、DALL-E 2といった高品質な画像を生成するAIサービスの多くは、GPGPUを活用して大量の画像データを高速に処理しています。また、ChatGPT、Bard、Bing AIなどの大規模言語モデルも、GPGPUによって膨大なテキストデータを学習し、人間のような自然な文章を生成します。

実際、ChatGPTのシステムには、「NVIDIA H100 Tensor Core GPU」と呼ばれるGPUが採用されています。この「NVIDIA H100 Tensor Core GPU」は、まさにAI特化型のGPUで、GPGPUとしての利用のみが想定されているため、映像出力端子が備わっていないなど、非常に割り切った設計となっています。また、「NVIDIA GeForce RTX 40」シリーズでは非対応となった「NVLink」をサポート。この「NVLink」は、GPU間の通信を高速かつ効率的に行うためのインターコネクト技術で、「NVLink」によって最大256基の「NVIDIA H100 Tensor Core GPU」を接続することが可能となっています。

生成AIはもちろん、画像認識サービスや自然言語処理、音声認識といった機械学習の分野でもGPGPUは広く活用されており、今後さらなる発展が期待されるAI処理において、GPGPUの重要性はさらに高くなっていくと思われます。

3-2.科学技術計算

科学技術計算には従来スーパーコンピューターが利用されてきましたが、最近ではGPGPUの並列処理能力の高さに注目が集まっています。膨大なデータの解析やシミュレーションを高速かつ低コストで実行できるため、多くの研究者や企業がGPGPUを利用するようになりました。

天気予報や地震予測、流体シミュレーションなど幅広いジャンルでGPGPUは活用され、従来より短時間で、より精度の高い結果を得ることが可能となっています。

例えば、ゲームエンジンとして有名な「Unity」とプロフェッショナル向けの「NVIDIA RTX A2000」の組み合わせは、ゲーム開発だけでなく、「マルチエージェントシミュレーション(MAS)」の用途でも活用されています。「マルチエージェントシミュレーション」は、複数のエージェントを用いた仮想実験を意味しており、人流や渋滞予測などのシミュレーションに利用されます。

「NVIDIA RTX A2000」は、「NVIDIA GeForce RTX 30」シリーズと同じ、「Ampere アーキテクチャ」を採用したプロフェッショナル向けのビデオカード。コンパクトなロープロファイルモデルということもあって、CUDAコア数は3.328個、VRAMは6GB/12GBとやや控えめなスペックとなっていますが、最大消費電力が70Wと抑えられている点が、長時間での使用が必須となる科学技術計算やシミュレーションにおいては大きなメリットとなっています。また、VRAMがECC対応となっている点も、高い精度と信頼性が重視されるヘルスケアサービスや金融サービスの分野でも注目を集めました。

4.GPGPUのためのパソコン選び

4-1.GPUの性能をチェックする

GPGPUを利用する場合、まずはGPUの性能をチェックする必要があります。まず第一に注目したいのがコア数です。NVIDIA製GPUであればCUDAコア、AMD製GPUであればストリーミングプロセッサー(シェーダープロセッサー)の数が多ければ多いほど、並列処理能力が高まります。ちなみに「NVIDIA GeForce RTX 4060」のCUDAコア数は3,072個ですが、ハイエンドの「NVIDIA GeForce RTX 4090」のコア数は16,384個と、その差は約5.3倍になっています。

また、GPUは処理を行う際に必要なデータを一時的に保存するVRAM(ビデオメモリ)も容量が大きいほどデータ処理が快適になりますし、GPUとメモリ間の帯域幅も広いほどデータ転送速度が上がり、処理性能も向上します。また、GPUの動作速度を示すクロック周波数も高いほうが有利となります。

※NVIDIA製GPUはCUDAコア、AMD製GPUはストリーミングプロセッサー

そして、GPGPUを活用したワークステーションとしての活用を目指す場合、可能であれば、やはりプロフェッショナル向けのビデオカードを組み合わせたいところ。コア数については、プロフェッショナル向けだから多いということは言えないのですが、VRAMに関しては、大容量モデルが多い点もプロフェッショナル向けの魅力となっています。

ただし、プロフェッショナル向けのビデオカードは非常に高価で、例えば「NVIDIA GeForce RTX 4090」がおよそ30~40万円とすると、「NVIDIA RTX 6000 ada」はおよそ120万円となっており、3~4倍程度の価格差があります。このあたりは予算なども踏まえて、しっかり吟味することが必要となります。

4-2.NVIDIAとAMDどちらがおすすめ?

ビデオカードを選ぶ際、NVIDIAのGeForceとAMDのRadeonのどちらを選ぶかで迷う方も多いのではないでしょうか。ラインナップの広さや最新技術の導入などの観点ではGeForce、発色の良さやコストパフォーマンスの高さではRadeonとそれぞれにメリットを吟味しつつ、選択することになりますが、GPGPUとして利用する場合は、GeForceが現時点では優勢と言えます。

その理由は、CUDAがNVIDIA製GPUでしか利用できない点が挙げられます。先述した通り、CUDAはGPGPUの普及に一役買っており、並列コンピューティングプラットフォームとしては一日の長があります。一方、OpenCLは、NVIDIA製GPUでもAMD製GPUでも利用可能なので、どちらを選んでも問題がないため、今後OpenCLの利用が増えれば、GPGPUとしてRadeonを選ぶ方も増えてくるかもしれません。

なお、プロフェッショナル向けのラインナップについては、NVIDIAには「NVIDIA RTX」シリーズのほかに、先にも少し触れましたが、「NVIDIA H100」や「NVIDIA H200」といった、かつて「Tesla」と呼ばれたラインナップ、AMDには「AMD Radeon PRO」シリーズのほかに「AMD Radeon Instinct」といった、GPGPU専用の製品も用意されています。

これらの製品はGPGPUとしての利用に特化したもので、一部の製品を除いてはグラフィック出力機能が用意されていません。GPGPUの利用を検討している方は、これらの存在にも注目しておきましょう。

4-3.GPU以外の要素も検討

ここまでビデオカード(GPU)を中心に、GPGPUについて紹介してきましたが、いずれの処理を行うにせよ、GPU以外のパーツの性能も無視できないポイントです。いくら高性能のビデオカードを利用しても、パソコンそのものの性能が低ければ、GPUのパワーを活かし切ることができないのです。

これはGPGPUに限らず、ゲーミングPCでも同じことですが、できるだけボトルネックになる部分をなくすのが基本。高性能なビデオカードを利用する場合は、CPUもそれにあわせて高性能なものを組み合わせたほうが良いですし、メインメモリやストレージも高速かつ大容量のものを使用したほうが快適が作業環境を構築することができます。

また、ハイエンドのCPUやビデオカードを利用する場合は、電源ユニットも大容量なものを選ぶたいところですし、発熱による処理能力の低下を抑えるためには、冷却性能やPCケース内のエアフローにも気を使う必要があります。

5.GPGPUを活かせるBTOパソコンを紹介

5-1.Lepton WS3600X870-A

「Lepton WS3600X870-A」は、ZEN5コアの「AMD Ryzen 7 9700X」と「AMD X870 チップセット」搭載マザーボードを組み合わせた、AMDプラットフォームの入門用から本格的な業務ユースまで幅広く活用できるクリエイター向けワークステーションとなっています。

CPUの冷却に水冷ユニットを採用。長時間稼働でも安定したパフォーマンスが期待できます。メモリはDDR5-5600を16GB(8GB×2)、ビデオカードは標準構成でプロフェッショナル向けの「NVIDIA RTX A400」を採用。3DCGやCADといったクリエイティブな用途はもちろん、GPGPUとして生成AIや科学技術計算などのシーンにも活用できます。

【Lepton WS3600X870-A】標準構成
CPU:AMD Ryzen 7 9700X【3.8GHz、8コア/16スレッド】
メモリ:DDR5-5600 16GB(8GB×2)
チップセット:AMD X870 チップセット
SSD:500GB(SATA/2.5インチSSD)
ビデオカード:NVIDIA RTX A400(4GB)

5-2.Lepton WS4000TRX50A

「Lepton WS4000TRX50A」は、32コア/64スレッドのハイパワーが魅力となる「AMD Ryzen Threadripper 7970X」と「AMD TRX50 チップセット」搭載マザーボードを組み合わせた至極のワークステーションです。

メモリはDDR5-4800を64GB(16GB×4)を搭載し、「NVIDIA GeForce RTX 4060」搭載ビデオカードを採用。反復処理、レンダリング、コンパイルなど、様々な処理を快適かつスムーズにクリアする高いパフォーマンスが魅力の1台に仕上がっています。そしてさらに、カスタマイズによって、「NVIDIA RTX A400」や「NVIDIA RTX A1000」などのプロフェッショナル向けビデオカードを選択することも可能。GPGPUとしての活用を目指す方はこちらも要注目です。

【Lepton WS4000TRX50A】標準構成
CPU:AMD Ryzen Threadripper 7970X【4.0GHz、32コア/64スレッド】
メモリ:DDR5-4800 64GB(16GB×4)
チップセット:AMD TRX50 チップセット
SSD:1TB(NVMe/M.2 SSD)
ビデオカード:NVIDIA GeForce RTX 4060(8GB)

5-3.Lepton WS3900W790

「Lepton WS3900W790」は、24コア/48スレッドの「Intel Xeon w7-2495X」と「Intel W790 チップセット」搭載マザーボードを組み合わせた、Intelプラットフォームの最高峰に位置付けられるワークステーションです。

メモリはDDR5-4800を64GB(16GB×4)を搭載し、「NVIDIA GeForce RTX 4070 SUPER」搭載ビデオカードを採用するなど性能面の高さも期待大。安定かつハイパフォーマンスのワークステーションとして注目の1台ですが、カスタマイズによって、「NVIDIA RTX A400」から最高峰の「NVIDIA RTX 6000 Ada」まで、5種類のプロフェッショナル向けビデオカードも選択することも可能です。

【Lepton WS3900W790】標準構成
CPU:Intel Xeon w7-2495X【2.5GHz、24コア/48スレッド】
メモリ:DDR5-4800 64GB(16GB×4)
チップセット:Intel W790 チップセット
SSD:1TB(NVMe/M.2 SSD)
ビデオカード:NVIDIA GeForce RTX 4070 SUPER(12GB)

6.まとめ

「GPGPU」は、GPUの持つ並列処理能力を活かして、膨大なデータを高速に処理する技術。ビッグデータの解析やAI処理の普及により、その重要性が非常に高まってきています。

科学技術計算などと聞くと一般ユーザーには無関係と思えるかもしれませんが、画像・映像処理やゲーミングの分野でもGPGPUは活用されるなど、現在では非常に身近な存在になりつつあります。そして、それに伴って、クリエイティブやデータ解析の分野では、CPU以上にGPUを重視する傾向が見られるようになってきました。

今回は、GPGPUの基礎知識から、具体的な注目ポイントや活用例などを紹介してきました。ビデオカードを選ぶ際は、グラフィック処理性能はもちろんですが、GPGPUとしての活用も考慮して、自分に最適なものを選ぶようにしましょう。

BTOパソコン売れ筋ランキング

(12月1日~12月31日)

  • 1位
    1位G-Master Spear X870A
    Zen5アーキテクチャ採用のAMD Ryzen 9000シリーズを搭載するミドルタワー型ゲーミングPC。高性能と高拡張性を実現したゲーマー向けハイエンドモデルです。
  • 2位
    2位Silent-Master NEO B650A
    こだわりのNoctua製空冷CPUクーラーを採用し、エアーフローと静音性のバランスを極めた静音PC。AMD Ryzenプロセッサを搭載するATXミドルタワー型モデル。
  • 3位
    3位G-Master Hydro X870A Extreme
    Zen5アーキテクチャ採用のAMD Ryzen 9000シリーズを360mm大型ラジエーター搭載水冷ユニットで強力に冷却。更にサイコム独自に水冷化したNVIDIA製高性能GPUを組み合わせたデュアル水冷PC!
  • 4位G-Master Spear Z890
    AI時代の新CPU、Intel Core Ultraプロセッサを搭載するミドルタワー型ゲーミングPC。高性能と高拡張性を実現したゲーマー向けハイエンドモデルです。
  • 5位G-Master Velox II Intel Edition
    高品質なパーツを採用した納得の標準構成と厳選されたオプションパーツでシンプルなカスタマイズが楽しめる新機軸のゲーミングPC!
    定番のインテル® Core™ プロセッサ搭載モデルです。
  • 6位Radiant GZ3600X870A
    Zen5アーキテクチャ採用のAMD Ryzen 9000シリーズ搭載ATXミドルタワー型モデル。BTOならではのカスタマイズの幅が広いスタンダードなモデルです。
  • 7位Radiant GZ3600Z890
    最新のIntel Core Ultraプロセッサを搭載するATXミドルタワー型モデル。BTOならではのカスタマイズの幅が広いスタンダードなモデルです。
  • 8位Premium Line X870FD-A
    いいものを、永く。標準2年保証、無償オーバーホールなど末永くご愛用いただくためのアフターサービスも充実したサイコムが提案する新たなPCのカタチ。その名は、Premium Line
  • 9位Radiant GZ3500Z790/D5
    インテル® Core™ プロセッサとDDR5メモリを搭載するATXミドルタワー型モデル。BTOならではのカスタマイズの幅が広いスタンダードなモデルです。
  • 10位G-Master Spear Mini B650A
    容量26.3リットルのコンパクト筐体ながらAMD Ryzen 9000シリーズと高性能GPUを搭載し幅広いカスタマイズ性を両立したゲーミングPC。