※本ページはプロモーションが含まれています。
※2024年2月4日時点の情報を掲載しています。
実際にAIの勉強を進めていくと、自分でAI学習をしたくなっていきます!
しかし、いざAI学習をしようとするとハードウェアの壁にぶつかります。簡単なサンプルプログラムであればCPUでもなんとか学習できますが、本当に学習したい画像はもっと大きなプログラムで、CPUで学習させるのは非常に厳しくなります。
この問題を解決するのが、GPUです!
GPUはグラフィックス描画に特化したハードウェアで、描画には行列計算が不可欠です。つまりGPUは行列計算が得意なハードウェアになります。 一方で、ディープラーニングも行列計算を行います。このGPUの行列計算能力をディープラーニングの計算に使います。AI学習ではGPUを使用することで膨大なデータも効率的に学習することができます。GPUを使用すれば、夜寝ている間にAIを行い朝には結果を確認できる、なんてことが可能です。
GPU専用の演算領域で計算されます!
GPUは主に次の2つのコアの性能で、AI学習の性能が決まります。
- CUDAコア:グラフィックスの描画処理に特化したコアで、多次元行列の計算を行います。ディープラーニングの計算にも多次元行列を行うため、コアを転用して学習を行います。
- Tensorコア:NVIDIAが開発したAI専用のコアで、多次元行列の計算に特化しています。
スペック表を見る中では、上記のコア数を参考にして下さい。 別途、最近のGPUには以下のコアも搭載されています。
- RTコア:レイトレーシング専用のコアで、3Dゲームのレンダリング性能に大きく寄与します。
GeForceとNVIDIA RTXの違いは一般向けかプロ向けかです!
- GeForce:一般コンシューマ向けで比較的安価です。瞬発力がありオーバークロックで性能アップもされたりします。また、3Dゲームなどにも向いています。
- NVIDIA RTX:プロ向けで比較的高価です。瞬発力はないですがGPUメモリも多く大規模なAI学習も可能です。終夜運転などの安定稼動にも向いています。
これからAI学習を実践したい方のために、オススメのGPUを紹介します!
ただ、GPUは非常に高価なものも多いのでハイパフォーマンス(10万円〜)とミドルパフォーマンス(〜10万円)に分けて紹介させていただきます。各々の用途と予算に合わせて参考にして下さい。
まずは、コストパフォーマンスに優れるGeForce RTX 4060 Ti(16Gモデル)がオススメです!
コストパフォーマンスが非常に優れており、コンシューマ製品で安価な上にメモリも16Gと、AI学習するには十分です。 上位モデルにはまだ早いかなと感じていても、これならばという方もいるかもしれません。 中途半端に試すよりはこのぐらいのGPUからスタートするのが良いと思います。
更に性能を求めるならば、GeForce RTX 4080 SUPERがオススメです!
GeForce RTX 40シリーズの中でも、SUPERは最新のモデルになります。SUPERは生成AI向けのコアが搭載されおり、画像生成AIを試したい方などにもオススメです。 特に4080 SUPERは4090と比べれば多少見劣りしますが、値段以上に十分な性能を発揮します。
プロ向けで安定性を求める方には、NVIDIA RTX A4000もオススメです!
RTX A4000はコストパフォーマンスに優れています。安定稼動のプロ向け製品でGPUメモリも16Gと十分な上に、値段も意外と安価です。 A4000は最新アーキテクチャのA4000 Adaも販売されています。
AI学習に適しているGPU
特に注視する項目は、CUDA/Tensorコア数、アーキテクチャ、GPUメモリです!
- CUDA/Tensorコア数:多ければ多いほど、AIの計算が速くなります。
- アーキテクチャ:新しいほど性能が上がります。現在の主流はAda Lovelaceアーキテクチャですが、一世代前のAmpareアーキテクチャもまだまだ現役です。
- GPUメモリ:多ければ多いほど、大規模なAI学習が可能になります。
※記事の最後に、一覧表を掲載しています
手に入るのは現行品のみになります!
旧モデルが売っていたとしても、在庫も少ないため倍以上で売られていたりします。 現行のGPUアーキテクチャはAda LovelaceとAmpareになります。
電源と寸法にも注意してください!
GPUを買ったはいいが組み込めないなどの事態を防止するために、PCの電源と寸法を確認する必要があります。
- 電源:容量が十分に足りているか、コネクタがあるか確認してください。
- 寸法:筐体に十分入るサイズか、スロットは空きがあるかを確認してください。各メーカーで微妙にサイズが異なるので注意してください。
ハイパフォーマンス(10万円〜)
まずは、ハイパフォーマンスなオススメGPUを紹介します!
GUDA/Tensorコア数、アーキテクチャ、GPUメモリの観点から高パフォーマンスを発揮できる製品を選定しました。予算に余裕がある方には特にオススメしたいラインナップになります。
GeForce RTX 4090
RTX 40シリーズのフラグシップです。最新GPUで最大パフォーマンスを発揮したい方にオススメです。GeForceはオーバークロックしているものも多く、瞬発力は申し分ありません。プロ向けと比べると耐久性は劣りますが、頻繁に故障するようなこともありません。 最新を目指したい方にもオススメです。
※なお、40シリーズで比較したい方はこちらの記事もご参考下さい。
GeForce RTX 4080 SUPER
RTX 40シリーズの最新モデルです。Tensorコアも最新で、生成AIに特化したものが搭載されています。画像生成AIで色々試すのに十分なパフォーマンスで、値段もハイパフォーマンスGPUの中ではお手頃です。メモリも16G搭載されており、AI学習にオススメです!
4090と比べれば多少見劣りはしますが、コストパフォーマンスに優れたGPUになります。
GeForce RTX 4070Ti SUPER
RTX 40シリーズの最新モデルです。こちらも生成AIに特化したコアが搭載されています。メモリも16G搭載されており、AI学習には十分です。値段も比較的お手頃で、コストパフォーマンスに優れています。
4080よりも多少は安価なので、予算に合わせて選択できるGPUになります。
NVIDIA RTX A4000
コストパフォーマンスに優れており、消費電力も140Wで補助電源も6ピン1本のみで済みます。 私も現在メインで使用しており、今まで故障もなく快適で、非常にオススメです。
アーキテクチャがAmpareのモデルは在庫ということもあり、値段もだ安価で比較的手の届き易い製品です。最新はAda LovelaceのRTX A4000 Adaになり、こちらもオススメです。
NVIDIA RTX A6000
NVIDIA RTXシリーズの中で最上位モデルです。こちらを使用している上では不満など一切無いと思います。AIに本腰を入れたい方、これさえ購入すれば何も怖くありません。 予算的に余裕がある方、複数のAI学習を同時にしたい方などにもオススメです。最新はAda LovelaceのRTX A6000 Adaになります。
ミドルパフォーマンス(〜10万円)
次に、ミドルパフォーマンスなオススメGPUを紹介します!
ハイパフォーマンスGPUと比べ、CUDA/Tensorコア数が少なくなっていますが、GPUメモリなども考慮して選定しました。予算が限られている方にも満足いただければ幸いです。
GeForce RTX 4060Ti
RTX 40シリーズの中では、比較的手が届き易いモデルです。GPUメモリが8Gと16Gのモデルがありますが、16Gモデルをオススメします。メモリが多い分大規模なAIモデルの学習も可能で、他のGPUと比べてもコストパフォーマンスが非常に優れています。メモリだけ見ればRTX A4000と同等なので、この価格帯では最もお得だと思います。ただし、Tensorコア数は少ないため、ハイパフォーマンスモデルと比べると速度は遅くなります。
GeForce RTX 4070 SUPER
RTX 40シリーズの最新モデルです。こちらも生成AIに特化したコアが搭載されています。メモリも12Gである程度大きなAIモデルの学習も可能です。SUPERは計算速度が速いのも魅力です。価格も10万円程度で少々頑張れば購入可能な価格です。最新のGPUに触れたい方は、この辺りから始めるのもオススメです!
GeForce RTX 4070
RTX 40シリーズの中では、比較的手が届き易いモデルです。GPUメモリが12Gと、4060Tiよりは少ないですが、CUDA/Tensorコアの数は上です。個人的には、RTX4070Tiを買うよりは少しアップしてSUPERにするか、予算によって4070にすると思います。安価で程よい性能なので、こちらも選択肢としてはありだと思います。
GeForce RTX 4060
RTX40シリーズの中では一番手が届き易いモデルです。RTX 4060Tiと比べれば性能は物足りない一面もありますが、最新モデルの中では何と言っても価格が魅力的です。まずはお試しで学習をしてみたい方に特にオススメです。
NVIDIA RTX A2000
こちらはプロ向けのGPUになります。このようなプロ向けを選ぶ理由は安定稼動にあります。AI学習は24時間以上動かすこともありますし、何度もトライ&エラーを繰り返します。そういった意味でも、はじめからプロ向けのシリーズを購入することを視野に入れても良いと思います。 そしてGPUメモリは12Gになります(6Gモデルは生産終了に進んでいます)。12Gあれば、ある程度大きなAIモデルの学習も可能です。プロ志向の方にオススメです!
まとめ
今回は、オススメのGPUについて紹介させていただきました!
それぞれ値段に応じて性能は変わりますが、ハイパフォーマンスはもちろん、ミドルパフォーマンスでも一昔前と比べると十分すぎる性能です。 まずはともかく始めてみたい方には、予算都合やゲームなどの用途に合わせて使用可能なGeForceシリーズをオススメしますが、AIに本腰を入れたい方にはNVIDIA RTXシリーズもお勧めします。 ミドルパフォーマンスでもなかなか気軽に買える値段ではないですが、1台あれば捗るのは間違いないです。 これを機に、AIエンジニアの投資として購入を考えてみてはいかがでしょうか。
見た目にも拘りたい方には、ホワイトモデルもオススメです!
GPUも見た目から綺麗な製品が多いです。LEDで光る製品もありますが、私はホワイトモデルをお勧めします。
ASUS ROG Strix GeForce RTX™ 4090 ホワイト OC Edition ゲーミンググラフィックカード (PCIe 4.0 24GB GDDR6X HDMI 2.1a DisplayPort 1.4a)
ASUS GeForce RTX 4080 搭載ビデオカード 16GB OC GDDR6X / ROG-STRIX-RTX4080-O16G-WHITE 日本正規流通品
ASUS Dual GeForce RTX™ 4070 White OCエディション 12GB GDDR6X (PCIe 4.0、12GB GDDR6X、DLSS 3、HDMI 2.1、DisplayPort 1.4a、2.56スロットデザイン、Axial-techファンデザイン、0dBテクノロジーなど)
ASUS DUAL-RTX4060TI-O8G-WHITE
GPU一覧表
ご自身に合うスペックをご確認ください!
現行のGPUからAI学習に向いているものを抜粋し、一覧表を作成しました。
※2024年1月発売のRTX 40 SUPERシリーズを追記しました。
NVIDIA RTX 6000 Ada | NVIDIA RTX 5000 Ada | NVIDIA RTX 4500 Ada | NVIDIA RTX 4000 Ada | NVIDIA RTX 4000 SFF Ada | |
CUDAコア数 | 18176 | 12800 | 7680 | 6144 | 6144 |
Tensorコア数 | 568 | 400 | 240 | 192 | 192 |
RTコア数 | 142 | 100 | 60 | 48 | 48 |
アーキテクチャ | Ada Lovelace | Ada Lovelace | Ada Lovelace | Ada Lovelace | Ada Lovelace |
GPUメモリ | 48G | 32G | 24GB | 20G | 20G |
メモリタイプ | GDDR6 | GDDR6 | GDDR6 | GDDR6 | GDDR6 |
消費電力 | 300W | 250W | 210W | 130W | 70W |
システム要求電力 | 700W | 650W | 650W | 450W | 400W |
補助電源コネクタ | PCIe CEM5 16pin x 1 (2 x 8pin to 16pin) | PCIe CEM5 16pin x 1 (2 x 8pin to 16pin) | PCIe CEM5 16pin x 1 (2 x 8pin to 16pin) | PCIe CEM5 16pin x 1 (1 x 8pin to 16pin) | 不要 |
寸法[長さx幅] | 267 x 112 mm | 267 x 112 mm | 267 x 112 mm | 242 x 112 mm | 170 x 69 mm |
使用スロット数 | 2スロット | 2スロット | 2スロット | 1スロット | 2スロット |
NVIDIA RTX A800 40GB Active | NVIDIA RTX A6000 | NVIDIA RTX A5500 | NVIDIA RTX A5000 | |
CUDAコア数 | 6912 | 10752 | 10240 | 8192 |
Tensorコア数 | 432 | 336 | 320 | 256 |
RTコア数 | N/A | 84 | 80 | 64 |
アーキテクチャ | Ampare | Ampere | Ampare | Ampere |
GPUメモリ | 40G | 48G | 24G | 24G |
メモリタイプ | HBM2 | GDDR6 | GDDR6 | GDDR6 |
消費電力 | 240W | 300W | 230W | 230W |
システム要求電力 | 650W | 700W | 650W | 650W |
補助電源コネクタ | PCIe CEM5 16pin x 1 (2 x 8pin to 16pin) | 8pin x 1 | 8pin x 1 | 8pin x 1 |
寸法[長さx幅] | 267 x 112 mm | 267 x 112 mm | 267 x 112 mm | 267 x 112 mm |
使用スロット数 | 2スロット | 2スロット | 2スロット | 2スロット |
NVIDIA RTX A4500 | NVIDIA RTX A4000 | NVIDIA RTX A2000 | |
CUDAコア数 | 7168 | 6144 | 3328 |
Tensorコア数 | 224 | 192 | 104 |
RTコア数 | 56 | 48 | 26 |
アーキテクチャ | Ampere | Ampare | Ampere |
GPUメモリ | 20G | 16G | 12G / 6G |
メモリタイプ | GDDR6 | GDDR6 | GDDR6 |
消費電力 | 200W | 140W | 70W |
システム要求電力 | 600W | 450W | 400W |
補助電源コネクタ | 8pin x 1 | 6pin x 1 | 不要 |
寸法[長さx幅] | 267 x 112 mm | 242 x 112 mm | 170 x 69 mm |
使用スロット数 | 2スロット | 1スロット | 2スロット |
NEW GeForce RTX 4080 SUPER | NEW GeForce RTX 4070Ti SUPER | NEW GeForce RTX 4070 SUPER | |
CUDAコア数 | 10240 | 8448 | 7168 |
Tensorコア数 | 320 | 264 | 224 |
RTコア数 | 80 | 66 | 56 |
アーキテクチャ | Ada Lovelace | Ada Lovelace | Ada Lovelace |
GPUメモリ | 16G | 16G | 12G |
メモリタイプ | GDDR6X | GDDR6X | GDDR6X |
消費電力 | 320W | 285W | 220W |
システム要求電力 | 750W | 700W | 650W |
補助電源コネクタ | 12VHPWR x 1 or 8pin x 3 | 12VHPWR x 1 or 8pin x 2 | 12VHPWR x 1 or 8pin x 2 |
寸法[長さx幅] | 304 x 137 mm | Varies by manufacturer | 244 x 112 mm |
使用スロット数 | 3スロット | Varies by manufacturer | 2スロット |
GeForce RTX 4090 | GeForce RTX 4080 | GeForce RTX 4070Ti | GeForce RTX 4070 | |
CUDAコア数 | 16384 | 9728 | 7680 | 5888 |
Tensorコア数 | 512 | 304 | 240 | 184 |
RTコア数 | 128 | 76 | 60 | 46 |
アーキテクチャ | Ada Lovelace | Ada Lovelace | Ada Lovelace | Ada Lovelace |
GPUメモリ | 24G | 16G | 12G | 12G |
メモリタイプ | GDDR6X | GDDR6X | GDDR6X | GDDR6X |
消費電力 | 450W | 320W | 285W | 200W |
システム要求電力 | 850W | 750W | 700W | 650W |
補助電源コネクタ | 12VHPWR x 1 or 8pin x 3 | 12VHPWR x 1 or 8pin x 3 | 12VHPWR x 1 or 8pin x 2 | 12VHPWR x 1 or 8pin x 2 |
寸法[長さx幅] | 304 x 137 mm | 304 x 137 mm | Varies by manufacturer | 244 x 112 mm |
使用スロット数 | 3スロット | 3スロット | Varies by manufacturer | 2スロット |
GeForce RTX 4060Ti | GeForce RTX 4060 | |
CUDAコア数 | 4352 | 3072 |
Tensorコア数 | 136 | 34 |
RTコア数 | 96 | 24 |
アーキテクチャ | Ada Lovelace | Ada Lovelace |
GPUメモリ | 16G / 8G | 8G |
メモリタイプ | GDDR6 | GDDR6 |
消費電力 | 165W / 160W | 115W |
システム要求電力 | 550W | 550W |
補助電源コネクタ | 12VHPWR x 1 or 8pin x 1 | 12VHPWR x 1 or 8pin x 1 |
寸法[長さx幅] | 244 x 98 mm | Varies by manufacturer |
使用スロット数 | 2スロット | Varies by manufacturer |
GeForce RTX 3090Ti | GeForce RTX 3090 | GeForce RTX 3080Ti | GeForce RTX 3080 | |
CUDAコア数 | 10752 | 10496 | 10240 | 8704 |
Tensorコア数 | 336 | 285 | 320 | 238 |
RTコア数 | 84 | 69 | 80 | 58 |
アーキテクチャ | Ampere | Ampere | Ampere | Ampere |
GPUメモリ | 24G | 24G | 12G | 10G |
メモリタイプ | GDDR6X | GDDR6X | GDDR6X | GDDR6X |
消費電力 | 450W | 350W | 350W | 320W |
システム要求電力 | 850W | 750W | 750W | 750W |
補助電源コネクタ | 8pin x 2 | 8pin x 2 | 8pin x 2 | 8pin x 2 |
寸法[長さx幅] | 313 x 138 mm | 313 x 138 mm | 285 x 112 mm | 285 x 112 mm |
使用スロット数 | 3スロット | 3スロット | 2スロット | 2スロット |
GeForce RTX 3070Ti | GeForce RTX 3070 | GeForce RTX 3060Ti | GeForce RTX 3060 | GeForce RTX 3050 | |
CUDAコア数 | 6144 | 5888 | 4864 | 3584 | 2560 |
Tensorコア数 | 192 | 184 | 152 | 112 | 80 |
RTコア数 | 48 | 46 | 38 | 28 | 20 |
アーキテクチャ | Ampere | Ampere | Ampere | Ampere | Ampere |
GPUメモリ | 8G | 8G | 8G | 12G | 8G |
メモリタイプ | GDDR6X | GDDR6 | GDDR6 | GDDR6 | GDDR6 |
消費電力 | 290W | 220W | 200W | 170W | 130W |
システム要求電力 | 750W | 650W | 600W | 550W | 550W |
補助電源コネクタ | 8pin x 2 | 8pin x 1 | 8pin x 1 | 8pin x 1 | 8pin x 1 |
寸法[長さx幅] | 267 x 112 mm | 242 x 112 mm | 242 x 112 mm | 242 x 112 mm | 242 x 112 mm |
使用スロット数 | 2スロット | 2スロット | 2スロット | 2スロット | 2スロット |
※ システム要求電力は、ハードウェアの構成によっても異なるため参考値
※ 寸法は、メーカーによって異なるため参考値
※ NVIDIA RTX A2000は GPUメモリ12G / 6Gモデルがある
※ GeForce RTX 4060Tiは GPUメモリ16G / 8Gモデルがある
BTOパソコン
GPUを含めてPCを一式揃えるならBTOという選択肢もあります!
GPUを自分で換装するのが難しい方や、PCを一式で揃えたい方にはBTO(Build To Oder)パソコンがオススメです。 GeForce RTX 40シリーズのGPU搭載マシンも増えてきました。
現在、フロンティアさんでセール開催中です。
GeForce RTX4070Ti SUPER搭載マシンも特化です。ご興味のある方は、下のリンクからどうぞ。
私なら次の構成にします。この他はデフォルトの構成のままで、33,2100円は非常にお買い得です!
FRGHB760/WS123
OS | Windows 11 Pro 64 bit |
CPU | Core i9-14900F |
メモリ | 32GB |
SSD(1st) | 1TB |
SSD(2nd) | なし |
HDD | 4TB |
GPU | GeForce RTX 4070Ti SUPER |
電源 | 850W |
また、サイコムさんでは、GeForce RTX4080 SUPERを取り扱い中です。
BTOパソコンのサイコム私なら次の構成にします。421,200円で、なるべくGPU以外の費用を抑えるようにしています。
GZ3500Z790/D5
OS | Windows 11 Pro 64 bit |
CPU | Core i7-13700F |
メモリ | 32GB |
SSD(1st) | 1TB |
SSD(2nd) | なし |
HDD | 4TB |
GPU | GeForce RTX 4080 SUPER |
電源 | 860W |