※本ページはプロモーションが含まれています。
※2024年2月4日時点の情報を掲載しています。
最新のGPUでAI学習をしたい方に!
AIエンジニアを目指し勉強をしていく中で、自分でAI学習を行なうには何と言ってもGPUが大事です。そして、GPUのプロセッサはNVIDIA社製の必要があります。
※推論には必須ではありませんが、学習をしたい方にはほぼ必須です。
GPU専用の演算領域で計算されます!
GPUは主に次の2つのコアの性能で、AI学習の性能が決まります。
- CUDAコア:グラフィックスの描画処理に特化したコアで、多次元行列の計算を行います。ディープラーニングの計算にも多次元行列を行うため、コアを転用して学習を行います。
- Tensorコア:NVIDIAが開発したAI専用のコアで、多次元行列の計算に特化しています。
スペック表を見る中では、上記のコア数を参考にして下さい。 別途、最近のGPUには以下のコアも搭載されています。
- RTコア:レイトレーシング専用のコアで、3Dゲームのレンダリング性能に大きく寄与します。
GeForceとNVIDIA RTXの違いは一般向けかプロ向けかです!
- GeForce:一般コンシューマ向けで比較的安価です。瞬発力がありオーバークロックで性能アップもされたりします。また、3Dゲームなどにも向いています。
- NVIDIA RTX:プロ向けで比較的高価です。瞬発力はないですがGPUメモリも多く大規模なAI学習も可能です。終夜運転などの安定稼動にも向いています。
毎年、新製品がリリースされます!
ロードマップを見ると、毎年のようにアーキテクチャやメモリなどがバージョンアップされ次々と製品が投入されています。
正直、購入時期をいつにするか悩みますが、現在の性能であれば最新モデルを購入しておけば十分満足できます。フラグシップを購入すれば数年いけます(私は暫くGeForce RTX 2080Tiを使用していました)。常に最新に切り替えたい方にはミドルレンジを購入するのもアリです。
今回は、一般向けで比較的手に入り易いGeForce、その中でも最新のRTX 40シリーズを紹介します。
※なお、GeForce以外のシリーズも含めて検討している方は、こちらの記事も参考にして下さい。
RTX 40シリーズの中で特にオススメなのが、GeForce RTX 4060Ti(16Gモデル)です!
コストパフォーマンスが非常に優れており、コンシューマ製品で安価な上にメモリも16Gと、AI学習するには十分です。 上位モデルにはまだ早いかなと感じていても、これならばという方もいるかもしれません。 中途半端に試すよりはこのぐらいのGPUからスタートするのが良いと思います。
更に性能を求めるならば、GeForce RTX 4080 SUPERがオススメです!
GeForce RTX 40シリーズの中でも、SUPERは最新のモデルになります。SUPERは生成AI向けのコアが搭載されおり、画像生成AIを試したい方などにもオススメです。 特に4080 SUPERは4090と比べれば多少見劣りしますが、値段以上に十分な性能を発揮します。
AI学習に適しているGPU
GPUを選定するにあたり、3DゲームやAI学習など用途によって選定基準は変わります。AI学習向けには、下記の項目に注目いただくのが良いと思います。
特に注視する項目は、CUDA/Tensorコア数、アーキテクチャ、GPUメモリです!
- CUDA/Tensorコア数:多ければ多いほど、AIの計算が速くなります。
- アーキテクチャ:新しいほど性能が上がります。現在の主流はAda Lovelaceアーキテクチャですが、一世代前のAmpareアーキテクチャもまだまだ現役です。
- GPUメモリ:多ければ多いほど、大規模なAI学習が可能になります。
※記事の最後に、一覧表を掲載しています
電源と寸法にも注意してください!
GPUを買ったはいいが組み込めないなどの事態を防止するために、PCの電源と寸法を確認する必要があります。
- 電源:容量が十分に足りているか、コネクタがあるか確認してください。
- 寸法:筐体に十分入るサイズか、スロットは空きがあるかを確認してください。各メーカーで微妙にサイズが異なるので注意してください。
CUDA、cuDNNのバージョンにも注意して下さい!
ディープラーニングのOSSによっては、対応しているCUDA、cuDNNのバージョンが古くRTX 40シリーズでは動かないこともあります。そのため対応バージョンを知ることも重要です。
- CUDA:NVIDIA社製のGPUにおいて、並列計算を行うための実行環境になります。ディープラーニングでは、膨大な多次元行列の計算を行います。その実行環境がCUDAになります。
- cuDNN:ディープラーニングで使用するためのライブラリになります。ディープラーニングでは、様々な計算手法が利用されており、そのライブラリがcuDNNになります。
CUDAは11.8、cuDNNは8.Xから対応しています。
RTX 40 シリーズ
ここからは、RTX 40シリーズのラインナップを紹介します!
GeForce RTX 4090
RTX 40シリーズのフラグシップです。最新GPUで最大パフォーマンスを発揮したい方にオススメです。GeForceはオーバークロックしているものも多く、瞬発力は申し分ありません。プロ向けと比べると耐久性は劣りますが、頻繁に故障するようなこともありません。 最新を目指したい方にもオススメです。
GeForce RTX 4080 SUPER
RTX 40シリーズの最新モデルです。Tensorコアも最新で、生成AIに特化したものが搭載されています。画像生成AIで色々試すのに十分なパフォーマンスで、値段もハイパフォーマンスGPUの中ではお手頃です。メモリも16G搭載されており、AI学習にオススメです!
4090と比べれば多少見劣りはしますが、コストパフォーマンスに優れたGPUになります。
GeForce RTX 4080
こちらも十分なパフォーマンスの製品です。メモリも16G搭載されており、大規模なAIモデルの学習も可能です。画像認識AIの学習ではまず困りません。予算の都合に合わせてこちらもオススメです。
GeForce RTX 4070Ti SUPER
RTX 40シリーズの最新モデルです。こちらも生成AIに特化したコアが搭載されています。メモリも16G搭載されており、AI学習には十分です。値段も比較的お手頃で、コストパフォーマンスに優れています。
4080よりも多少は安価なので、予算に合わせて選択できるGPUになります。
GeForce RTX 4070Ti
こちらも、一昔前と比べれば十分な性能です。メモリは12Gで、ある程度大きなAIモデルの学習も可能です。また、大規模なAIモデルは、学習時の入力サイズやバッチ数を調整すれば学習も可能です。推論も高速に実行することができます。
GeForce RTX 4070 SUPER
RTX 40シリーズの最新モデルです。こちらも生成AIに特化したコアが搭載されています。メモリも12Gである程度大きなAIモデルの学習も可能です。SUPERは計算速度が速いのも魅力です。価格も10万円程度で少々頑張れば購入可能な価格です。最新のGPUに触れたい方は、この辺りから始めるのもオススメです!
GeForce RTX 4070
RTX 40シリーズの中では、比較的手が届き易いモデルです。GPUメモリが12Gと、4060Tiよりは少ないですが、CUDA/Tensorコアの数は上です。個人的には、RTX4070Tiを買うよりは少しアップしてSUPERにするか、予算によって4070にすると思います。安価で程よい性能なので、こちらも選択肢としてはありだと思います。
GeForce RTX 4060Ti
RTX 40シリーズの中では、比較的手が届き易いモデルです。GPUメモリが8Gと16Gのモデルがありますが、16Gモデルをオススメします。メモリが多い分大規模なAIモデルの学習も可能で、他のGPUと比べてもコストパフォーマンスが非常に優れています。メモリだけ見ればRTX A4000と同等なので、この価格帯では最もお得だと思います。ただし、Tensorコア数は少ないため、ハイパフォーマンスモデルと比べると速度は遅くなります。
GeForce RTX 4060
RTX40シリーズの中では一番手が届き易いモデルです。RTX 4060Tiと比べれば性能は物足りない一面もありますが、最新モデルの中では何と言っても価格が魅力的です。まずはお試しで学習をしてみたい方に特にオススメです。
まとめ
最新のRTX 40シリーズは買いです!
それぞれ値段に応じて性能は変わりますが、ハイパフォーマンスはもちろん、ミドルパフォーマンスでも一昔前と比べると十分すぎる性能です。ミドルパフォーマンスでもなかなか気軽に買える値段ではないですが、1台あれば捗るのは間違いないです。 これを機に、AIエンジニアの投資として購入を考えてみてはいかがでしょうか。 また、AIに本腰を入れたい方には、プロ向けのNVIDIA RTXシリーズもオススメします。(こちらの記事も参考にして下さい。)
見た目にも拘りたい方には、ホワイトモデルもオススメです!
GPUも見た目から綺麗な製品が多いです。LEDで光る製品もありますが、私はホワイトモデルをお勧めします。
ASUS ROG Strix GeForce RTX™ 4090 ホワイト OC Edition ゲーミンググラフィックカード (PCIe 4.0 24GB GDDR6X HDMI 2.1a DisplayPort 1.4a)
ASUS GeForce RTX 4080 搭載ビデオカード 16GB OC GDDR6X / ROG-STRIX-RTX4080-O16G-WHITE 日本正規流通品
ASUS Dual GeForce RTX™ 4070 White OCエディション 12GB GDDR6X (PCIe 4.0、12GB GDDR6X、DLSS 3、HDMI 2.1、DisplayPort 1.4a、2.56スロットデザイン、Axial-techファンデザイン、0dBテクノロジーなど)
ASUS DUAL-RTX4060TI-O8G-WHITE
GPU一覧表
ご自身に合うスペックをご確認ください!
下記は、RTX 40シリーズの一覧になります。
※2024年1月発売のRTX 40 SUPERシリーズを追記しました。
NEW GeForce RTX 4080 SUPER | NEW GeForce RTX 4070Ti SUPER | NEW GeForce RTX 4070 SUPER | |
CUDAコア数 | 10240 | 8448 | 7168 |
Tensorコア数 | 320 | 264 | 224 |
RTコア数 | 80 | 66 | 56 |
アーキテクチャ | Ada Lovelace | Ada Lovelace | Ada Lovelace |
GPUメモリ | 16G | 16G | 12G |
メモリタイプ | GDDR6X | GDDR6X | GDDR6X |
消費電力 | 320W | 285W | 220W |
システム要求電力 | 750W | 700W | 650W |
補助電源コネクタ | 12VHPWR x 1 or 8pin x 3 | 12VHPWR x 1 or 8pin x 2 | 12VHPWR x 1 or 8pin x 2 |
寸法[長さx幅] | 304 x 137 mm | Varies by manufacturer | 244 x 112 mm |
使用スロット数 | 3スロット | Varies by manufacturer | 2スロット |
GeForce RTX 4090 | GeForce RTX 4080 | GeForce RTX 4070Ti | GeForce RTX 4070 | |
CUDAコア数 | 16384 | 9728 | 7680 | 5888 |
Tensorコア数 | 512 | 304 | 240 | 184 |
RTコア数 | 128 | 76 | 60 | 46 |
アーキテクチャ | Ada Lovelace | Ada Lovelace | Ada Lovelace | Ada Lovelace |
GPUメモリ | 24G | 16G | 12G | 12G |
メモリタイプ | GDDR6X | GDDR6X | GDDR6X | GDDR6X |
消費電力 | 450W | 320W | 285W | 200W |
システム要求電力 | 850W | 750W | 700W | 650W |
補助電源コネクタ | 12VHPWR x 1 or 8pin x 3 | 12VHPWR x 1 or 8pin x 3 | 12VHPWR x 1 or 8pin x 2 | 12VHPWR x 1 or 8pin x 2 |
寸法[長さx幅] | 304 x 137 mm | 304 x 137 mm | Varies by manufacturer | 244 x 112 mm |
使用スロット数 | 3スロット | 3スロット | Varies by manufacturer | 2スロット |
GeForce RTX 4060Ti | GeForce RTX 4060 | |
CUDAコア数 | 4352 | 3072 |
Tensorコア数 | 136 | 96 |
RTコア数 | 34 | 24 |
アーキテクチャ | Ada Lovelace | Ada Lovelace |
GPUメモリ | 16G / 8G | 8G |
メモリタイプ | GDDR6 | GDDR6 |
消費電力 | 165W / 160W | 115W |
システム要求電力 | 550W | 550W |
補助電源コネクタ | 12VHPWR x 1 or 8pin x 1 | 12VHPWR x 1 or 8pin x 1 |
寸法[長さx幅] | 244 x 98 mm | Varies by manufacturer |
使用スロット数 | 2スロット | Varies by manufacturer |
下記は、一世代前のRTX 30シリーズの一覧になります。40シリーズの進化が伺えます。
GeForce RTX 3090Ti | GeForce RTX 3090 | GeForce RTX 3080Ti | GeForce RTX 3080 | |
CUDAコア数 | 10752 | 10496 | 10240 | 8704 |
Tensorコア数 | 336 | 285 | 320 | 238 |
RTコア数 | 84 | 69 | 80 | 58 |
アーキテクチャ | Ampere | Ampere | Ampere | Ampere |
GPUメモリ | 24G | 24G | 12G | 10G |
メモリタイプ | GDDR6X | GDDR6X | GDDR6X | GDDR6X |
消費電力 | 450W | 350W | 350W | 320W |
システム要求電力 | 850W | 750W | 750W | 750W |
補助電源コネクタ | 8pin x 2 | 8pin x 2 | 8pin x 2 | 8pin x 2 |
寸法[長さx幅] | 313 x 138 mm | 313 x 138 mm | 285 x 112 mm | 285 x 112 mm |
使用スロット数 | 3スロット | 3スロット | 2スロット | 2スロット |
GeForce RTX 3070Ti | GeForce RTX 3070 | GeForce RTX 3060Ti | GeForce RTX 3060 | GeForce RTX 3050 | |
CUDAコア数 | 6144 | 5888 | 4864 | 3584 | 2560 |
Tensorコア数 | 192 | 184 | 152 | 112 | 80 |
RTコア数 | 48 | 46 | 38 | 28 | 20 |
アーキテクチャ | Ampere | Ampere | Ampere | Ampere | Ampere |
GPUメモリ | 8G | 8G | 8G | 12G | 8G |
メモリタイプ | GDDR6X | GDDR6 | GDDR6 | GDDR6 | GDDR6 |
消費電力 | 290W | 220W | 200W | 170W | 130W |
システム要求電力 | 750W | 650W | 600W | 550W | 550W |
補助電源コネクタ | 8pin x 2 | 8pin x 1 | 8pin x 1 | 8pin x 1 | 8pin x 1 |
寸法[長さx幅] | 267 x 112 mm | 242 x 112 mm | 242 x 112 mm | 242 x 112 mm | 242 x 112 mm |
使用スロット数 | 2スロット | 2スロット | 2スロット | 2スロット | 2スロット |
※ システム要求電力は、ハードウェアの構成によっても異なるため参考値
※ 寸法は、メーカーによって異なるため参考値
※ GeForce RTX 4060Tiは GPUメモリ16G / 8Gモデルがある
BTOパソコン
GPUを含めてPCを一式揃えるならBTOという選択肢もあります!
GPUを自分で換装するのが難しい方や、PCを一式で揃えたい方にはBTO(Build To Oder)パソコンがオススメです。 GeForce RTX 40シリーズのGPU搭載マシンも増えてきました。
現在、フロンティアさんでセール開催中です。
GeForce RTX4070Ti SUPER搭載マシンも特化です。ご興味のある方は、下のリンクからどうぞ。
私なら次の構成にします。この他はデフォルトの構成のままで、33,5900円は非常にお買い得です!
FRGHB760/WS123
OS | Windows 11 Pro 64 bit |
CPU | Core i9-14900F |
メモリ | 32GB |
SSD(1st) | 1TB |
SSD(2nd) | なし |
HDD | 4TB |
GPU | GeForce RTX 4070Ti SUPER |
電源 | 850W |
また、サイコムさんでは、GeForce RTX4080 SUPERを取り扱い中です。
BTOパソコンのサイコム私なら次の構成にします。421,200円で、なるべくGPU以外の費用を抑えるようにしています。
GZ3500Z790/D5
OS | Windows 11 Pro 64 bit |
CPU | Core i7-13700F |
メモリ | 32GB |
SSD(1st) | 1TB |
SSD(2nd) | なし |
HDD | 4TB |
GPU | GeForce RTX 4080 SUPER |
電源 | 860W |