nvidia/DeepSeek-R1-0528-NVFP4-v2
🧠 AIモデルnvidia
NVIDIAのNVFP4量子化版DeepSeek-R1モデル。Blackwell GPUで大規模推論を効率化。
DeepSeek-R1-0528-NVFP4-v2は、DeepSeek-R1推論モデルの最適化バリアントで、NVIDIAのModelOpt(Model Optimizer)ツールキットを介してNVFP4量子化フォーマットで圧縮されています。NVFP4は、NVIDIA Blackwellアーキテクチャ(B200)のネイティブFP4テンソルコアサポートを活用し、FP8やBF16バリアントと比較してメモリ消費の大幅な削減と推論スループットの向上を実現しながら、複雑な推論タスクにおけるモデル品質を維持します。このモデルはDeepSeek V3アーキテクチャ(Mixture-of-Experts(MoE)設計)をベースに構築され、safetensors形式で配布されています。FP4への量子化により、フルR1モデルをより厳密なVRAM予算内で実行でき、大規模推論をより身近にします。このv2リリースでは、初期のNVFP4リリースからキャリブレーションと量子化スキームが改良され、数学、コーディング、一般推論ベンチマークにおける品質劣化がさらに低減されています。
💡ハイライト
- ├─ModelOptによるNVFP4 4ビット量子化
- ├─NVIDIA Blackwell GPU向けに最適化
- ├─DeepSeek-R1の推論品質を維持
- └─Hugging Faceで100万DL突破
🎯対象
- ├─AI推論エンジニア
- ├─ML量子化研究者
- └─NVIDIA GPU開発者