RedHatAI/gemma-4-26B-A4B-it-NVFP4

🧠 AIモデルRedHatAI

NVFP4圧縮を採用し、効率的な推論を実現した高性能な26BパラメータのGemma-4モデル。

RedHatAI/gemma-4-26B-A4B-it-NVFP4は、Gemma-4 26Bアーキテクチャの効率的なデプロイに焦点を当てたモデル最適化の大きな進歩です。NVFP4量子化を採用することで、パラメータ密度と計算効率の理想的なバランスを実現しました。本モデルはsafetensors形式で提供され、本番環境での安全かつ高速なロードを保証します。特にvLLM向けに最適化されており、NVIDIAハードウェア上で高スループットな推論が可能です。このリリースは、メモリ帯域やVRAM容量がボトルネックとなりやすいエンタープライズおよびエッジアプリケーションにおいて、最先端のオープンソースモデルをより利用しやすくするための取り組みの一環です。圧縮による性能劣化を最小限に抑えつつ、元のGemma-4-26B-itの指示追従能力を保持しています。

💡ハイライト

├─26BパラメータのGemma-4アーキテクチャ
├─NVFP4圧縮による高度な最適化
└─vLLMおよびsafetensorsのネイティブ対応

🎯対象

├─AIインフラエンジニア
└─機械学習研究者

🔗リンク

└─HuggingFaceモデルページ