google/gemma-4-12B-it-qat-w4a16-ct

🧠 AIモデルgoogle

効率的なマルチモーダル処理を実現する、量子化済み12BパラメータのGemma 4モデル。

google/gemma-4-12B-it-qat-w4a16-ctは、効率的なモデルデプロイにおける重要な進歩を示しています。重みを4ビット、活性化を16ビットに量子化するw4a16方式を採用し、メモリ効率と高精度な出力を両立しました。学習段階で量子化による精度低下を補正するQAT（量子化認識学習）を用いることで、事後量子化手法よりも優れた精度を実現しています。Gemma 4の統合アーキテクチャに基づき、画像・テキストを含むany-to-anyの複雑なタスクをサポート。Compressed Tensorsエコシステムと完全互換性があり、推論速度を重視する本番環境への導入が容易です。Apache 2.0ライセンスにより、研究から商用利用まで幅広く活用可能です。

💡ハイライト

├─12Bパラメータのマルチモーダルモデル
├─W4A16量子化認識学習（QAT）採用
└─Compressed Tensors形式をサポート

🎯対象

├─AI研究者
├─エッジコンピューティングエンジニア
└─マルチモーダルアプリ開発者

🔗リンク

└─Hugging Face モデルページ