google/gemma-4-12B-it-qat-w4a16-ct
🧠 AIモデルgoogle
効率的なマルチモーダル処理を実現する、量子化済み12BパラメータのGemma 4モデル。
google/gemma-4-12B-it-qat-w4a16-ctは、効率的なモデルデプロイにおける重要な進歩を示しています。重みを4ビット、活性化を16ビットに量子化するw4a16方式を採用し、メモリ効率と高精度な出力を両立しました。学習段階で量子化による精度低下を補正するQAT(量子化認識学習)を用いることで、事後量子化手法よりも優れた精度を実現しています。Gemma 4の統合アーキテクチャに基づき、画像・テキストを含むany-to-anyの複雑なタスクをサポート。Compressed Tensorsエコシステムと完全互換性があり、推論速度を重視する本番環境への導入が容易です。Apache 2.0ライセンスにより、研究から商用利用まで幅広く活用可能です。
💡ハイライト
- ├─12Bパラメータのマルチモーダルモデル
- ├─W4A16量子化認識学習(QAT)採用
- └─Compressed Tensors形式をサポート
🎯対象
- ├─AI研究者
- ├─エッジコンピューティングエンジニア
- └─マルチモーダルアプリ開発者