google/gemma-4-12B-it-qat-w4a16-ct

🧠 AI 模型google

一款高性能、量化版 12B 参数 Gemma 4 模型，专为高效的多模态任务优化。

google/gemma-4-12B-it-qat-w4a16-ct 代表了高效模型部署的重要进展。通过采用 w4a16 量化（权重 4-bit，激活值 16-bit），该模型在极高的内存效率与高保真输出之间取得了平衡。此版本采用了量化感知训练（QAT），使模型在训练阶段就能适应量化带来的精度损失，从而比训练后量化方法具有更高的准确性。基于 Gemma 4 统一架构，它支持包括图文到文本处理在内的复杂多模态任务。该模型完全兼容 Compressed Tensors 生态系统，可无缝集成到需要快速推理且不牺牲 12B 参数基座推理能力的生产环境中。其 Apache 2.0 许可证确保了研究和商业应用的广泛可访问性。

💡核心亮点

├─12B 参数多模态模型
├─W4A16 量化感知训练
└─支持 Compressed Tensors 格式

🎯适用人群

├─AI 研究人员
├─边缘计算工程师
└─多模态应用开发者

🔗链接

└─Hugging Face 模型页面