google/gemma-4-12B-it-qat-w4a16-ct

🧠 AI Modelgoogle

Высокопроизводительная квантованная мультимодальная модель Gemma 4 (12B), оптимизированная для эффективных задач any-to-any.

Модель google/gemma-4-12B-it-qat-w4a16-ct — это важный шаг в области эффективного развертывания ИИ. Благодаря квантованию w4a16 (веса 4-битные, активации 16-битные) модель достигает баланса между низким потреблением памяти и высокой точностью вывода. Использование Quantization Aware Training (QAT) позволяет модели адаптироваться к потере точности еще на этапе обучения, что дает преимущество перед методами пост-тренировочного квантования. Построенная на унифицированной архитектуре Gemma 4, модель поддерживает сложные задачи any-to-any, включая обработку изображений и текста. Полная совместимость с экосистемой Compressed Tensors упрощает интеграцию в производственные среды, требующие высокой скорости работы без ущерба для логических способностей 12-миллиардной модели. Лицензия Apache 2.0 обеспечивает широкую доступность для исследований и коммерческого использования.

💡Основное

├─Мультимодальная модель 12B
├─Обучение с учетом квантования W4A16
└─Поддержка формата Compressed Tensors

🎯Для

├─Исследователи ИИ
├─Инженеры по периферийным вычислениям
└─Разработчики мультимодальных приложений

🔗Ссылки

└─Страница модели на Hugging Face