google/gemma-4-12B-it-qat-w4a16-ct
🧠 AI Modelgoogle
Высокопроизводительная квантованная мультимодальная модель Gemma 4 (12B), оптимизированная для эффективных задач any-to-any.
Модель google/gemma-4-12B-it-qat-w4a16-ct — это важный шаг в области эффективного развертывания ИИ. Благодаря квантованию w4a16 (веса 4-битные, активации 16-битные) модель достигает баланса между низким потреблением памяти и высокой точностью вывода. Использование Quantization Aware Training (QAT) позволяет модели адаптироваться к потере точности еще на этапе обучения, что дает преимущество перед методами пост-тренировочного квантования. Построенная на унифицированной архитектуре Gemma 4, модель поддерживает сложные задачи any-to-any, включая обработку изображений и текста. Полная совместимость с экосистемой Compressed Tensors упрощает интеграцию в производственные среды, требующие высокой скорости работы без ущерба для логических способностей 12-миллиардной модели. Лицензия Apache 2.0 обеспечивает широкую доступность для исследований и коммерческого использования.
💡Основное
- ├─Мультимодальная модель 12B
- ├─Обучение с учетом квантования W4A16
- └─Поддержка формата Compressed Tensors
🎯Для
- ├─Исследователи ИИ
- ├─Инженеры по периферийным вычислениям
- └─Разработчики мультимодальных приложений