cyankiwi/gemma-4-31B-it-AWQ-4bit
🧠 AI Modelcyankiwi
Высокооптимизированная 4-битная AWQ-квантованная версия модели Gemma-4-31B-it от Google для эффективного инференса.
Данная модель представляет собой специализированную версию архитектуры Gemma-4-31B-it, разработанную для высокоэффективного инференса. Применение 4-битного квантования AWQ позволяет существенно уменьшить объем занимаемой памяти по сравнению с полноразмерной моделью, что дает возможность запускать её на потребительском оборудовании. Модель поддерживает конвейеры «изображение-текст-в-текст», используя сильные стороны архитектуры Gemma в мультимодальном понимании и следовании инструкциям. Модель распространяется в формате safetensors, что обеспечивает безопасную и быструю загрузку через библиотеку transformers. Этот релиз особенно ценен для разработчиков, стремящихся интегрировать мощные мультимодальные модели в ограниченные по ресурсам среды без потери качества работы, характерного для серии Gemma-4.
💡Основное
- ├─4-битное квантование AWQ
- ├─Поддержка image-text-to-text
- └─Оптимизировано для низкой VRAM
🎯Для
- ├─Исследователи ИИ
- ├─Разработчики периферийных вычислений
- └─Инженеры по машинному обучению