lmstudio-community/gemma-4-E4B-it-MLX-8bit
🧠 AI Modellmstudio-community
Оптимизированная 8-битная MLX-версия модели Gemma 4-E4B от Google для эффективной работы на Apple Silicon.
Данная модель представляет собой специализированный порт архитектуры Google Gemma 4-E4B-it, преобразованный в формат MLX с 8-битным квантованием весов. MLX — это фреймворк машинного обучения от Apple, разработанный для эффективного выполнения вычислений на чипах серии M. Использование 8-битного квантования позволяет достичь баланса между вычислительной эффективностью и качеством генерации, снижая требования к оперативной памяти по сравнению с полноразмерными весами. Модель поддерживает конвейер «any-to-any», обеспечивая гибкость в мультимодальных взаимодействиях. Использование формата safetensors гарантирует безопасность и высокую скорость загрузки, а также совместимость с экосистемой Hugging Face и инструментами вроде LM Studio. Этот релиз особенно важен для разработчиков, стремящихся внедрить современные мультимодальные возможности в локальные приложения без использования облачных API.
💡Основное
- ├─8-битное квантование MLX
- ├─Поддержка мультимодальных задач
- └─Ускорение на Apple Silicon
🎯Для
- ├─ИИ-разработчики
- └─Пользователи Apple Silicon