lmstudio-community/gemma-4-E4B-it-MLX-8bit

🧠 AI Modellmstudio-community

Оптимизированная 8-битная MLX-версия модели Gemma 4-E4B от Google для эффективной работы на Apple Silicon.

Данная модель представляет собой специализированный порт архитектуры Google Gemma 4-E4B-it, преобразованный в формат MLX с 8-битным квантованием весов. MLX — это фреймворк машинного обучения от Apple, разработанный для эффективного выполнения вычислений на чипах серии M. Использование 8-битного квантования позволяет достичь баланса между вычислительной эффективностью и качеством генерации, снижая требования к оперативной памяти по сравнению с полноразмерными весами. Модель поддерживает конвейер «any-to-any», обеспечивая гибкость в мультимодальных взаимодействиях. Использование формата safetensors гарантирует безопасность и высокую скорость загрузки, а также совместимость с экосистемой Hugging Face и инструментами вроде LM Studio. Этот релиз особенно важен для разработчиков, стремящихся внедрить современные мультимодальные возможности в локальные приложения без использования облачных API.

💡Основное

├─8-битное квантование MLX
├─Поддержка мультимодальных задач
└─Ускорение на Apple Silicon

🎯Для

├─ИИ-разработчики
└─Пользователи Apple Silicon

🔗Ссылки

└─Репозиторий Hugging Face