Qwen/Qwen3.6-35B-A3B-FP8
🧠 Модель ИИQwen
Эффективная MoE мультимодальная модель с FP8-квантизацией: 35B всего, 3B активируется.
Qwen3.6-35B-A3B-FP8 — это квантизированная версия MoE-модели Qwen3.6-35B-A3B, предназначенная для задач преобразования изображения в текст. Использование FP8-квантизации снижает потребление памяти и стоимость инференса, сохраняя высокую производительность. Архитектура MoE активирует только 3 миллиарда из 35 миллиардов параметров на токен, что делает модель подходящей для устройств с ограниченными ресурсами. Поддерживает ответы на вопросы по изображениям, генерацию подписей и мультимодальные диалоги. Унаследовав возможности серии Qwen, модель обладает сильными языковыми и визуальными способностями. Полностью открыта под лицензией Apache 2.0, совместима с Transformers и vLLM.
💡Основное
- ├─35B всего, 3B активных на токен
- ├─FP8-квантизация для эффективного инференса
- └─Открытая мультимодальная модель (Apache 2.0)
🎯Для
- ├─Исследователи ИИ
- ├─Разработчики мультимодальных приложений
- └─Инженеры по развертыванию на периферии