Qwen/Qwen3.6-35B-A3B-FP8

🧠 Модель ИИQwen

Эффективная MoE мультимодальная модель с FP8-квантизацией: 35B всего, 3B активируется.

Qwen3.6-35B-A3B-FP8 — это квантизированная версия MoE-модели Qwen3.6-35B-A3B, предназначенная для задач преобразования изображения в текст. Использование FP8-квантизации снижает потребление памяти и стоимость инференса, сохраняя высокую производительность. Архитектура MoE активирует только 3 миллиарда из 35 миллиардов параметров на токен, что делает модель подходящей для устройств с ограниченными ресурсами. Поддерживает ответы на вопросы по изображениям, генерацию подписей и мультимодальные диалоги. Унаследовав возможности серии Qwen, модель обладает сильными языковыми и визуальными способностями. Полностью открыта под лицензией Apache 2.0, совместима с Transformers и vLLM.

💡Основное

├─35B всего, 3B активных на токен
├─FP8-квантизация для эффективного инференса
└─Открытая мультимодальная модель (Apache 2.0)

🎯Для

├─Исследователи ИИ
├─Разработчики мультимодальных приложений
└─Инженеры по развертыванию на периферии

🔗Ссылки

└─Карточка модели на HuggingFace