vikhyatk/moondream2
🧠 AI Модельvikhyatk
Открытая мультимодальная модель для описания изображений и ответов на вопросы.
Moondream2 представляет собой значительный прогресс по сравнению с предшественником Moondream1. Он использует архитектуру на основе трансформеров для обработки изображений и генерации описательного текста, что делает его подходящим для инструментов доступности, модерации контента и автоматического создания подписей. Модель обучена на крупных наборах данных и включает меры безопасности. Полностью открытый исходный код под лицензией Apache 2.0, поддерживает дообучение и развертывание через библиотеку transformers. Ключевые особенности включают совместимость с конечными точками HuggingFace, поддержку пользовательского кода и надежные показатели производительности.
💡Основное
- ├─1,44 млн+ загрузок HF
- ├─Открытый код Apache 2.0
- └─Совместимость с HF endpoints
🎯Для
- ├─Исследователи ИИ
- ├─разработчики приложений для описания изображений
- └─создатели инструментов доступности