Qdrant/all-MiniLM-L6-v2-onnx

🧠 AI ModelQdrant

Высокопроизводительная ONNX-версия популярной модели эмбеддингов all-MiniLM-L6-v2 для ускоренного инференса.

Модель Qdrant/all-MiniLM-L6-v2-onnx представляет собой специализированную версию архитектуры all-MiniLM-L6-v2, готовую к развертыванию. Благодаря использованию формата Open Neural Network Exchange (ONNX), модель достигает значительного прироста скорости инференса по сравнению со стандартными реализациями на PyTorch. Она преобразует предложения и абзацы в 384-мерное плотное векторное пространство, что делает её идеальной для кластеризации, семантического поиска и задач извлечения информации. Модель полностью совместима с text-embeddings-inference и различными облачными средами, включая Azure. Компактный размер и оптимизированное время выполнения делают её предпочтительным выбором для сред с ограниченными ресурсами, где критически важна низкая задержка. Модель распространяется по лицензии Apache 2.0, что обеспечивает гибкость для коммерческих и open-source проектов.

💡Основное

├─ONNX-оптимизация для быстрого инференса
├─384-мерный векторный вывод
└─Открытая лицензия Apache 2.0

🎯Для

├─ML-инженеры
├─Бэкенд-разработчики
└─Специалисты по Data Science

🔗Ссылки

└─Репозиторий на HuggingFace