Qdrant/all-MiniLM-L6-v2-onnx
🧠 AI ModelQdrant
Высокопроизводительная ONNX-версия популярной модели эмбеддингов all-MiniLM-L6-v2 для ускоренного инференса.
Модель Qdrant/all-MiniLM-L6-v2-onnx представляет собой специализированную версию архитектуры all-MiniLM-L6-v2, готовую к развертыванию. Благодаря использованию формата Open Neural Network Exchange (ONNX), модель достигает значительного прироста скорости инференса по сравнению со стандартными реализациями на PyTorch. Она преобразует предложения и абзацы в 384-мерное плотное векторное пространство, что делает её идеальной для кластеризации, семантического поиска и задач извлечения информации. Модель полностью совместима с text-embeddings-inference и различными облачными средами, включая Azure. Компактный размер и оптимизированное время выполнения делают её предпочтительным выбором для сред с ограниченными ресурсами, где критически важна низкая задержка. Модель распространяется по лицензии Apache 2.0, что обеспечивает гибкость для коммерческих и open-source проектов.
💡Основное
- ├─ONNX-оптимизация для быстрого инференса
- ├─384-мерный векторный вывод
- └─Открытая лицензия Apache 2.0
🎯Для
- ├─ML-инженеры
- ├─Бэкенд-разработчики
- └─Специалисты по Data Science