Qdrant/bge-small-en-v1.5-onnx-Q

🧠 AI ModelQdrant

Высокопроизводительная квантованная ONNX-версия модели эмбеддингов BGE-small-en-v1.5 для эффективного векторного поиска.

Модель Qdrant/bge-small-en-v1.5-onnx-Q представляет собой значительную оптимизацию архитектуры BGE-small. Благодаря конвертации в формат ONNX (Open Neural Network Exchange) и применению квантования, команда Qdrant создала версию, которая значительно эффективнее работает в средах с ограниченными ресурсами. Модель отлично справляется с созданием высококачественных векторных представлений текста, что делает её идеальной для семантического поиска, кластеризации и конвейеров RAG (генерации с дополнением поиска). Она полностью совместима с Text Embeddings Inference (TEI) и стандартными средами выполнения ONNX, обеспечивая бесшовную интеграцию в существующие стеки ИИ. Модель сохраняет высокую точность оригинальной BGE-small-en-v1.5, радикально повышая скорость инференса.

💡Основное

├─Оптимизированный формат ONNX
├─Квантование для низкой задержки
└─Более 650 тыс. скачиваний на HF

🎯Для

├─AI-инженеры
└─Бэкенд-разработчики

🔗Ссылки

└─Репозиторий HuggingFace