Qdrant/bge-small-en-v1.5-onnx-Q
🧠 AI ModelQdrant
Высокопроизводительная квантованная ONNX-версия модели эмбеддингов BGE-small-en-v1.5 для эффективного векторного поиска.
Модель Qdrant/bge-small-en-v1.5-onnx-Q представляет собой значительную оптимизацию архитектуры BGE-small. Благодаря конвертации в формат ONNX (Open Neural Network Exchange) и применению квантования, команда Qdrant создала версию, которая значительно эффективнее работает в средах с ограниченными ресурсами. Модель отлично справляется с созданием высококачественных векторных представлений текста, что делает её идеальной для семантического поиска, кластеризации и конвейеров RAG (генерации с дополнением поиска). Она полностью совместима с Text Embeddings Inference (TEI) и стандартными средами выполнения ONNX, обеспечивая бесшовную интеграцию в существующие стеки ИИ. Модель сохраняет высокую точность оригинальной BGE-small-en-v1.5, радикально повышая скорость инференса.
💡Основное
- ├─Оптимизированный формат ONNX
- ├─Квантование для низкой задержки
- └─Более 650 тыс. скачиваний на HF
🎯Для
- ├─AI-инженеры
- └─Бэкенд-разработчики