Qdrant/all-MiniLM-L6-v2-onnx

🧠 AI 모델Qdrant

인기 있는 all-MiniLM-L6-v2 임베딩 모델을 ONNX로 최적화하여 추론 속도를 극대화한 모델입니다.

Qdrant/all-MiniLM-L6-v2-onnx는 기존 all-MiniLM-L6-v2 아키텍처를 배포용으로 특화한 모델입니다. ONNX(Open Neural Network Exchange) 형식을 활용하여 표준 PyTorch 구현 대비 추론 속도에서 상당한 성능 향상을 달성했습니다. 문장과 단락을 384차원의 밀집 벡터 공간으로 매핑하여 클러스터링, 시맨틱 검색, 정보 검색 작업에 이상적입니다. 이 모델은 텍스트 임베딩 추론 및 Azure를 포함한 다양한 클라우드 배포 환경과 완벽하게 호환됩니다. 콤팩트한 크기와 최적화된 런타임 덕분에 저지연 임베딩 생성이 필수적인 리소스 제한 환경에서 선호되는 선택지입니다. Apache 2.0 라이선스로 배포되어 상업용 및 오픈 소스 프로젝트 모두에서 유연하게 사용할 수 있습니다.

💡하이라이트

├─빠른 추론을 위한 ONNX 최적화
├─384차원 벡터 출력 지원
└─Apache 2.0 오픈 소스 라이선스

🎯대상

├─머신러닝 엔지니어
├─백엔드 개발자
└─데이터 과학자

🔗링크

└─HuggingFace 저장소