cross-encoder/ms-marco-MiniLM-L4-v2

🧠 AI 모델cross-encoder

쿼리-문서 관련성 점수를 빠르고 효율적으로 계산하는 텍스트 랭킹 모델

cross-encoder/ms-marco-MiniLM-L4-v2는 쿼리와 문서 간의 관련성을 점수화하는 텍스트 랭킹 모델입니다. 교차 인코더 방식으로 쿼리와 문서를 동시에 BERT 스타일 트랜스포머에 입력합니다. 이 모델은 MiniLM-L4를 기반으로 하며, 4개의 트랜스포머 레이어와 약 2200만 개의 파라미터를 가진 BERT의 증류 버전입니다. MS MARCO 패시지 랭킹 데이터셋에서 쌍별 랭킹 손실 함수로 학습되었습니다. 패시지 랭킹 작업에서 경쟁력 있는 성능을 제공하면서도 BERT-base와 같은 대형 모델보다 훨씬 빠르고 작습니다. PyTorch, JAX, ONNX, OpenVINO 형식으로 제공되어 다양한 하드웨어에 배포할 수 있습니다. 230만 회 이상 다운로드되어 의미 검색 및 재랭킹 파이프라인에서 널리 사용됩니다.

💡하이라이트

├─2200만 파라미터, 4레이어 MiniLM L4
├─MS MARCO 패시지 랭킹 학습
└─PyTorch, ONNX, OpenVINO 지원

🎯대상

├─NLP 엔지니어
├─검색 개발자
└─AI 연구자

🔗링크

└─HuggingFace 모델 카드