cross-encoder/mmarco-mMiniLMv2-L12-H384-v1

🧠 AI Modelcross-encoder

Ein leistungsstarkes, mehrsprachiges Cross-Encoder-Modell, optimiert für effizientes Text-Ranking und Information Retrieval.

Das Modell mmarco-mMiniLMv2-L12-H384-v1 nutzt eine Cross-Encoder-Architektur, die speziell für Text-Ranking-Aufgaben optimiert wurde. Durch die gleichzeitige Verarbeitung von Abfrage-Dokument-Paaren erzielt es eine überlegene Relevanzbewertung im Vergleich zu Bi-Encoder-Ansätzen, was es zur idealen Wahl für die zweite Stufe von Retrieval-Pipelines macht. Das Modell basiert auf dem mMiniLMv2-Framework, das Wissen von größeren Lehrermodellen in eine kompakte Struktur mit 12 Schichten und 384 Dimensionen destilliert. Diese Konfiguration bietet ein optimales Gleichgewicht zwischen Recheneffizienz und sprachlicher Leistung. Es unterstützt zahlreiche Formate, darunter PyTorch, ONNX und OpenVINO, und gewährleistet so eine nahtlose Integration in verschiedene Produktionsumgebungen. Ob für sprachübergreifende Suchsysteme oder zur Verbesserung der Dokumentenrelevanz in RAG-Architekturen – dieses Modell liefert die nötige Präzision für komplexe Ranking-Anfragen.

💡Highlights

├─12 Schichten, 384 Hidden Dimension
├─Mehrsprachiges Text-Ranking
└─Optimiert für ONNX & OpenVINO

🎯Für

├─Such-Ingenieure
├─NLP-Forscher
└─RAG-Pipeline-Entwickler

🔗Links

└─Hugging Face Modell-Seite