jinaai/jina-embeddings-v3
🧠 KI-Modelljinaai
Mehrsprachiges Einbettungsmodell, 89 Sprachen, SOTA auf MTEB, flexible Dimensionskürzung.
jina-embeddings-v3 ist ein Transformer-Modell mit 570M Parametern, trainiert auf 2,4 Milliarden Textpaaren in 89 Sprachen. Es verfügt über eine dreistufige Trainingspipeline: Pre-Training, überwachtes kontrastives Lernen und aufgabenspezifisches Feintuning mit LoRA-Adapter. Das Modell gibt 1024-dimensionale Einbettungen aus, kann aber durch Matryoshka Representation Learning flexibel auf niedrigere Dimensionen (z.B. 512, 256) gekürzt werden, ohne erneutes Training. Es unterstützt Query- und Passage-Routing für Retrieval-Aufgaben und ist kompatibel mit sentence-transformers und ONNX Runtime. Veröffentlicht unter Apache 2.0 auf HuggingFace.
💡Highlights
- ├─570M Parameter, 1024-dim Einbettungen
- ├─SOTA auf mehrsprachigem MTEB
- └─Flexible Dimensionskürzung
🎯Für
- ├─NLP-Forscher
- ├─Mehrsprachige KI-Ingenieure
- └─Entwickler von Such- & Retrievalsystemen