jinaai/jina-embeddings-v3

🧠 KI-Modelljinaai

Mehrsprachiges Einbettungsmodell, 89 Sprachen, SOTA auf MTEB, flexible Dimensionskürzung.

jina-embeddings-v3 ist ein Transformer-Modell mit 570M Parametern, trainiert auf 2,4 Milliarden Textpaaren in 89 Sprachen. Es verfügt über eine dreistufige Trainingspipeline: Pre-Training, überwachtes kontrastives Lernen und aufgabenspezifisches Feintuning mit LoRA-Adapter. Das Modell gibt 1024-dimensionale Einbettungen aus, kann aber durch Matryoshka Representation Learning flexibel auf niedrigere Dimensionen (z.B. 512, 256) gekürzt werden, ohne erneutes Training. Es unterstützt Query- und Passage-Routing für Retrieval-Aufgaben und ist kompatibel mit sentence-transformers und ONNX Runtime. Veröffentlicht unter Apache 2.0 auf HuggingFace.

💡Highlights

├─570M Parameter, 1024-dim Einbettungen
├─SOTA auf mehrsprachigem MTEB
└─Flexible Dimensionskürzung

🎯Für

├─NLP-Forscher
├─Mehrsprachige KI-Ingenieure
└─Entwickler von Such- & Retrievalsystemen

🔗Links

└─Modell auf HuggingFace