ibm-granite/granite-embedding-small-english-r2

🧠 KI-Modellibm-granite

IBMs effizientes Embedding-Modell für RAG, Retrieval und Satzähnlichkeit.

Das IBM Granite Embedding Small English R2 ist ein Open-Source-Modell für die Merkmalsextraktion, das dichte Vektor-Embeddings erzeugt. Es nutzt die ModernBERT-Architektur, die für lange Sequenzen optimiert ist und bis zu 8192 Token pro Eingabe unterstützt. Dadurch ist es ideal für dokumentenbasierte Retrieval- und RAG-Pipelines. Das Modell wurde mit Matryoshka-Representation-Learning trainiert, was flexible Embedding-Dimensionen (z.B. 384, 512, 768) ohne Leistungseinbußen ermöglicht. In MTEB-Benchmarks erzielt es wettbewerbsfähige Ergebnisse unter den kleinen Embedding-Modellen und bietet einen praktischen Kompromiss zwischen Geschwindigkeit und Qualität. Mit über 1,5 Millionen Downloads hat es aufgrund seiner Effizienz und der Glaubwürdigkeit von IBM an Popularität gewonnen. Das Modell wird auf HuggingFace in den Formaten PyTorch und SafeTensors vertrieben und ist mit der sentence-transformers-Bibliothek kompatibel, was eine einfache Integration ermöglicht.

💡Highlights

├─8192 Token Kontextlänge
├─ModernBERT-Architektur
└─1,5 Mio.+ HuggingFace-Downloads

🎯Für

├─NLP-Forscher
├─RAG-Entwickler
└─Datenwissenschaftler

🔗Links

└─Modell-Hub