cross-encoder/ms-marco-MiniLM-L4-v2

🧠 AI 模型cross-encoder

快速高效的文本排序模型，用于查询-文档相关性评分。

cross-encoder/ms-marco-MiniLM-L4-v2是一个文本排序模型，用于对查询和文档之间的相关性进行评分。它是一个交叉编码器，意味着它通过BERT风格变换器同时处理查询和文档。该模型基于MiniLM-L4，这是BERT的蒸馏版本，具有4个变换器层和约2200万个参数。它使用成对排序损失在MS MARCO段落排序数据集上训练。该模型在段落排序任务上取得了有竞争力的性能，同时比BERT-base等较大模型更快、更小。它提供PyTorch、JAX、ONNX和OpenVINO格式，可部署在多种硬件上。拥有超过230万次下载，广泛用于生产系统中的语义搜索和重排序流水线。

💡核心亮点

├─2200万参数，4层MiniLM L4
├─在MS MARCO段落排序上训练
└─支持PyTorch、ONNX、OpenVINO

🎯适用人群

├─NLP工程师
├─搜索开发者
└─AI研究人员

🔗链接

└─HuggingFace 模型卡片