cross-encoder/ms-marco-MiniLM-L4-v2
🧠 AI 模型cross-encoder
快速高效的文本排序模型,用于查询-文档相关性评分。
cross-encoder/ms-marco-MiniLM-L4-v2是一个文本排序模型,用于对查询和文档之间的相关性进行评分。它是一个交叉编码器,意味着它通过BERT风格变换器同时处理查询和文档。该模型基于MiniLM-L4,这是BERT的蒸馏版本,具有4个变换器层和约2200万个参数。它使用成对排序损失在MS MARCO段落排序数据集上训练。该模型在段落排序任务上取得了有竞争力的性能,同时比BERT-base等较大模型更快、更小。它提供PyTorch、JAX、ONNX和OpenVINO格式,可部署在多种硬件上。拥有超过230万次下载,广泛用于生产系统中的语义搜索和重排序流水线。
💡核心亮点
- ├─2200万参数,4层MiniLM L4
- ├─在MS MARCO段落排序上训练
- └─支持PyTorch、ONNX、OpenVINO
🎯适用人群
- ├─NLP工程师
- ├─搜索开发者
- └─AI研究人员