comodoro/wav2vec2-xls-r-300m-sk-cv8

🧠 AI 模型comodoro

一款针对斯洛伐克语进行微调的高精度自动语音识别模型。

comodoro/wav2vec2-xls-r-300m-sk-cv8 模型基于 Wav2Vec2 XLS-R 300M 架构构建，该架构在海量多语言语音数据上进行了预训练。此版本专门针对斯洛伐克语进行了微调，利用联结主义时间分类 (CTC) 损失函数将音频序列映射为字符级转录。该模型在 3 亿参数规模与高效特征提取能力之间取得了良好平衡，适用于语音转文字、无障碍工具及特定语言语音交互界面等多种 ASR 应用场景。模型完全兼容 Hugging Face Transformers 库和 PyTorch，可无缝集成到现有的机器学习流水线和部署环境中。

💡核心亮点

├─基于 3 亿参数的 XLS-R 架构
├─使用 Common Voice 8.0 数据集微调
└─针对斯洛伐克语 ASR 进行深度优化

🎯适用人群

├─语音研究人员
├─软件开发人员
└─语言学家

🔗链接

└─Hugging Face 模型页面