classla/wav2vec2-xls-r-parlaspeech-hr
🧠 AI 模型classla
一款针对克罗地亚语优化的高性能自动语音识别模型,基于 ParlaSpeech-HR 数据集微调。
classla/wav2vec2-xls-r-parlaspeech-hr 模型代表了克罗地亚语低资源语言处理领域的重大进展。通过利用 XLS-R 架构(一种大规模跨语言语音表示模型),作者成功使其能够处理克罗地亚议会演讲中的特定语音和语言细微差别。该模型基于 PyTorch 生态系统构建,完全兼容 Hugging Face Transformers 库,确保了生产环境中的轻松部署。它支持 safetensors 格式,以实现安全高效的模型加载。该模型在转录正式及半正式的克罗地亚语口语方面表现出色,是数字人文、无障碍工具及区域自动化转录服务的重要资源。
💡核心亮点
- ├─基于 XLS-R 架构微调
- ├─针对克罗地亚语深度优化
- └─完全兼容 Transformers 库
🎯适用人群
- ├─计算语言学家
- ├─软件开发者
- └─无障碍研究人员