jonatasgrosman/wav2vec2-large-xlsr-53-hungarian
🧠 AI 模型jonatasgrosman
针对匈牙利语语音识别微调的Wav2Vec2 Large XLSR-53模型。
jonatasgrosman/wav2vec2-large-xlsr-53-hungarian是一个开源自动语音识别模型,专为匈牙利语微调。它基于Facebook的Wav2Vec2 Large XLSR-53,该模型通过自监督学习在53种语言上预训练。模型在Mozilla Common Voice的匈牙利语子集上进一步微调,采用wav2vec2架构与Transformer编码器,在匈牙利语ASR中达到最先进水平。支持16kHz采样音频输入,输出转录文本。关键特性包括:使用连接主义时间分类(CTC)微调、利用跨语言表示、适用于低资源匈牙利语环境。该模型拥有近200万次下载,体现了其可靠性和性能。
💡核心亮点
- ├─基于XLSR-53多语言预训练模型微调
- ├─针对匈牙利语自动语音识别微调
- └─HuggingFace下载量达190万次
🎯适用人群
- ├─语音识别研究人员
- ├─匈牙利语NLP开发者
- └─低资源语言AI爱好者
🔗链接
- └─模型卡片