MahmoudAshraf/mms-300m-1130-forced-aligner
🧠 AI模型MahmoudAshraf
基于wav2vec2-MMS的1130种语言强制对齐模型。
该模型使用wav2vec2-MMS框架在1130种语言上执行强制对齐。输入音频和文本转录,输出精确的单词级时间对齐。模型针对速度和准确性进行了优化,利用MMS预训练主干。主要特点包括支持多种语言、使用PyTorch高效推理以及与Hugging Face Transformers的兼容性。适用于语音识别、字幕生成和语言学习等应用。