MahmoudAshraf/mms-300m-1130-forced-aligner
🧠 AI मॉडलMahmoudAshraf
1130 भाषाओं के लिए wav2vec2-MMS पर आधारित फोर्स्ड अलाइनमेंट मॉडल।
यह मॉडल 1130 भाषाओं में फोर्स्ड अलाइनमेंट करने के लिए wav2vec2-MMS फ्रेमवर्क का उपयोग करता है। यह ऑडियो और टेक्स्ट ट्रांसक्रिप्ट इनपुट लेता है और सटीक शब्द-स्तरीय समय संरेखण आउटपुट करता है। मॉडल गति और सटीकता के लिए अनुकूलित है, MMS प्रीट्रेंड बैकबोन का लाभ उठाता है। मुख्य विशेषताओं में कई भाषाओं के लिए समर्थन, PyTorch के साथ कुशल अनुमान, और हगिंग फेस ट्रांसफॉर्मर्स के साथ संगतता शामिल है। भाषण पहचान, उपशीर्षक निर्माण और भाषा सीखने के अनुप्रयोगों के लिए आदर्श।
💡मुख्य बातें
- ├─1130 भाषाएँ समर्थित
- ├─Wav2vec2 MMS बैकबोन
- └─2.1M+ डाउनलोड
🎯के लिए
- ├─भाषण शोधकर्ता
- ├─एनएलपी इंजीनियर
- └─भाषा सीखने के डेवलपर