theainerd/Wav2Vec2-large-xlsr-hindi

🧠 AI मॉडलtheainerd

हिंदी स्वचालित भाषण पहचान के लिए उच्च सटीकता के साथ फाइन-ट्यून किया गया Wav2Vec2।

theainerd/Wav2Vec2-large-xlsr-hindi एक ओपन-सोर्स ट्रांसफॉर्मर मॉडल है जो विशेष रूप से हिंदी भाषा के लिए स्वचालित भाषण पहचान (ASR) हेतु तैयार किया गया है। यह शक्तिशाली wav2vec2 आर्किटेक्चर पर आधारित है जो 53 भाषाओं (XLSR-53) पर पूर्व-प्रशिक्षित है और फिर हिंदी डेटासेट पर फाइन-ट्यून किया गया है। मॉडल स्व-पर्यवेक्षित शिक्षण दृष्टिकोण का उपयोग करता है, जो अलेबल ऑडियो से समृद्ध भाषण प्रतिनिधित्व सीखने के लिए कंट्रास्टिव लर्निंग का लाभ उठाता है। यह PyTorch, HuggingFace Transformers और Safetensors के साथ संगत है। मुख्य विशेषताओं में कम शब्द त्रुटि दर (WER), विभिन्न इनपुट ऑडियो प्रारूपों के लिए समर्थन और HuggingFace एंडपॉइंट्स के माध्यम से आसान तैनाती शामिल है। मॉडल को 1.4 मिलियन से अधिक बार डाउनलोड किया गया है और हब पर 12 लाइक प्राप्त हुए हैं। यह हिंदी बोलने वालों के लिए वॉयस असिस्टेंट, ट्रांसक्रिप्शन सेवाओं और सुलभता उपकरणों जैसे अनुप्रयोगों के लिए उपयुक्त है।

💡मुख्य बातें

├─wav2vec2-large-xlsr-53 पर फाइन-ट्यून
├─1.4M डाउनलोड, ओपन-सोर्स
└─उच्च सटीकता हिंदी ASR

🎯के लिए

├─एनएलपी शोधकर्ता
├─भाषण पहचान इंजीनियर
└─हिंदी भाषा प्रौद्योगिकी डेवलपर्स

🔗लिंक

└─HuggingFace पर मॉडल