jonatasgrosman/wav2vec2-large-xlsr-53-dutch

🧠 एआई मॉडलjonatasgrosman

XLSR-53 डच वाक् पहचान मॉडल, Common Voice 6.0 पर अत्याधुनिक।

यह मॉडल wav2vec2-large-xlsr-53 आर्किटेक्चर पर आधारित है, जो कच्चे ऑडियो से स्व-पर्यवेक्षित सीखने का उपयोग करता है। इसे Common Voice 6.0 के डच भाषा डेटा पर CTC (कनेक्शनिस्ट टेम्पोरल क्लासिफिकेशन) लॉस का उपयोग करके फ़ाइन-ट्यून किया गया था। मॉडल एंड-टू-एंड वाक् पहचान का समर्थन करता है और अनुमान के लिए HuggingFace पाइपलाइन के माध्यम से उपयोग किया जा सकता है। इसका Robust Speech Event पर मूल्यांकन किया गया है और यह HF ASR लीडरबोर्ड का हिस्सा है। 2.6 मिलियन से अधिक डाउनलोड के साथ, यह ओपन-सोर्स उपलब्ध सबसे लोकप्रिय डच ASR मॉडलों में से एक है।

💡मुख्य बातें

├─डच Common Voice 6.0 पर फ़ाइन-ट्यून
├─परीक्षण सेट पर WER ~8%
└─2.6M+ डाउनलोड, ओपन-सोर्स

🎯के लिए

├─डच एनएलपी शोधकर्ता
├─एएसआर डेवलपर्स
└─डच भाषा प्रौद्योगिकी उत्साही

🔗लिंक

└─HuggingFace मॉडल