anuragshas/wav2vec2-large-xlsr-53-telugu

🧠 AI मॉडलanuragshas

तेलुगु स्वचालित वाक् पहचान के लिए फाइन-ट्यून किया गया Wav2Vec2, 1.76M डाउनलोड।

wav2vec2-large-xlsr-53-telugu मॉडल एक ट्रांसफॉर्मर-आधारित स्वचालित वाक् पहचान प्रणाली है जिसे विशेष रूप से तेलुगु भाषा के लिए फाइन-ट्यून किया गया है। यह स्व-पर्यवेक्षित पूर्व-प्रशिक्षित XLSR-53 मॉडल (53 भाषाओं) का लाभ उठाता है और OpenSLR के डेटासेट का उपयोग करके इसे तेलुगु के लिए अनुकूलित करता है। मॉडल कनेक्शनिस्ट टेम्पोरल क्लासिफिकेशन के लिए एक रैखिक हेड के साथ Wav2Vec2ForCTC आर्किटेक्चर का उपयोग करता है। प्रमुख नवाचारों में 53 भाषाओं से कम-संसाधन भाषा में क्रॉस-लिंगुअल ट्रांसफर शामिल है, जो अपेक्षाकृत सीमित फाइन-ट्यूनिंग डेटा के साथ उच्च सटीकता प्राप्त करता है। यह PyTorch और JAX दोनों फ्रेमवर्क का समर्थन करता है, और आसान तैनाती के लिए Hugging Face की पाइपलाइनों के साथ संगत है। मॉडल एक उदार लाइसेंस के तहत ओपन सोर्स है, जो तेलुगु वाक् प्रौद्योगिकी में आगे के अनुसंधान और अनुप्रयोग को प्रोत्साहित करता है।

💡मुख्य बातें

├─1.76M डाउनलोड, 5 पसंद
├─XLSR-53 से तेलुगु OpenSLR पर फाइन-ट्यून
└─ओपन सोर्स, Hugging Face संगत

🎯के लिए

├─ASR शोधकर्ता
├─तेलुगु भाषा प्रौद्योगिकीविद्
└─वाक् पहचान अभियंता

🔗लिंक

└─HuggingFace पर मॉडल