anuragshas/wav2vec2-large-xlsr-53-telugu
🧠 Модель ИИanuragshas
Тонко настроенный Wav2Vec2 для распознавания речи на телугу с 1,76 млн загрузок.
Модель wav2vec2-large-xlsr-53-telugu представляет собой систему автоматического распознавания речи (ASR) на основе трансформеров, тонко настроенную специально для языка телугу. Она использует самообучаемую предварительно обученную модель XLSR-53 (53 языка) и адаптирует её к телугу с помощью набора данных из OpenSLR. Модель использует архитектуру Wav2Vec2ForCTC с линейной головкой для связующей темпоральной классификации. Ключевые инновации включают кросс-языковой перенос из 53 языков на низкоресурсный язык, достигая высокой точности при относительно ограниченных данных для тонкой настройки. Она поддерживает как PyTorch, так и JAX фреймворки, и совместима с пайплайнами Hugging Face для простого развертывания. Модель имеет открытый исходный код под разрешительной лицензией, поощряя дальнейшие исследования и применение в технологии речи на телугу.
💡Основное
- ├─1,76 млн загрузок, 5 лайков
- ├─Тонкая настройка с XLSR-53 на телугу OpenSLR
- └─Открытый исходный код, совместимость с Hugging Face
🎯Для
- ├─Исследователи ASR
- ├─Специалисты по языку телугу
- └─Инженеры по распознаванию речи