jonatasgrosman/wav2vec2-large-xlsr-53-hungarian
🧠 AI Модельjonatasgrosman
Тонко настроенная Wav2Vec2 Large XLSR-53 для распознавания венгерской речи.
jonatasgrosman/wav2vec2-large-xlsr-53-hungarian — это модель автоматического распознавания речи с открытым исходным кодом, специально настроенная для венгерского языка. Она основана на Facebook Wav2Vec2 Large XLSR-53, предобученной на 53 языках с использованием самообучения. Модель была дополнительно настроена на венгерской части датасета Mozilla Common Voice. Она использует архитектуру wav2vec2 с трансформерным энкодером, достигая передовых результатов для венгерского ASR. Модель поддерживает входной аудиосигнал с частотой дискретизации 16 кГц и выводит транскрибированный текст. Ключевые особенности: тонкая настройка с коннекционистской временной классификацией (CTC), использование кросс-языковых представлений и применимость в условиях ограниченных ресурсов для венгерского языка. Модель получила значительную популярность с почти 2 миллионами загрузок, что свидетельствует о ее надежности и производительности в сообществе.
💡Основное
- ├─Предобученная модель XLSR-53
- ├─Тонкая настройка для венгерского ASR
- └─1.9 млн загрузок на HuggingFace
🎯Для
- ├─Исследователи распознавания речи
- ├─Разработчики NLP для венгерского языка
- └─Энтузиасты ИИ, работающие с низкоресурсными языками