jonatasgrosman/wav2vec2-large-xlsr-53-russian
🧠 Модель ИИjonatasgrosman
Тонко настроенная модель wav2vec2-large для распознавания русской речи с 2.5 млн загрузок.
jonatasgrosman/wav2vec2-large-xlsr-53-russian — это модель автоматического распознавания речи с открытым исходным кодом, тонко настроенная специально для русского языка. Она использует архитектуру wav2vec2-large-xlsr-53, которая применяет самоконтролируемое обучение на неразмеченных речевых данных, а затем тонкую настройку для ASR. Модель была дообучена на датасете Mozilla Common Voice 6.0 Russian. Поддерживает инференс с PyTorch, JAX и TensorFlow. Ключевые особенности: модель с 300 млн параметров, токенизация через Wav2Vec2CTCTokenizer и конкурентоспособная производительность в лидерборде HF ASR для русского языка. С более чем 2.5 миллионами загрузок это широко используемый ресурс для приложений распознавания русской речи.
💡Основное
- ├─Модель wav2vec2 с 300M параметров
- ├─Дообучена на Common Voice 6.0 Russian
- └─Более 2.5 млн загрузок с HuggingFace
🎯Для
- ├─Исследователи распознавания речи
- ├─Разработчики NLP
- └─Приложения для русского языка