theainerd/Wav2Vec2-large-xlsr-hindi
🧠 Модель ИИtheainerd
Точная настройка Wav2Vec2 для распознавания речи на хинди с высокой точностью.
Модель theainerd/Wav2Vec2-large-xlsr-hindi — это открытая модель трансформера для автоматического распознавания речи (ASR), специально адаптированная для языка хинди. Она основана на мощной архитектуре wav2vec2, предварительно обученной на 53 языках (XLSR-53), а затем доработанной на наборах данных на хинди. Модель использует самообучающийся подход, применяя контрастное обучение для изучения богатых речевых представлений из неразмеченного аудио. Она совместима с PyTorch, HuggingFace Transformers и Safetensors. Ключевые особенности включают низкую частоту ошибок в словах (WER), поддержку различных форматов входного аудио и простоту развертывания через точки доступа HuggingFace. Модель была загружена более 1.4 миллиона раз и получила 12 лайков на хабе. Она подходит для таких приложений, как голосовые помощники, сервисы транскрипции и инструменты доступности для носителей хинди.
💡Основное
- ├─Доработан на основе facebook/wav2vec2-large-xlsr-53
- ├─1.4 млн загрузок, открытый исходный код
- └─Высокая точность ASR для хинди
🎯Для
- ├─Исследователи NLP
- ├─Инженеры по распознаванию речи
- └─Разработчики технологий для хинди