jonatasgrosman/wav2vec2-large-xlsr-53-russian
🧠 KI-Modelljonatasgrosman
Feinabgestimmtes wav2vec2-large für russische Spracherkennung mit 2,5 Mio. Downloads.
jonatasgrosman/wav2vec2-large-xlsr-53-russian ist ein quelloffenes automatisches Spracherkennungsmodell, das speziell für die russische Sprache feinabgestimmt wurde. Es verwendet die wav2vec2-large-xlsr-53-Architektur, die selbstüberwachtes Lernen auf unbeschrifteten Sprachdaten nutzt und dann für ASR feinabstimmt. Das Modell wurde auf dem Mozilla Common Voice 6.0-Russisch-Datensatz feinabgestimmt. Es unterstützt Inferenz mit PyTorch, JAX und TensorFlow. Zu den Hauptmerkmalen gehören ein 300-Millionen-Parameter-Modell, Tokenisierung über Wav2Vec2CTCTokenizer und eine wettbewerbsfähige Leistung auf dem HF ASR Leaderboard für Russisch. Mit über 2,5 Millionen Downloads ist es eine weit verbreitete Ressource für russische Spracherkennungsanwendungen.
💡Highlights
- ├─300 Mio. Parameter wav2vec2-Modell
- ├─Feinabgestimmt auf Common Voice 6.0 Russisch
- └─2,5 Mio.+ Downloads von HuggingFace
🎯Für
- ├─Spracherkennungsforscher
- ├─NLP-Entwickler
- └─Russischsprachige Anwendungen