jonatasgrosman/wav2vec2-large-xlsr-53-russian

🧠 KI-Modelljonatasgrosman

Feinabgestimmtes wav2vec2-large für russische Spracherkennung mit 2,5 Mio. Downloads.

jonatasgrosman/wav2vec2-large-xlsr-53-russian ist ein quelloffenes automatisches Spracherkennungsmodell, das speziell für die russische Sprache feinabgestimmt wurde. Es verwendet die wav2vec2-large-xlsr-53-Architektur, die selbstüberwachtes Lernen auf unbeschrifteten Sprachdaten nutzt und dann für ASR feinabstimmt. Das Modell wurde auf dem Mozilla Common Voice 6.0-Russisch-Datensatz feinabgestimmt. Es unterstützt Inferenz mit PyTorch, JAX und TensorFlow. Zu den Hauptmerkmalen gehören ein 300-Millionen-Parameter-Modell, Tokenisierung über Wav2Vec2CTCTokenizer und eine wettbewerbsfähige Leistung auf dem HF ASR Leaderboard für Russisch. Mit über 2,5 Millionen Downloads ist es eine weit verbreitete Ressource für russische Spracherkennungsanwendungen.

💡Highlights

├─300 Mio. Parameter wav2vec2-Modell
├─Feinabgestimmt auf Common Voice 6.0 Russisch
└─2,5 Mio.+ Downloads von HuggingFace

🎯Für

├─Spracherkennungsforscher
├─NLP-Entwickler
└─Russischsprachige Anwendungen

🔗Links

└─Modell auf HuggingFace