jonatasgrosman/wav2vec2-large-xlsr-53-dutch
🧠 KI-Modelljonatasgrosman
Feinabgestimmtes XLSR-53 Spracherkennungsmodell für Niederländisch, modernste Leistung auf Common Voice 6.0.
Das Modell basiert auf der wav2vec2-large-xlsr-53 Architektur, die selbstüberwachtes Lernen aus rohem Audio verwendet. Es wurde mit CTC-Verlust (Connectionist Temporal Classification) auf den niederländischen Sprachdaten von Common Voice 6.0 feinabgestimmt. Das Modell unterstützt end-to-end Spracherkennung und kann über die HuggingFace Pipeline für Inferenz verwendet werden. Es wurde beim Robust Speech Event evaluiert und ist Teil der HF ASR Bestenliste. Mit über 2,6 Millionen Downloads ist es eines der beliebtesten Open-Source Niederländisch ASR Modelle.
💡Highlights
- ├─Feinabgestimmt auf niederländischem Common Voice 6.0
- ├─WER ~8% auf Testset
- └─2,6M+ Downloads, Open-Source
🎯Für
- ├─Niederländische NLP-Forscher
- ├─ASR-Entwickler
- └─Niederländische Sprachtechnologie-Enthusiasten