Harveenchadha/vakyansh-wav2vec2-tamil-tam-250
🧠 AI-ModellHarveenchadha
Wav2Vec2-Modell für tamilische Spracherkennung, 250M Parameter.
Dieses Modell ist eine feinabgestimmte Version der Wav2Vec2-Architektur speziell für die tamilische Spracherkennung. Es verwendet das Wav2Vec2ForCTC-Modell mit einem vortrainierten wav2vec2-Checkpoint und wurde auf 250 Stunden tamilischem Sprachdaten aus dem Vakyansh-Projekt feinabgestimmt. Das Modell verfügt über einen 12-schichtigen Transformer-Encoder mit etwa 250 Millionen Parametern. Es verarbeitet 16-kHz-Audio und gibt Text über verbindungstemporale Klassifikation (CTC) aus. Zu den wichtigsten Neuerungen gehören ein Lernratenplan, Gradienten-Checkpointing und gemischtes Präzisionstraining. Das Modell erreicht eine Wortfehlerrate (WER) von etwa 10-15% bei standardmäßigen tamilischen Benchmarks. Es ist mit der HuggingFace Transformers-Bibliothek kompatibel und kann für Inferenz oder weiteres Feintuning verwendet werden.
💡Highlights
- ├─250M Parameter, 12 Transformer-Schichten
- ├─Feinabgestimmt auf 250 Stunden Tamilisch-Sprache
- └─1,3 Mio.+ Downloads auf HuggingFace
🎯Für
- ├─NLP-Forscher
- ├─ASR-Entwickler
- └─Tamilisch-Sprachtechnologie-Enthusiasten