Harveenchadha/vakyansh-wav2vec2-tamil-tam-250

🧠 AI-ModellHarveenchadha

Wav2Vec2-Modell für tamilische Spracherkennung, 250M Parameter.

Dieses Modell ist eine feinabgestimmte Version der Wav2Vec2-Architektur speziell für die tamilische Spracherkennung. Es verwendet das Wav2Vec2ForCTC-Modell mit einem vortrainierten wav2vec2-Checkpoint und wurde auf 250 Stunden tamilischem Sprachdaten aus dem Vakyansh-Projekt feinabgestimmt. Das Modell verfügt über einen 12-schichtigen Transformer-Encoder mit etwa 250 Millionen Parametern. Es verarbeitet 16-kHz-Audio und gibt Text über verbindungstemporale Klassifikation (CTC) aus. Zu den wichtigsten Neuerungen gehören ein Lernratenplan, Gradienten-Checkpointing und gemischtes Präzisionstraining. Das Modell erreicht eine Wortfehlerrate (WER) von etwa 10-15% bei standardmäßigen tamilischen Benchmarks. Es ist mit der HuggingFace Transformers-Bibliothek kompatibel und kann für Inferenz oder weiteres Feintuning verwendet werden.

💡Highlights

├─250M Parameter, 12 Transformer-Schichten
├─Feinabgestimmt auf 250 Stunden Tamilisch-Sprache
└─1,3 Mio.+ Downloads auf HuggingFace

🎯Für

├─NLP-Forscher
├─ASR-Entwickler
└─Tamilisch-Sprachtechnologie-Enthusiasten

🔗Links

└─HuggingFace Modellseite