theainerd/Wav2Vec2-large-xlsr-hindi
🧠 AIモデルtheainerd
ヒンディー語向けにファインチューニングされたWav2Vec2、高精度な自動音声認識を実現。
theainerd/Wav2Vec2-large-xlsr-hindiは、ヒンディー語に特化した自動音声認識(ASR)用のオープンソーストランスフォーマーモデルです。強力なwav2vec2アーキテクチャに基づき、53言語で事前学習(XLSR-53)された後、ヒンディー語データセットでファインチューニングされています。自己教師あり学習アプローチを使用し、対照学習を活用してラベルなし音声から豊かな音声表現を学習します。PyTorch、HuggingFace Transformers、Safetensorsに対応しています。主な特徴として、低い単語誤り率(WER)、多様な入力音声フォーマットのサポート、HuggingFaceエンドポイントによる容易な導入が挙げられます。モデルは140万回以上ダウンロードされ、12件のいいねを獲得しています。音声アシスタント、文字起こしサービス、ヒンディー語話者向けアクセシビリティツールなどのアプリケーションに適しています。
💡ハイライト
- ├─facebook/wav2vec2-large-xlsr-53からファインチューニング
- ├─140万ダウンロード、オープンソース
- └─高精度なヒンディー語ASR
🎯対象
- ├─NLP研究者
- ├─音声認識エンジニア
- └─ヒンディー語技術開発者