indonesian-nlp/wav2vec2-indonesian-javanese-sundanese
🧠 AIモデルindonesian-nlp
インドネシア語、ジャワ語、スンダ語向けにファインチューニングされたWav2Vec2 ASRモデル。
このモデルはFacebookのwav2vec2-baseをベースに、インドネシア語、ジャワ語、スンダ語の音声データセットを組み合わせてファインチューニングされています。ASRのために線形層を追加したWav2Vec2アーキテクチャを使用しています。PyTorchとTransformersライブラリを使って学習されました。言語とテストセットに応じて、単語誤り率(WER)は約8〜12%を達成します。主な特徴は、インドネシアの3つの言語学的に多様な言語をサポートし、地域のASRのための多用途なツールとなっていることです。オープンソースで、商用および研究目的で利用可能です。
💡ハイライト
- ├─3つのインドネシア言語にファインチューニング
- ├─オープンソース、250万+ダウンロード
- └─インドネシア語、ジャワ語、スンダ語対応
🎯対象
- ├─NLP研究者
- ├─ASR開発者
- └─インドネシア言語技術チーム