indonesian-nlp/wav2vec2-indonesian-javanese-sundanese
🧠 AI 모델indonesian-nlp
인도네시아어, 자바어, 순다어에 미세 조정된 Wav2Vec2 ASR 모델.
이 모델은 Facebook의 wav2vec2-base를 기반으로 인도네시아어, 자바어, 순다어 음성의 결합 데이터셋에 미세 조정되었습니다. ASR을 위해 상단에 선형 레이어가 있는 Wav2Vec2 아키텍처를 사용합니다. 모델은 PyTorch와 Transformers 라이브러리를 사용하여 훈련되었습니다. 언어와 테스트 세트에 따라 약 8-12%의 단어 오류율(WER)을 달성합니다. 주요 특징으로는 인도네시아의 언어학적으로 다양한 세 가지 언어를 지원하여 지역 ASR을 위한 다목적 도구입니다. 오픈 소스이며 상업적 및 연구용으로 사용 가능합니다.
💡하이라이트
- ├─3개 인도네시아 언어에 미세 조정된 wav2vec2
- ├─오픈 소스, 250만+ 다운로드
- └─인도네시아어, 자바어, 순다어 지원
🎯대상
- ├─NLP 연구자
- ├─ASR 개발자
- └─인도네시아 언어 기술 팀