jonatasgrosman/wav2vec2-large-xlsr-53-polish
🧠 AI 모델jonatasgrosman
3백만 회 이상 다운로드된 최첨단 폴란드어 음성 인식 모델.
Facebook의 wav2vec2-large-xlsr-53을 기반으로, 53개 언어로 사전 학습되고 폴란드어 Common Voice 6.0으로 미세 조정되었습니다. 문자 수준 전사를 위해 선형 헤드가 있는 Wav2Vec2ForCTC를 사용합니다. 16kHz 샘플링, PyTorch, JAX 및 HuggingFace Transformers를 지원합니다. HF ASR 리더보드에서 높은 순위를 차지했습니다.
💡하이라이트
- ├─300만+ 다운로드
- ├─Common Voice 6.0 폴란드어 미세 조정
- └─Wav2Vec2 large 아키텍처
🎯대상
- ├─NLP 연구자
- ├─음성 인식 개발자
- └─폴란드어 AI 애호가