KBLab/wav2vec2-large-voxrex-swedish
🧠 AI 모델KBLab
VoxRex 데이터셋으로 미세 조정된 스웨덴어 음성 인식 모델, Common Voice에서 높은 정확도 달성.
이 모델은 Facebook의 wav2vec2-large를 기반으로 VoxRex 데이터셋을 사용하여 스웨덴어 자동 음성 인식에 특화되도록 미세 조정되었습니다. Transformer 아키텍처와 PyTorch, safetensors를 사용하여 효율적인 추론을 가능하게 합니다. 스웨덴어 음성적 미묘함에 최적화되어 Common Voice 벤치마크에서 높은 단어 오류율 개선을 달성했습니다. 주요 특징으로는 오픈 소스 제공, HuggingFace transformers 라이브러리 호환성, 자동 음성 인식 파이프라인 지원이 있습니다. 150만 회 이상 다운로드되었으며 받아쓰기, 음성 비서, 스웨덴어 음성 접근성 도구 등 프로덕션 사용 사례에 적합합니다.
💡하이라이트
- ├─Wav2Vec2 large 아키텍처
- ├─VoxRex 데이터셋 미세 조정
- └─허깅페이스 150만+ 다운로드
🎯대상
- ├─스웨덴어 NLP 연구자
- ├─음성-텍스트 개발자
- └─언어 기술 기업
🔗링크
- └─허깅페이스 모델