jonatasgrosman/wav2vec2-large-xlsr-53-greek

🧠 AI 모델jonatasgrosman

그리스어 자동 음성 인식을 위한 미세 조정된 wav2vec2 모델.

이 모델은 Facebook의 wav2vec2-large-xlsr-53을 그리스어 음성 인식에 맞게 미세 조정한 버전입니다. XLSR Fine-Tuning Week의 일환으로 만들어졌으며, 다국어 사전 학습 모델의 전이 학습을 활용합니다. 모델은 transformer 기반 인코더를 사용하여 원시 오디오 파형을 처리하는 wav2vec2 아키텍처를 사용합니다. 언어 모델이나 사전 없이 그리스어로 된 전사를 출력합니다. 학습 데이터는 크라우드소싱 음성 데이터셋인 Common Voice에서 가져왔습니다. 주요 기술 세부 사항: 24층 transformer, 16개의 어텐션 헤드, 은닉 크기 1024를 사용합니다. 모델은 PyTorch와 JAX로 구현되어 훈련과 추론을 모두 지원합니다.

💡하이라이트

├─그리스어용 미세 조정 wav2vec2
├─XLSR Fine-Tuning Week 참여
└─HuggingFace 230만 다운로드

🎯대상

├─그리스어 ASR 개발자
├─음성 인식 연구자
└─오픈소스 ML 커뮤니티

🔗링크

└─HuggingFace 모델 페이지