KBLab/wav2vec2-large-voxrex-swedish
🧠 AIモデルKBLab
VoxRexでファインチューニングされたスウェーデン語ASRモデル。Common Voiceで高精度を達成。
このモデルはFacebookのwav2vec2-largeをベースに、VoxRexデータセットを用いてスウェーデン語の自動音声認識に特化してファインチューニングされました。Transformerアーキテクチャを採用し、PyTorchとsafetensorsによる効率的な推論を実現。スウェーデン語の音韻的特徴に最適化され、Common Voiceベンチマークで高いワードエラー率改善を達成しています。主な特徴は、オープンソースでの提供、HuggingFace transformersライブラリとの互換性、自動音声認識パイプラインのサポートです。150万回以上ダウンロードされ、スウェーデン語の文字起こし、音声アシスタント、アクセシビリティツールなど実用的な用途に適しています。
💡ハイライト
- ├─Wav2Vec2 largeアーキテクチャ
- ├─VoxRexデータセットで学習
- └─HFで150万以上のダウンロード
🎯対象
- ├─スウェーデン語NLP研究者
- ├─音声テキスト変換開発者
- └─言語技術企業