openai/whisper-large-v3-turbo
🧠 ИИ-модельopenai
Быстрое и точное многоязычное распознавание речи, оптимизированное для продакшена.
Whisper-large-v3-turbo — это дистиллированный вариант модели Whisper large-v3 от OpenAI, доработанный для увеличения скорости при сохранении высокой точности на 99 языках. Архитектура основана на трансформере типа encoder-decoder с 809 миллионами параметров. Ключевые инновации включают дистилляцию знаний из более крупной модели и целочисленную квантизацию для эффективного выполнения. Модель поддерживает различные аудиоформаты и достигает современного уровня производительности на стандартных бенчмарках. Доступна на Hugging Face с более чем 5,7 миллиона загрузок и 3000 лайков, что делает её популярным выбором для транскрипции в реальном времени, голосовых ассистентов и многоязычных ASR-приложений.
💡Основное
- ├─Дистиллирован из Whisper large-v3, в 8 раз быстрее
- ├─Поддерживает 99 языков
- └─Открытый исходный код, лицензия MIT
🎯Для
- ├─Разработчики
- ├─Исследователи
- └─Специалисты по распознаванию речи