openai/whisper-large-v3-turbo
🧠 AI 模型openai
快速且准确的多语言语音识别,专为生产环境优化。
Whisper-large-v3-turbo 是 OpenAI Whisper large-v3 的蒸馏变体,在保持高准确率的同时针对速度进行了微调,支持99种语言。它采用了基于 Transformer 的编码器-解码器架构,参数量为809M。关键创新包括从更大模型进行知识蒸馏和整数量化以实现高效推理。它支持多种音频格式,在常见基准测试中达到了业界领先的性能。该模型在 Hugging Face 上可用,下载量超过570万,点赞数超过3000,是实时转录、语音助手和多语言 ASR 应用的首选。
💡核心亮点
- ├─从 Whisper large-v3 蒸馏,速度提升8倍
- ├─支持99种语言
- └─采用 MIT 开源许可
🎯适用人群
- ├─开发者
- ├─研究人员
- └─语音识别从业者