mlx-community/parakeet-tdt-0.6b-v3
🧠 AI Modelmlx-community
Высокопроизводительная и легкая модель распознавания речи, оптимизированная для Apple Silicon с помощью фреймворка MLX.
Модель parakeet-tdt-0.6b-v3 представляет собой специализированный порт архитектуры Parakeet Transducer-Decoder, адаптированный для фреймворка машинного обучения MLX. С 0,6 миллиардами параметров она достигает идеального баланса между размером и точностью транскрипции, что делает её отличным выбором для локального запуска на устройствах. Архитектура FastConformer объединяет преимущества трансформеров и сверточных сетей для эффективного захвата локального и глобального контекста аудиосигналов. Использование формата safetensors гарантирует безопасную и быструю загрузку весов. Реализация оптимизирована для чипов Apple Silicon (серии M), эффективно используя объединенную память и аппаратное ускорение для обеспечения высокой пропускной способности при распознавании речи в реальном времени. Это незаменимый инструмент для создания приватных офлайн-функций преобразования голоса в текст в экосистеме Apple.
💡Основное
- ├─FastConformer, 0.6 млрд параметров
- ├─Оптимизировано для Apple Silicon
- └─Высокоскоростной ASR-вывод
🎯Для
- ├─ИИ-разработчики
- └─Инженеры экосистемы Apple