mlx-community/parakeet-tdt-0.6b-v3
🧠 AI 모델mlx-community
Apple Silicon에 최적화된 고성능 경량 음성 인식(STT) 모델입니다.
parakeet-tdt-0.6b-v3 모델은 MLX 머신러닝 프레임워크에 맞춰 특별히 조정된 Parakeet Transducer-Decoder 아키텍처의 특수 포트입니다. 6억 개의 파라미터를 가진 이 모델은 모델 크기와 전사 정확도 사이의 이상적인 균형을 유지하여 온디바이스 배포에 매우 적합합니다. 이 모델은 트랜스포머와 컨볼루션의 강점을 결합한 FastConformer 아키텍처를 사용하여 오디오 신호의 로컬 및 글로벌 컨텍스트를 효율적으로 포착합니다. safetensors 형식을 사용하여 모델 가중치를 안전하고 빠르게 로드할 수 있습니다. 이 구현은 Apple Silicon(M 시리즈 칩)에 최적화되어 있으며, 통합 메모리와 하드웨어 가속을 활용하여 실시간 음성 인식 작업 중 높은 처리량을 달성합니다. 이는 네이티브 Apple 생태계 애플리케이션에서 개인정보 보호 중심의 오프라인 음성 텍스트 변환 기능을 구현하려는 개발자에게 필수적인 도구입니다.
💡하이라이트
- ├─6억 파라미터 FastConformer
- ├─Apple Silicon 최적화
- └─고속 ASR 추론 성능
🎯대상
- ├─AI 개발자
- └─Apple 생태계 엔지니어