pyannote/speaker-diarization-community-1
🧠 Модель ИИpyannote
Точный конвейер диаризации дикторов для определения того, кто и когда говорил.
Эта модель использует конвейер, объединяющий обнаружение голосовой активности (VAD), обнаружение смены дикторов (SCD) и кластеризацию эмбеддингов дикторов. Она обрабатывает аудио, назначая каждый сегмент конкретному диктору. Модель является закрытой (gated), то есть для доступа требуется принятие лицензионных условий. Она построена на фреймворке pyannote-audio и широко используется в исследованиях и производстве для транскрипции совещаний, анализа звонков и индексации мультимедиа.
💡Основное
- ├─Более 2 млн загрузок
- ├─Модель с открытым кодом с ограниченным доступом
- └─Объединяет VAD, SCD и кластеризацию
🎯Для
- ├─Исследователи речи
- ├─аудиоинженеры
- └─разработчики систем транскрипции