pyannote/speaker-diarization-community-1

🧠 Модель ИИpyannote

Точный конвейер диаризации дикторов для определения того, кто и когда говорил.

Эта модель использует конвейер, объединяющий обнаружение голосовой активности (VAD), обнаружение смены дикторов (SCD) и кластеризацию эмбеддингов дикторов. Она обрабатывает аудио, назначая каждый сегмент конкретному диктору. Модель является закрытой (gated), то есть для доступа требуется принятие лицензионных условий. Она построена на фреймворке pyannote-audio и широко используется в исследованиях и производстве для транскрипции совещаний, анализа звонков и индексации мультимедиа.

💡Основное

├─Более 2 млн загрузок
├─Модель с открытым кодом с ограниченным доступом
└─Объединяет VAD, SCD и кластеризацию

🎯Для

├─Исследователи речи
├─аудиоинженеры
└─разработчики систем транскрипции

🔗Ссылки

└─Модель на HuggingFace