sekift/so-vits-models

📦 오픈소스 프로젝트sekift

음성 클로닝, TTS, 이미지 생성, LLM을 위한 AI 모델 큐레이션 모음

sekift/so-vits-models는 여러 모달리티에 걸친 다양한 사전 학습 AI 모델과 애플리케이션을 커뮤니티가 큐레이션한 저장소입니다. 노래 음성 변환 및 음성 클로닝을 위한 so-vits-svc, 음성 합성용 TTS 시스템, 이미지 생성을 위한 Stable Diffusion 체크포인트와 LoRA, ChatGPT 기반 도구 등 주목할 만한 LLM을 포함합니다. 이 저장소는 중앙 집중식 리소스 디렉토리 역할을 하여 AI 실무자가 음성 합성, 음성 변환부터 텍스트 생성 및 시각 콘텐츠 제작에 이르는 작업을 위한 모델을 더 쉽게 발견하고 접근할 수 있도록 합니다. 209개의 스타와 29개의 포크를 보유하여 멀티모달 애플리케이션에 종사하는 중국 AI 커뮤니티의 관심을 끌고 있습니다. 텍스트, 음성, 이미지, 비디오 관련 모델을 다루어 다양한 영역에서 생성형 AI를 탐색하는 개발자를 위한 다재다능한 시작점이 됩니다.

💡하이라이트

├─so-vits-svc 기반 음성 클로닝 큐레이션
├─TTS 및 Stable Diffusion 모델 포함
└─텍스트·음성·이미지·비디오 멀티모달

🎯대상

├─AI/ML 개발자
├─음성 클로닝 애호가
└─생성형 AI 연구자

🔗링크

└─GitHub 저장소