
itrimble/AllInApp
📦 오픈 소스 프로젝트itrimble
음성 변환, LLM 스크립트 생성, 음성 복제를 활용해 팟캐스트 제작을 자동화하는 모듈형 파이썬 파이프라인입니다.
AllInApp은 자동화된 미디어 생성을 원하는 개발자를 위한 정교한 모듈형 툴킷입니다. 이 애플리케이션은 여러 최첨단 AI 모델을 결합하여 기존 팟캐스트 콘텐츠를 새로운 합성 에피소드로 변환합니다. 파이프라인은 Whisper.cpp를 통한 고성능 오디오 전사로 시작하여, spaCy를 활용한 의미론적 분석으로 핵심 내용을 추출합니다. GPT-Neo로 새로운 스크립트를 생성하고, Coqui TTS를 통해 사실적인 음성 복제를 구현합니다. 또한 Stable Diffusion을 사용하여 팟캐스트 커버 아트를 자동으로 생성합니다. 전체 워크플로우는 RSS 피드 발행까지 지원하며, 자율 콘텐츠 엔진을 구축하려는 제작자에게 강력한 템플릿이 됩니다. 모듈형 설계 덕분에 LLM이나 TTS 엔진 등 특정 구성 요소를 쉽게 교체할 수 있어, 맞춤형 AI 미디어 프로젝트를 위한 유연한 기반을 제공합니다.
💡하이라이트
- ├─엔드 투 엔드 팟캐스트 자동화
- ├─Whisper, GPT-Neo, TTS 통합
- └─자동 RSS 피드 생성 기능
🎯대상
- ├─AI 개발자
- └─콘텐츠 자동화 엔지니어