
itrimble/AllInApp
📦 开源项目itrimble
一个模块化的 Python 管道,利用转录、LLM 脚本生成和语音克隆实现播客制作自动化。
AllInApp 为对自动化媒体生成感兴趣的开发者提供了一个复杂且模块化的工具包。该应用程序的核心在于编排多种先进的 AI 模型,将现有的播客内容转化为全新的合成剧集。流水线始于通过 Whisper.cpp 进行的高性能音频转录,随后使用 spaCy 进行语义分析以提取核心要点。脚本生成利用 GPT-Neo 合成新内容,并通过 Coqui TTS 进行逼真的语音克隆。此外,该应用还包含一个自动视觉组件,利用 Stable Diffusion 生成播客封面图。整个工作流封装在符合 RSS 标准的结构中,使其成为构建自主内容引擎的强大模板。其模块化设计允许用户替换特定组件(例如更换 LLM 或 TTS 引擎),为自定义 AI 媒体项目提供了高度灵活的基础。