
rtk-ai/vox
📦 开源项目rtk-ai
高性能 Rust 工具包,实现低延迟、实时语音转文字 (STT) 与文字转语音 (TTS) 处理。
Vox 是一款兼具实验性与强大功能的工具包,旨在弥合复杂深度学习音频模型与生产级应用之间的鸿沟。它完全使用 Rust 编写,优先考虑性能和低延迟执行,这对于实时语音交互系统至关重要。该工具包为 STT 和 TTS 工作流提供了统一接口,抽象了模型推理和音频流管理的复杂性。核心特性包括高效的内存管理、对高吞吐量音频流水线的支持,以及模块化架构,使开发者能够以极小的开销切换或集成不同的模型后端。无论您是在构建语音助手、实时转录服务还是交互式智能体,Vox 都能提供处理大规模音频数据所需的底层控制与高层抽象。