crlandsc/torch-log-wmse

📦 开源项目crlandsc

专为音频源分离与降噪任务优化的 PyTorch 损失函数及质量评估指标。

torch-log-wmse 库提供了一种针对音频信号处理细微差别量身定制的复杂损失函数。与标准 MSE 相比，logWMSE 更好地处理了音频的动态范围和感知需求，为深度学习模型训练提供了更有效的梯度信号。该实现的一项关键创新是原生支持数字静音目标，这有助于模型在源分离任务中更有效地抑制背景噪声和伪影。该库基于 PyTorch 构建，确保了与现有的音频降噪、音乐源分离（MSS）和盲源分离（BSS）深度学习流水线的无缝集成。通过同时提供用于训练的损失函数和用于客观评估的指标，它成为了开发者提升音频输出感知质量的综合性实用工具。该实现针对 Python 环境进行了高度优化，适用于研究实验及生产级的音频处理流水线。

💡核心亮点

├─对数加权 MSE 损失函数实现
├─支持数字静音目标处理
└─针对 PyTorch 流水线深度优化

🎯适用人群

├─音频 AI 研究人员
└─机器学习工程师

🔗链接

└─GitHub 仓库