
crlandsc/torch-log-wmse
📦 开源项目crlandsc
专为音频源分离与降噪任务优化的 PyTorch 损失函数及质量评估指标。
torch-log-wmse 库提供了一种针对音频信号处理细微差别量身定制的复杂损失函数。与标准 MSE 相比,logWMSE 更好地处理了音频的动态范围和感知需求,为深度学习模型训练提供了更有效的梯度信号。该实现的一项关键创新是原生支持数字静音目标,这有助于模型在源分离任务中更有效地抑制背景噪声和伪影。该库基于 PyTorch 构建,确保了与现有的音频降噪、音乐源分离(MSS)和盲源分离(BSS)深度学习流水线的无缝集成。通过同时提供用于训练的损失函数和用于客观评估的指标,它成为了开发者提升音频输出感知质量的综合性实用工具。该实现针对 Python 环境进行了高度优化,适用于研究实验及生产级的音频处理流水线。