计算机科学>声音
标题: 基于瞬态和谱合成的冲击音微分模型
摘要: 近年来,包括音频合成方法在内的可微分数字信号处理(DDSP)技术受到了关注,并有助于在参数空间中进行解释。 然而,目前的可微分合成方法并没有明确地寻求对信号的瞬态部分进行建模,这对于敲击声很重要。 在这项工作中,我们提出了一个统一的综合框架,旨在解决DDSP框架内的瞬态生成和冲击合成问题。为此,我们提出一个冲击合成模型,该模型建立在正弦建模合成的基础上,并包含用于瞬态生成的调制时间卷积网络。 我们使用一种改进的正弦峰值拾取算法来生成时变非谐波正弦,并将其与可微分噪声和瞬态编码器配对,这些编码器经过联合训练来重建鼓声。 我们使用声学和电子打击样本的大型数据集计算了一组重建指标,这表明我们的方法能够改进膜乐器的起始信号重建。