Differentiable Modelling of Percussive Audio with Transient and Spectral Synthesis

Shier, Jordie; Caspe, Franco; Robertson, Andrew; Sandler, Mark; Saitis, Charalampos; McPherson, Andrew

计算机科学>声音

arXiv:2309.06649（cs）

【于2023年9月13日提交】

标题：基于瞬态和谱合成的冲击音微分模型

作者：乔迪·谢尔,弗朗科·卡斯佩,安德鲁·罗伯逊,律师桑德勒,夏拉兰波斯赛提斯,安德鲁·麦克菲森

查看PDF

摘要：近年来，包括音频合成方法在内的可微分数字信号处理（DDSP）技术受到了关注，并有助于在参数空间中进行解释。然而，目前的可微分合成方法并没有明确地寻求对信号的瞬态部分进行建模，这对于敲击声很重要。在这项工作中，我们提出了一个统一的综合框架，旨在解决DDSP框架内的瞬态生成和冲击合成问题。为此，我们提出一个冲击合成模型，该模型建立在正弦建模合成的基础上，并包含用于瞬态生成的调制时间卷积网络。我们使用一种改进的正弦峰值拾取算法来生成时变非谐波正弦，并将其与可微分噪声和瞬态编码器配对，这些编码器经过联合训练来重建鼓声。我们使用声学和电子打击样本的大型数据集计算了一组重建指标，这表明我们的方法能够改进膜乐器的起始信号重建。

评论：	将于2023年9月在意大利都灵的《声学论坛论文集》上发表
学科：	声音（cs.SD）; 音频和语音处理（eess.AS）
引用为：	arXiv:2309.06649[cs.SD]
	（或 arXiv:2309.06649v1[cs.SD]对于此版本）
	https://doi.org/10.48550/arXiv.2309.06649

提交历史记录

发件人：Jordie Shier[查看电子邮件]
[第1版]2023年9月13日星期三00:21:04 UTC（555 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

反恐精英。标准偏差

<上一版本 | 下一个>

新的 | 最近的 |2023-09

更改为浏览方式：

反恐精英
应急设备
电子设备。AS公司

参考文献和引文

导出BibTeX引文

计算机科学>声音

标题：基于瞬态和谱合成的冲击音微分模型

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>声音

标题：基于瞬态和谱合成的冲击音微分模型

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目