FM Tone Transfer with Envelope Learning

Caspe, Franco; McPherson, Andrew; Sandler, Mark

计算机科学>声音

arXiv:2310.04811号（cs）

【于2023年10月7日提交】

标题：带信封学习的调频音频传输

作者：弗朗科·卡斯佩,安德鲁·麦克菲森,律师桑德勒

查看PDF

摘要：音调转换是一种新颖的深度学习技术，用于将声源与合成器连接，转换音频片段的音色，同时保留其音乐形式内容。由于其良好的音质效果和连续的可控制性，最近已应用于多个音频处理工具。尽管如此，它仍然存在一些与声音多样性差以及有限的瞬态和动态渲染有关的缺点，我们认为这阻碍了它在实时性能环境中进行发音和短语表达的可能性。
在这项工作中，我们讨论了当前用于控制乐器合成音频的音调传输架构，并讨论了它们在允许表现力表演方面的挑战。接下来，我们介绍了包络学习，这是一种设计音调转换架构的新方法，该架构使用综合参数级的训练目标映射音乐事件。我们的技术可以准确地呈现音符的开头和结尾，并适用于各种声音；这些是通过音调转换提高音乐清晰度、语法和声音多样性的基本步骤。最后，我们实现了一个用于实时实时使用的VST插件，并讨论了改进的可能性。

评论：	2023年大部分时间接受音频
学科：	声音（cs.SD）; 神经与进化计算（cs.NE）；音频和语音处理（eess.AS）；系统与控制
引用为：	arXiv:2310.04811号[cs.SD]
	（或 arXiv:2310.04811v1[cs.SD]对于此版本）
	https://doi.org/10.48550/arXiv.2310.04811

提交历史记录

发件人：Franco Caspe[查看电子邮件]
[第1版]2023年10月7日星期六14:03:25 UTC（907 KB）

计算机科学>声音

标题：带信封学习的调频音频传输

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>声音

标题：带信封学习的调频音频传输

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目