计算机科学>声音
标题: 带信封学习的调频音频传输
摘要: 音调转换是一种新颖的深度学习技术,用于将声源与合成器连接,转换音频片段的音色,同时保留其音乐形式内容。 由于其良好的音质效果和连续的可控制性,最近已应用于多个音频处理工具。 尽管如此,它仍然存在一些与声音多样性差以及有限的瞬态和动态渲染有关的缺点,我们认为这阻碍了它在实时性能环境中进行发音和短语表达的可能性。 在这项工作中,我们讨论了当前用于控制乐器合成音频的音调传输架构,并讨论了它们在允许表现力表演方面的挑战。 接下来,我们介绍了包络学习,这是一种设计音调转换架构的新方法,该架构使用综合参数级的训练目标映射音乐事件。 我们的技术可以准确地呈现音符的开头和结尾,并适用于各种声音; 这些是通过音调转换提高音乐清晰度、语法和声音多样性的基本步骤。 最后,我们实现了一个用于实时实时使用的VST插件,并讨论了改进的可能性。