数学科学中的传播

第10卷(2012年)

编号1

大卫·利弗莫尔六十岁生日专刊

盲源分离中音乐噪声抑制的凸模型和L1最小化

页:223 – 238

内政部:https://dx.doi.org/10.4310/CMS.2012.v10.n1.a11

作者

马文业(洛杉矶加州大学数学系)

Stanley Osher(加州大学洛杉矶分校数学系)

Jack Xin(加州大学欧文分校数学系)

Meng Yu(加州大学欧文分校数学系)

摘要

盲源分离(BSS)方法是从多人环境中的混合语音中恢复或增强单个语音源的有用工具。一类有效的盲源分离方法是基于源信号傅里叶谱在时频(TF)域上的互斥假设,以及随后的数据聚类和分类。虽然这种方法很简单,但TF域中用于分类的不连续决策往往会导致时域恢复信号中的缺陷。这些缺陷被视为不愉快的铃声,即所谓的音乐噪音。为了进一步提高质量,需要进行后处理。本文基于时域稀疏滤波器的凸模型,提出了一种有效的音乐噪声抑制方法。稀疏滤波器旨在消除由于混合系数中的主要稀疏峰值或房间脉冲响应的早期到达和高能部分造成的干扰。该策略通过l1正则化和分裂Bregman方法有效地实现。通过合成和室内录音语音和音乐数据的评估表明,我们的方法在客观和主观方面都优于现有的音乐降噪方法。我们的方法也可以用作更通用和最新版本的TF域BSS方法的后处理工具。

关键词

盲源分离、时频域、音乐噪声、凸模型、时域稀疏滤波器、l1最小化、分裂Bregman方法

2010年数学学科分类

65K10、68T05、90C25

2011年10月14日出版