跳到主要内容
研究论文

多人工词典的快速匹配追踪

出版:2021年6月26日 出版历史
  • 获取引文提醒
  • 摘要

    找到最好的K(K)-冗余字典中信号的稀疏近似是一个NP-hard问题。此任务通常使用次优贪婪匹配追踪算法。在这项工作中,我们提出了一种加速技术和作用于多Gabor字典的匹配追踪算法的实现,即多个Gabor型时频字典的串联,每个Gabor类型的时频字典由可能不同窗口的平移和调制以及时频移参数组成。该技术基于预计算和阈值化原子之间的内积,并基于直接更新系数域中的残差,即无需往返信号域。由于所提出的加速技术包含一个近似的更新步骤,因此我们提供了理论和实验结果来说明所得到的算法的收敛性。该实现是用C语言编写的(与C99和C++11兼容),我们还提供了Matlab和GNU Octave接口。对于某些设置,实现速度比标准匹配追踪工具包快70倍。

    工具书类

    [1]
    P.巴拉兹。2008.框架和有限维度:框架变换、分类和算法。应用数学科学2,41–44(2008),2131–2144。
    [2]
    G.Bhattacharya和P.Depalle。2014.通过贪婪的时频收缩对音频进行稀疏去噪。程序中。IEEE声学、语音和信号处理国际协调会(ICASSP’14)。2898–2902.
    [3]
    T.Blumensath和M.E.Davies。2008年。非线性稀疏信号建模的梯度追踪。程序中。欧洲信号处理会议(EUSIPCO’08)。IEEE,1-5。
    [4]
    T.Blumensath和M.E.Davies。2008年。梯度追求。IEEE信号处理学报56,6(2008),2370–2382。
    [5]
    G.Chardon、T.Necciari和P.Balazs。2014年,使用Gabor字典和时频掩蔽进行感性匹配。程序中。IEEE声学、语音和信号处理国际协调会(ICASSP’14)。3102–3106.
    [6]
    L.多德。2006.利用分子匹配追踪对信号进行稀疏和结构化分解。IEEE音频、语音和语言处理汇刊14,5(2006年9月),1808-1816。
    [7]
    L.多德。2010.并行音频稀疏分解:让贪婪共享!IEEE信号处理杂志27,2(2010年3月),90-96。
    [8]
    G.Davis、S.Mallat和M.Avellaneda。1997.自适应贪婪近似。构造近似13,1(1997),57–98。
    [9]
    G.M.Davis、S.G.Mallat和Z.Zhang。1994.自适应时频分解。光学工程33,7(1994),2183–2191。
    [10]
    O.德里安。2007.多尺度Gabor分析音频信号的时间尺度。程序中。国际会议数字音频效果(DAFx’07)。法国波尔多。
    [11]
    R.A.DeVore和V.N.Temlyakov。1996.关于贪婪算法的一些评论。计算数学进展5,1(1996年12月),173-187。
    [12]
    P.杜尔卡。2007年,脑电图分析中的匹配追踪与统一。Artech House,Inc.184页。
    [13]
    S.E.Ferrando、L.A.Kolasa和N.Kovačević。2002.算法820:区间上Gabor函数的匹配追踪的灵活实现。ACM数学软件汇刊28,3(2002年9月),337-353。
    [14]
    M.Frigo和S.G.Johnson。2005年。FFTW3的设计和实施。IEEE 93会议记录,2(2005),216–231。关于“程序生成、优化和平台适配”的特刊
    [15]
    R.Gribonval。2001.使用多尺度高斯啁啾字典进行快速匹配追踪。IEEE信号处理汇刊49,5(2001年5月),994–1001。
    [16]
    R.Gribonval。2002.使用匹配追踪对立体声信号进行稀疏分解,并应用于从立体声混合中盲分离两个以上的源。IEEE国际协调声学、语音和信号处理,第3卷。III-3057-III-3060。
    [17]
    R.Gribonval、P.Depalle、X.Rodet、E.Bacry和S.Mallat。1996年。使用高分辨率匹配追踪进行声音信号分解。程序中。国际计算机音乐会议(ICMC’96)。293–296.
    [18]
    R.Gribonval、R.M.Figueras i Ventura和P.Vandergheynst。2006.检查稀疏信号近似最佳性的简单测试。信号处理86,3(2006),496–510。
    [19]
    R.Gribonval和P.Vandergheynst。准非相干词典中匹配追踪的指数收敛性。IEEE信息理论汇刊52,1(2006年1月),255-261。
    [20]
    K.Gröchenig。2001.时频分析基础。伯卡用户,波士顿,巴塞尔,柏林。
    [21]
    S.Krstulović和R.Gribonval。2006年,MPTK:配对追击变得顺从。程序中。声学、语音和信号处理国际委员会(ICASSP’06),第3卷。III–496–III–499。
    [22]
    H.Lahdili、H.Najaf-Zadeh、R.Pichevar和L.Thibault。2008年,音频编码的感性匹配追求。在音频工程学会第124号公约中。
    [23]
    J.Le Roux、H.Kameoka、N.Ono和S.Sagayama。2010.基于谱图一致性的幅度STFT谱图的快速信号重建。程序中。第13届国际数字音频效果会议(DAFx'10)。397–403.
    [24]
    P.Leveau和L.Daudet。2006.改进匹配追踪的多分辨率部分跟踪。程序中。第14届欧洲信号处理会议。1–4.
    [25]
    B.Mailhé、R.Gribonval、F.Bimbot和P.Vandergheynst。2009.一种低复杂度正交匹配追踪,用于稀疏信号近似,带有位移-变字典。程序中。IEEE声学、语音和信号处理国际会议(ICAASP’09)。3445–3448.
    [26]
    B.Mailhé、R.Gribonval、P.Vandergheynst和F.Bimbot。2011.基于局部字典的快速正交稀疏近似算法。信号处理91,12(2011),2822–2835。
    [27]
    S.马拉特。2008年,《信号处理的小波之旅:稀疏方法》(第三版)。学术出版社。
    [28]
    S.G.Mallat和Z.Zhang。1993年,用时频字典匹配追踪。IEEE信号处理汇刊41,12(1993年12月),3397–3415。
    [29]
    Y.C.Pati、R.Rezaiifar和P.S.Krishnaprasad。1993。正交匹配追踪:递归函数逼近及其在小波分解中的应用。程序中。第27届信号、系统和计算机Asilomar会议。40–44,第1卷。
    [30]
    M.D.Plumbley、T.Blumensath、L.Daudet、R.Gribonval和M.E.Davies。2010.音频和音乐中的稀疏表示:从编码到源分离。IEEE 98会议记录,6(2010年6月),995–1005。
    [31]
    M.R.波特诺夫。1976年。使用快速傅里叶变换实现数字相位声码器。IEEE声学、语音和信号处理汇刊24,3(1976年6月),243-248。
    [32]
    Z.Průša、P.L.Söndergaard、N.Holighaus、Ch.Wiesmeyr和P.Balazs。2014年,大型时频分析工具箱2.0。在声音、音乐和运动方面。施普林格国际出版公司,419–442。
    [33]
    G.Rath和C.Guillemot。2008.用于稀疏近似的互补匹配追踪算法。程序中。第16届欧洲信号处理会议(EUSIPCO’08)。1–5.
    [34]
    G.Rath和Ch.Guillemot。2010年。关于互补匹配追踪的简单推导。信号处理90,2(2010),702–706。
    [35]
    E.Ravelli、G.Richard和L.Daudet。2008.用于音频编码的MDCT基础的联盟。IEEE音频、语音和语言处理汇刊16,8(2008年11月),1361-1372。
    [36]
    L.Rebollo-Neira、M.Rozloíník和P.Sasmal。2017.分析正交匹配追踪贪婪策略的低内存实现。CoRR abs/1609.00053v2。
    [37]
    I.Rish和G.Grabarnik。2015年,《稀疏建模:理论、算法和应用》。CRC出版社。253页。
    [38]
    P.L.Söndergaard先生。2012.具有长FIR窗口的离散Gabor变换的高效算法。《傅里叶分析与应用杂志》18,3(2012),456–470。
    [39]
    P.L.Söndergaard、B.Torrésani和P.Balazs。2012.线性时频分析工具箱。国际小波杂志,多分辨率分析和信息处理10,4(2012),1-27。
    [40]
    B.L.斯特姆。2009。稀疏近似和原子分解:在评估和构建信号表示时考虑原子相互作用。博士论文。加利福尼亚大学。
    [41]
    B.L.Sturm和M.G.Christensen。2010.多尺度时频字典的循环匹配追踪。第四十四届阿西洛玛信号、系统和计算机会议记录。581–585.
    [42]
    B.L.Sturm、M.G.Christensen和R.Gribonval。2011.用于恢复压缩采样稀疏信号的循环纯贪婪算法。第45届亚西洛马信号、系统和计算机会议记录。IEEE,1143–1147。
    [43]
    B.L.Sturm、L.Daudet和C.Roads。2006.使用稀疏原子近似的俯仰-移位音频信号。程序中。第一届ACM多媒体音频和音乐计算研讨会(AMCMM’06)。ACM,纽约州纽约市,45-52。
    [44]
    B.L.Sturm和J.D.Gibson。2006.使用多个字典对非噪声语音信号进行匹配追踪分解。程序中。IEEE声学语音和信号处理国际会议,第3卷。III–III类。
    [45]
    欧洲广播联盟。2008.Tech 3253:主观测试的声音质量评估材料记录。技术报告。日内瓦。https://tech.ebu.ch/docs/tech/tech3253.pdf。
    [46]
    M.Yaghoobi和M.E.Davies。2009年,《快速和可扩展:稀疏近似方法综述》。技术报告。爱丁堡大学。
    [47]
    D.桑塔利斯。2016.引导匹配追踪及其在声源分离中的应用。博士论文。约克大学。

    引用人

    查看全部

    建议

    评论

    信息和贡献者

    问询处

    发布时间

    数学软件上的封面图像ACM事务
    ACM数学软件汇刊 第47卷第3期
    2021年9月
    251页
    国际标准编号:0098-3500
    EISSN公司:1557-7295
    内政部:10.1145/3472960
    期刊目录
    如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    出版:2021年6月26日
    认可的:2021年1月1日
    修订过的:2021年1月1日
    收到:2020年5月1日
    在TOMS中发布体积47,问题

    权限

    请求对此文章的权限。

    检查更新

    作者标记

    1. 加博词典
    2. 贪婪近似
    3. 匹配追击
    4. 短时傅里叶变换
    5. 时频

    限定符

    • 研究文章
    • 研究
    • 推荐

    资金来源

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 下载次数(过去12个月)22
    • 下载次数(最近6周)2

    其他指标

    引文

    引用人

    查看全部

    视图选项

    获取访问权限

    登录选项

    完全访问权限

    查看选项

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    HTML格式格式

    在中查看本文HTML格式格式。

    HTML格式

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享