×

一种字典学习算法,用于按预设顺序压缩和重建流数据。 (英语) Zbl 1524.68330号

摘要:在过去十年中,开发和应用字典学习(DL)来处理大量数据集的兴趣正在兴起。然而,其中许多工作都集中在使用DL压缩和提取数据中的一组重要特征上,同时考虑从该组中恢复原始数据是次要目标。另一方面,尽管有几种方法能够通过在新的快照经过时递增地更新字典来处理流数据,但这些算法中的大多数都是针对从概率分布中随机抽取快照的设置而设计的。在本文中,我们提出了一种新的DL方法来实时压缩和消除海量数据集的噪声,在这种方法中,数据是按照预先设定的顺序流式传输的(实例是视频和时间实验数据),因此在任何时候,我们都只能观察到整个数据的有偏样本集。我们的方法以相对简单的方式递增地构建字典:如果当前字典充分解释了新快照,我们将执行稀疏编码以找到其稀疏表示;否则,我们将新快照添加到字典中,并使用Gram-Schmidt过程来保持正交性。为了对噪声数据集进行压缩和去噪,我们在稀疏编码之前直接对快照进行去噪,这与传统的通过稀疏编码实现去噪的字典学习方法不同。与全批矩阵分解方法(其中整个数据保存在内存中)和其他微备份方法(其中通常假设无偏采样)相比,我们的方法在数据采样和存储方面的要求最低:i)每个快照只看到一次,然后被丢弃,ii)快照是按预设顺序绘制的,所以可能会有很大的偏见。通过对气候模拟和扫描透射电子显微镜(STEM)数据的实验,我们证明了该方法在数据重建和去噪方面具有竞争力。

MSC公司:

68T09号 数据分析和大数据的计算方面
15A23型 矩阵的因式分解
68页30 编码和信息理论(压缩、压缩、通信模型、编码方案等)(计算机科学方面)
68T05型 人工智能中的学习和自适应系统
68周27 在线算法;流式算法
第94页第16页 数据分析和大数据的信息方面
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 亚哈龙先生;M.Elad,《使用图像签名字典对图像内容进行稀疏和冗余建模》,SIAM J.Imaging Sci。,1, 228-247 (2008) ·Zbl 1182.68337号 ·doi:10.1137/07070156X
[2] 亚哈龙先生;M.Elad;A.Bruckstein,K-SVD:设计稀疏表示超完备字典的算法,IEEE Trans。信号处理。,54, 4311-4322 (2006) ·兹比尔1375.94040 ·doi:10.1109/TSP.2006.881199
[3] A.Chambolle,《总变异最小化算法及其应用》,J.Math。成像视觉,20,89-97(2004)·Zbl 1366.94048号
[4] K.Degraux、U.S.Kamilov、P.T.Boufounos和D.Liu,多模态成像的在线卷积字典学习2017 IEEE国际图像处理会议(ICIP), (2017), 1617-1621.
[5] M.Elad;M.Aharon,通过学习词典上的稀疏和冗余表示进行图像去噪,IEEE Transactions Image Processing,153736-3745(2006)·doi:10.1109/TIP.2006.881969
[6] J.Galewsky;R.K.Scott;L.M.Polvani,用于测试全球浅水方程数值模型的初始值问题,Tellus A:动态气象学和海洋学,56,429-440(2004)·doi:10.3402/tellusa.v56i5.14436
[7] P.Getreuer,Rudin-osher-fatemi使用分裂bregman的全变差去噪,在线图像处理,274-95(2012)·doi:10.5201/ipol.2012.g-tvd
[8] S.Ghosh;A.Choquette;5月底;M.P.Oxley;A.R.卢皮尼;S.T.Pantelides公司;A.Y.Borisevich,识别工程磁性氧化物超晶格中的新型极性畸变模式,显微镜和微观分析,231590-1591(2017)·doi:10.1017/S1431927617008613
[9] R.Jenatton、G.Obozinski和F.Bach,结构化稀疏主成分分析,in第十三届国际人工智能与统计会议记录(编辑Y.W.Teh和M.Titterington),机器学习研究论文集第9卷,JMLR研讨会和会议论文集,意大利撒丁岛恰拉古纳度假村,(2010),366-373,http://proceedings.mlr.press/v9/jenatton10a.html。
[10] S.P.Kasiviswanathan、H.Wang、A.Banerjee和P.Melville,在线l1-字典学习及其在新文档检测中的应用,神经信息处理系统研究进展, 2258-2266.
[11] J.Liu;C.加西亚·卡多纳;B.沃尔伯格;尹伟,在线卷积字典学习的一阶和二阶方法,SIAM J.成像科学。,11, 1589-1628 (2018) ·Zbl 1401.94019号 ·doi:10.137/17M1145689
[12] C.Lu、J.Shi和J.Jia,在线健壮词典学习2013年IEEE计算机视觉和模式识别会议, (2013), 415-422.
[13] J.Mairal;巴赫;J.Ponce,任务驱动词典学习,IEEE Trans。模式分析。机器。英特尔。,34, 791-804 (2012)
[14] J.Mairal、F.Bach、J.Ponce和G.Sapiro,稀疏编码在线词典学习,in第26届国际机器学习年会论文集, (2009), 689-696. ·Zbl 1242.62087号
[15] A.门施;J.Mairal;B.口渴;G.Varoquaux,大规模矩阵分解的字典学习,第33届国际机器学习大会(ICML)论文集,4811737-1746(2016)
[16] R.D.Nair;S.J.Thomas;R.D.Loft,立方球体上的不连续伽辽金输运方案,《月度天气评论》,133814-828(2005)·doi:10.1175/MWR2890.1
[17] B.A.Olshausen;D.J.Field,《基集过完备的稀疏编码:v1?采用的策略》?,视觉研究,37,3311-3325(1997)·doi:10.1016/S0042-6989(97)00169-7
[18] F.佩德雷戈萨;G.Varoquaux;A.格兰福特;V.Michel;B.Thirion公司;O.格栅;布隆德尔;P.普雷滕霍弗;R.Weiss;V.Dubourg;J.Vanderplas;A.帕索斯;D.库纳帕;M.Brucher;M.Perrot;E.Duchesnay,Scikit-learn:Python中的机器学习,J.Mach。学习。第122825-2830号决议(2011年)·Zbl 1280.68189号
[19] D.A.Ross;J.Lim;R.-S.林;M.-H.Yang,鲁棒视觉跟踪的增量学习,国际计算机视觉杂志,77,125-141(2008)·doi:10.1007/s11263-007-0075-7
[20] R.Rubinstein;A.M.Bruckstein;M.Elad,《稀疏表示建模词典》,IEEE学报,981045-1057(2010)
[21] K.Slavakis和G.B.Giannakis,使用加速随机近似算法从大数据中在线字典学习,in2014 IEEE声学、语音和信号处理国际会议(ICASSP), (2014), 16-20.
[22] Z.Szabó,B.Póczos和A.Lörincz,在线群组结构词典学习,in2011年CVPR, (2011), 2865-2872.
[23] 一、托西奇;P.Frossard,字典学习,IEEE信号处理杂志,28,27-38(2011)·doi:10.1109/MSP.2010.939537
[24] T.H.Vu;V.Monga,用于图像分类的快速低阶共享字典学习,IEEE Trans。图像处理。,26, 5160-5175 (2017) ·Zbl 1409.94599号 ·doi:10.1109/TIP.2017.2729885
[25] Y.Xu;尹文华,一种快速的全图像修补方法,逆问题。成像,10563-583(2016)·Zbl 1395.94071号 ·doi:10.3934/ipi.2016012
[26] S.Zhang,S.Kasiviswanathan,P.C.Yuen和M.Harandi,对称正定流形上的在线词典学习与视觉应用,人工智能(AAAI)会议记录, 3165-3173.
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。