×

矩阵分解中的失配问题。 (英语) Zbl 07465778号

摘要:现实环境中的数据收集可能会受到一些因素的影响,例如数据记录器故障和通信错误,在此期间没有收集数据。因此,在分析和处理此类数据时,需要使用适当的工具来处理缺失的值。这个问题通常通过矩阵分解来解决。虽然它已成功应用于广泛的应用领域,但在这项工作中,我们报告了一个在文献中被忽视的问题,并“退化”了多元时间序列中通过矩阵分解获得的插补的质量(具有平滑演化)。简言之,问题在于矩阵分解结果的错位:缺失值插补落在不正确的值范围内,观测值和插补值之间的转换并不平滑。我们通过提出后处理对齐策略来解决这个问题。根据我们的实验,后处理调整大大提高了输入的准确性(当发生错位时)。此外,研究结果还表明,由于缺乏泛化能力,在处理少量时间序列时,偏差大多发生。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Acar,E。;邓拉维,DM;科尔达,TG;Mörup,M.,《不完全数据的可缩放张量因子分解》,化学计量学和智能实验室系统,106,1,41-56(2011)·doi:10.1016/j.chemolab.2010.08.004
[2] Azur,MJ;EA斯图亚特;弗朗加基斯,C。;Leaf,PJ,通过链式方程进行多重插补:它是什么?它是如何工作的?,国际精神病学研究方法杂志,20,1,40-49(2011)·doi:10.1002/mpr.329
[3] 巴尔扎诺,L。;Chi,Y。;Lu,YM,流式主成分分析和子空间跟踪:缺失数据案例,IEEE学报,106,8,1293-1310(2018)·doi:10.1109/JPROC.2018.2847041
[4] Banerjee,S.和Roy,A.(2014年)。统计学中的线性代数和矩阵分析。CRC出版社·Zbl 1309.15002号
[5] 鲍,Y。;方,H。;Zhang,J.,Topicmf:同时利用评级和评论进行推荐,AAAI,14,2-8(2014)
[6] 蔡,JF;坎迪斯,EJ;Shen,Z.,矩阵补全的奇异值阈值算法,SIAM优化杂志,20,41956-1982(2010)·兹比尔1201.90155 ·doi:10.1137/080738970
[7] 曹伟(Cao,W。英国:时间序列的双向递归插补。《神经信息处理系统进展》(第6775-6785页)。
[8] Che,Z。;Purushotham,S。;Cho,K。;桑塔格,D。;Liu,Y.,带缺失值的多元时间序列的递归神经网络,科学报告,8,1,1-12(2018)
[9] Chen,G.、Liu,X.Y.、。,Kong,L.,Lu,J.L.,Gu,Y.,Shu,W.,&Wu,M.Y.(2013)。无线传感器网络中基于多属性的数据恢复。2013年IEEE全球通信会议(GLOBECOM)(第103-108页)。电气与电子工程师协会。
[10] Chen,X.和Sun,L.(2020年)。多元时间序列预测的低秩自回归张量补全。2006.10436
[11] Chen,X.、Chen,Y.和He,Z.(2018)。中国广州城市交通速度数据集。doi:10.5281/zenodo.1205229。
[12] Cichocki,A。;Phan,AH,大规模非负矩阵和张量分解的快速局部算法,电子、通信和计算机科学基础IEICE汇刊,92,3,708-721(2009)·doi:10.1587/transfun。E92.A.708型
[13] Cui,Z.、Ke,R.和Wang,Y.(2018)。深度双向和单向lstm递归神经网络用于网络范围内的交通速度预测。arXiv预打印arXiv:180102143
[14] 崔,Z。;Henrickson,K。;Ke,R。;Wang,Y.,交通图卷积递归神经网络:网络级交通学习和预测的深度学习框架,IEEE智能交通系统汇刊,21,11,4883-4894(2019)·doi:10.1109/TITS.2019.2950416
[15] De Brouwer,E.、Simm,J.、Arany,A.和Moreau,Y.(2019年)。Gru-ode-bayes:零星观测时间序列的连续建模。《神经信息处理系统进展》(第7379-7390页)。
[16] Duan,T.(2020)用于内存矩阵补全的轻量级python库。https://github.com/tonyduan/matrix-completion
[17] Fonollosa,J。;罗德里格斯-卢扬,I。;特林卡维利,M。;Vergara,A。;Huerta,R.,用气相色谱-质谱法验证的mox传感器对湍流气体混合物进行化学鉴别,传感器,14,10,19336-19353(2014)·doi:10.3390/s141019336
[18] Fortuin,V.、Baranchuk,D.、Rätsch,G.和Mandt,S.(2020年)。Gp-vae:深度概率时间序列插补。在人工智能和统计国际会议上(第1651-1661页)。PMLR公司。
[19] Karkouch,A。;Mousannif,H。;莫阿塔西姆,HA;Noel,T.,《物联网中的数据质量:最新调查》,《网络与计算机应用杂志》,73,57-81(2016)·doi:10.1016/j.jnca.2016.08.002
[20] 卡亚蒂,M。;勒纳,A。;Tymchenko,Z。;Cudré-Mauroux,P.,《留心差距:时间序列中缺失值插补技术的实验评估》,《VLDB捐赠会议录》,13,5,768-782(2020)·数字对象标识代码:10.14778/3377369.3377383
[21] Kim,Y.和Choi,S.(2009年)。加权非负矩阵分解。2009年IEEE声学、语音和信号处理国际会议(第1541-1544页)。
[22] 勒波特,M。;奥宾,JB;Clemens,FH,《时间序列内插:现有方法及其性能标准和不确定性评估的简介》,Water,9,10,796(2017)·数字对象标识代码:10.3390/w9100796
[23] Liu,Y.,Yu,R.,Zheng,S.,Zhan,E.,&Yue,Y.(2019年)。Naomi:非自回归多分辨率序列插补。《神经信息处理系统进展》(第11238-11248页)。
[24] Luo,Y.,Zhang,Y.、Cai,X.和Yuan,X.(2019)。E2gan:多元时间序列插补的端到端生成对抗网络。第28届国际人工智能联合会议记录(第3094-3100页)。AAAI出版社。
[25] 梅内,MJ;杜尔,I。;沃斯,RS;格里森,BE;休斯顿,TG,《全球历史气候网络每日数据库概述》,《大气与海洋技术杂志》,29,7,897-910(2012)·doi:10.1175/JTECH-D-11-00103.1
[26] Menne,M.J.、Durre,I.、Korzeniwski,B.、McNeal,S.、Thomas,K.、Yin,X.、Anthony,S.,Ray,R.、Vose,R.,Gleason,B.E.和Houston,T.G.(2020年)。全球历史气候网络日报。版本3.38,NOAA国家气候数据中心。doi:10.7289/V5D21VHZ,。
[27] 莫里茨,S.、莫里茨,M.S.和ByteCompile,T.(2019)。包“插补”。cran r项目组织。
[28] Santiago,A.R.、Antunes,M.、Barraca,J.P.、Gomes,D.和Aguiar,R.L.(2019年)。SCoTv2:大规模数据采集、处理和可视化平台。2019年,第七届未来物联网和云国际会议(FiCloud)。电气与电子工程师协会。doi:10.10109/ficloud.2019.00053。
[29] Shu,X.、Porikli,F.和Ahuja,N.(2014)。鲁棒正交子空间学习:有效恢复损坏的低秩矩阵。IEEE计算机视觉和模式识别会议记录(第3874-3881页)。
[30] DJ斯特霍芬;Bühlmann,P.,MissForest-混合型数据的非参数缺失值插补,生物信息学,28,1,112-118(2011)·doi:10.1093/bioinformatics/btr597
[31] Tarpey,T.,关于受限最小二乘的平方和预测统计量的注记,美国统计学家,54,2,116-118(2000)
[32] 威廉姆斯,AH;Kim,TH;Wang,F。;Vyas,S。;Ryu,SI;Shenoy,KV;Schnitzer,M。;科尔达,TG;Ganguli,S.,《通过张量分量分析在多个时间尺度上发现非监督的分层低维神经动力学》,Neuron,98,6,1099-1115(2018)·doi:10.1016/j.neuron.2018.05.015
[33] 谢凯。;宁,X。;王,X。;谢,D。;曹,J。;谢国荣。;Wen,J.,《恢复传感器网络中损坏的数据:矩阵补全解决方案》,IEEE移动计算汇刊,16,5,1434-1448(2016)·doi:10.1109/TMC.2016.2595569
[34] Yu,H.F.、Rao,N.和Dhillon,I.S.(2016)。用于高维时间序列预测的时间正则化矩阵分解。《神经信息处理系统进展》(第847-855页)。
[35] Zhang,D.和Balzano,L.(2016)。用于子空间估计的格拉斯曼梯度下降算法的全局收敛性。AISTATS(第1460-1468页)。
[36] 赵(Q.Zhao)。;张,L。;Cichocki,A.,不完全张量的贝叶斯cp因式分解与自动秩确定,IEEE模式分析与机器智能汇刊,37,9,1751-1763(2015)·doi:10.1109/TPAMI.2015.2392756
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。