×

通过张量分解快速检测热点,并应用于犯罪率数据。 (英语) Zbl 07540753号

摘要:在监测随时间变化的非平稳多维时空数据的许多实际应用中,人们通常感兴趣的是检测具有空间稀疏性和时间一致性的热点,而不是像传统统计过程控制(SPC)文献中那样检测系统级的变化。本文提出了一种通过张量分解检测热点的有效方法,该方法分为三个步骤。首先,我们将观测数据拟合到一个平滑稀疏分解张量(SSD-Tensor)模型中,该模型用作降维和去噪技术:它是一个加性模型,将原始数据分解为:平滑但非平稳的全局平均值、稀疏的局部异常和随机噪声。接下来,我们使用包含最小绝对收缩和选择算子(LASSO)和融合LASSO惩罚的惩罚框架估计模型参数。基于快速迭代收缩阈值算法(FISTA),提出了一种高效的递归优化算法。最后,我们应用累积和(CUSUM)控制图来监控去除全局平均值后的模型残差,这有助于检测热点发生的时间和位置。为了证明我们提出的SSD-Tensor方法的有效性,我们将其与其他几种方法进行了比较,包括扫描统计、基于LASSO的、基于PCA的、基于T2的控制图,这些方法在广泛的数值模拟研究和真实的犯罪率数据集中进行了比较。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bakshi,B.R.,多尺度PCA及其在多元统计过程监测中的应用,AIChE J.,44,1596-1610(1998)
[2] 贝克,A。;Teboulle,M.,线性反问题的快速迭代收缩阈值算法,SIAM。J.成像。科学。,2, 183-202 (2009) ·Zbl 1175.94009号
[3] Boyd,S.、Parikh,N.和Chu,E.,《通过交替方向乘数法进行分布式优化和统计学习》,Now Publishers Inc,2011年·Zbl 1229.90122号
[4] Daubechies,I。;Defrise,M。;De Mol,C.,具有稀疏约束的线性反问题的迭代阈值算法,Commun。纯应用程序。数学。A、 57、1413-1457(2004)·Zbl 1077.65055号
[5] De Ketelaere,B。;休伯特,M。;Schmitt,E.,基于pca的时间相关高维数据统计过程监测方法概述,J.Qual。技术。,47, 318-335 (2015)
[6] 方,X。;Paynabar,K。;Gebraeel,N.,使用惩罚张量回归的基于图像的预测,技术计量学,61369-384(2019)
[7] Hawkins,D.M.,多元质量控制变量的回归调整,J.Qual。技术。,25, 170-182 (1993)
[8] 他,B。;袁,X.,关于Douglas-Rachford交替方向乘数法的非遍历收敛速度,Numer。数学。,130, 567-577 (2015) ·兹比尔132090060
[9] 胡克。;Yuan,J.,张量因子分解批量过程监测,J.过程控制,19,288-296(2009)·Zbl 1198.93217号
[10] 科尔达·T·G。;Bader,B.W.,张量分解与应用,SIAM Rev.,51,455-500(2009)·Zbl 1173.65029号
[11] Kulldorff,M.,《空间扫描统计》,Commun。统计理论方法,261481-1496(1997)·Zbl 0920.62116号
[12] Kuldorff,M.,使用扫描统计的前瞻性时间周期性地理疾病监测,J.R.Stat.Soc.Ser。A、 164、61-72(2001)·Zbl 1002.62517号
[13] Liu,J.、Yuan,L.和Ye,J.,一类融合套索问题的有效算法,第16届ACM SIGKDD国际知识发现和数据挖掘会议论文集,ACM,2010年,第323-332页。
[14] Liu,R.Y.,《多元过程控制图》,美国统计协会,90,1380-1387(1995)·Zbl 0868.62075号
[15] Lorden,G.,《应对分布变化的程序》,《数学年鉴》。Stat.,42,1897-1908(1971)·Zbl 0255.62067号
[16] Louwerse,D。;Smiled,A.,基于三元模型的间歇过程的多元统计过程控制,化学。工程科学。,55, 1225-1235 (2000)
[17] Naus,J.I.,《直线和平面上随机点的聚类》(1963),哈佛大学出版社
[18] Neill,D.B.,Moore,A.W.,Sabhnani,M.,and Daniel,K.,《新兴时空簇的探测》,第11届ACM SIGKDD数据挖掘知识发现国际会议论文集,2005年,第218-227页。
[19] Neill,D.B.、Moore,A.W.和Cooper,G.F.,《贝叶斯空间扫描统计》,《神经信息处理系统进展》,2006年,第1003-1010页
[20] Page,E.S.,《连续检查计划》,《生物特征》,41,100-115(1954)·Zbl 0056.38002号
[21] Paynabar,K。;Jin,J。;Pacella,M.,《使用不相关多线性主成分分析监测和诊断多通道非线性剖面变化》,IIE Trans。,45, 1235-1247 (2013)
[22] Paynabar,K。;邹,C。;邱,P.,《多变量剖面监测和诊断中第一阶段分析的变点方法》,《技术计量学》,58191-204(2016)
[23] 邱,P.,《统计过程控制导论》(2013),查普曼和霍尔/CRC
[24] ŠaltytBenth,J。;Šaltytö,L.,立陶宛风速时空模型,J.Appl。统计,38,1151-1168(2011)·Zbl 1511.62394号
[25] Silverman,B.W.,《统计和数据分析的密度估计》,第26卷(1986年),CRC出版社·Zbl 0617.62042号
[26] 探戈,T。;高桥,K。;Kohriyama,K.,《用于检测新发疫情的时空扫描统计》,《生物统计学》,67106-115(2011)·Zbl 1218.62120号
[27] Tibshirani,R.,《通过套索进行回归收缩和选择》,J.R.Stat.Soc.Ser。B、 58、267-288(1996)·兹比尔0850.62538
[28] Tibshirani,R。;桑德斯,M。;Rosset,S。;朱,J。;K.奈特(K.K.Knight),《通过融合套索实现的稀疏与平滑》,J.R.Stat.Soc.Ser。B、 67、91-108(2005)·Zbl 1060.62049号
[29] Tibshirani,R.J。;Taylor,J.,广义套索的解路径,Ann.Stat.,391335-1371(2011)·Zbl 1234.62107号
[30] Wahlberg,B。;博伊德,S。;Annergren,M。;Wang,Y.,一类全变分正则化估计问题的ADMM算法,IFAC Proc。,45, 83-88 (2012)
[31] Wang,Y.X。;夏普纳克,J。;Smola,A.J。;Tibshirani,R.J.,《图形趋势过滤》,J.Mach。学习。研究,17,3651-3691(2016)·Zbl 1369.62082号
[32] Yan,H.、Grasso,M.、Paynabar,K.和Colosimo,B.M.,视频成像数据中集群事件的实时检测及其在增材制造中的应用,IISE Trans。(审查中)。可在http://arxiv.org/abs/2004.10977,打印日期:2004.10977
[33] Yan,H。;Paynabar,K。;Shi,J.,使用低秩张量分解的基于图像的过程监控,IEEE。事务处理。自动。科学。工程,12,216-227(2014)
[34] Yan,H。;Paynabar,K。;Shi,J.,通过时空平滑稀疏分解实时监测高维功能数据流,Technometrics,60,181-197(2018)
[35] Zhu,Y.,一种增广的admm算法及其在广义拉索问题中的应用,J.Compute。图表。统计,26,195-204(2017)
[36] 邹,C。;邱,P.,使用LASSO的多元统计过程控制,美国统计协会,104,1586-1596(2009)·Zbl 1205.62214号
[37] 邹,C。;Tsung,F。;Wang,Z.,基于非参数回归方法的监测曲线,技术计量学,50512-526(2008)
[38] 邹,C。;宁,X。;Tsung,F.,基于LASSO的多元线性剖面监测,Ann.Oper。决议,192,3-19(2012)·Zbl 1236.62168号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。