×

时间序列的早期分类。基于成本的优化准则和算法。 (英语) Zbl 07432842号

摘要:越来越多的应用程序需要尽快识别传入时间序列的类别,而不会过度影响预测的准确性。在本文中,我们提出了一种新的优化准则,该准则同时考虑了错误分类的代价和延迟决策的代价。基于这个优化准则,我们推导出了一系列非近视算法,这些算法试图在平衡等待成本的基础上预测预期的未来信息增益。在一类基于非监督的算法中,期望值使用时间序列的聚类,而在第二类基于监督的算法,时间序列根据用于标记它们的分类器的置信度进行分组。在使用大量延迟代价函数的实际数据集上进行的大量实验表明,所提出的算法能够解决早熟性与准确性之间的权衡,基于监督分区的方法比基于非监督分区的更好。此外,所有这些方法在各种条件下都比基于短视策略的最新方法表现得更好,而短视策略被认为是非常有竞争力的。此外,我们的实验表明,所提出的方法的非近视特征在很大程度上解释了所获得的性能。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alonso González,C.J.和Diez,J.J.R.(2004)。增强基于间隔的文字:可变长度和早期分类。《时间序列数据库中的数据挖掘》,《世界科学》(第149-171页)。
[2] Anderson,H.S.、Parrish,N.、Tsukida,K.和Gupta,M.(2012)。具有可靠性保证的早期时间序列分类。桑德里亚报告。
[3] Barandas,M.、Folgado,D.、Fernandes,L.、Santos,S.、Abreu,M.,Bota,P.、Liu,H.、Schultz,T.和Gamboa,H.(2020年)。Tsfel:时间序列特征提取库。软件X 11:100456,https://github.com/fraunhoferportugal/tsfel。
[4] Berger,J.O.(1985)。统计决策理论和贝叶斯分析。斯普林格·Zbl 0572.62008号
[5] Cohen,J.,标称量表的一致系数,教育和心理测量,20,1,37-46(1960)·doi:10.1177/001316446002000104
[6] Dachraoui,A.、Bondu,A.和Cornuejols,A.(2013)。个人用电量的早期分类。RealStream2013(ECML)(第18-21页)。
[7] Dachraoui,A.、Bondu,A.和Cornuéjols,A.(2015)。将时间序列早期分类为非近视序列决策问题。在数据库中的机器学习和知识发现欧洲联合会议上(第433-447页)。斯普林格。
[8] DeGroot,M.H.(2005)。最佳统计决策(第82卷)。威利·Zbl 0225.62006号
[9] Flach,P.A.(2016)。分类器校准。机器学习和数据挖掘百科全书(第1-8页)。
[10] Ghalwash,M.F.、Ramljak,D.和Obradović,Z.(2012年)。使用混合hmm/svm模型对多元时间序列进行早期分类。2012年IEEE生物信息学和生物医学国际会议(第1-6页)。IEEE标准。
[11] Ghalwash,M.F.、Radosavljevic,V.和Obradovic,Z.(2014)。利用时间模式估计可解释早期决策中的不确定性。《第20届ACM SIGKDD知识发现和数据挖掘国际会议论文集》,ACM,(第402-411页)。
[12] Gupta,A.、Gupta、H.P.、Biswas,B.和Dutta,T.(2020年)。运输中车载传感器多变量时间序列的早期分类方法。IEEE智能运输系统汇刊。
[13] Hatami,N.和Chira,C.(2013年)。(2013)具有早期时间序列分类拒绝选项的分类器。IEEE计算智能与集成学习研讨会(CIEL)(第9-16页)。IEEE标准。
[14] He,G。;Duan,Y。;彭,R。;景,X。;钱,T。;Wang,L.,多元时间序列的早期分类,神经计算,149777-787(2015)·doi:10.1016/j.neucom.2014.07.056
[15] Lemaire,V.、Alaoui Ismaili,O.、Cornuéjols,A.和Gay,D.(2020年)。局部模型的预测k均值。在2020年5月11日至16日于新加坡举行的PAKDD-2020(第24届亚太知识发现和数据挖掘会议)LDRC-2020研讨会(集群学习数据表示研讨会)上。
[16] 刘,Y。;Li,XR,序贯概率比检验的性能分析,序贯分析,32,4,469-497(2013)·Zbl 1319.62173号 ·doi:10.1080/07474946.2013.843329
[17] Mathukia,C。;风扇,W。;瓦迪亚克,K。;比奇,C。;Krishnamurthy,M.,改进的早期预警系统改善了学术社区医院的患者安全和临床结果,《社区医院内科学展望杂志》,5,2,26716(2015)·doi:10.3402/jhimp.v5.26716
[18] Mori,U.、Mendiburu,A.、Dasgupta,S.和Lozano,J.(2015)。从成本最小化的角度对时间序列进行早期分类。NIPS时间序列研讨会论文集。
[19] 森喜朗,美国。;Mendiburu,A。;达斯古普塔,S。;Lozano,JA,通过同时优化准确性和及早性对时间序列进行早期分类,IEEE神经网络和学习系统汇刊,29,10,4569-4578(2017)·doi:10.1109/TNNLS.2017.2764939
[20] 森喜朗,美国。;Mendiburu,A。;米兰达,IM;Lozano,JA,使用多目标优化技术对时间序列进行早期分类,信息科学,492204-218(2019)·Zbl 1451.62102号 ·doi:10.1016/j.ins.2019.04.024
[21] Nemenyi,P.,无分布多重比较,生物计量学,18263(1962)
[22] Novikov,A.,基于独立观察的两个简单假设的最优序列检验,《国际纯粹与应用数学杂志》,45,2291-314(2008)·兹比尔1143.62047
[23] 北卡罗来纳州帕里什。;HS安德森;古普塔,MR;萧岱,从不完全信息中自信地分类,机器学习研究杂志,14,1,3561-3589(2013)·Zbl 1318.62215号
[24] Rußwurm,M.、Lefevre,S.、Courty,N.、Emonet,R.、Körner,M.和Tavenard,R.(2019年)。对时间序列进行早期分类的端到端学习。arXiv预打印arXiv:190110681。
[25] Schäfer,P。;Leser,U.,Teaser:早期准确的时间序列分类,数据挖掘和知识发现,34,5,1336-1362(2020)·doi:10.1007/s10618-020-00690-z
[26] Vapnik,V。;Vashist,A.,《一种新的学习范式:使用特权信息学习》,神经网络,22,5-6,544-557(2009)·Zbl 1335.68212号 ·doi:10.1016/j.neunet.2009.06.042
[27] Wald,A.和Wolfowitz,J.(1948年)。序贯概率比检验的最优性质。《数理统计年鉴》(第326-339页)·Zbl 0032.17302号
[28] Xing,Z.、Pei,J.和Philip,S.Y.(2009)。时间序列的早期预测:最近邻法。在IJCAI中,Citeser(第1297-1302页)。
[29] 邢,Z。;裴,J。;菲利普,SY;王凯,提取可解释特征用于时间序列的早期分类,SDM,SIAM,11,247-258(2011)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。