×

关于正的未标记时间序列分类问题中(k)-最近邻的停止准则。 (英语) Zbl 1390.62174号

摘要:在过去的十年里,正的未标记时间序列分类已成为一个重要领域,因为通常有大量的未标记时间序列数据可用,但很难获得相应的标签。在这种情况下,积极的无标记学习是一种合适的选择,可以缓解标记示例的缺乏。特别是,自我训练由于其简单性和适应性而被广泛使用。在这种技术中,停止标准,即决定何时停止标记,是一个关键部分,特别是在积极的未标记环境中。我们提出了一种遵循正无标记方法进行时间序列分类的自训练方法,以及该方法的一系列无参数停止准则。我们的建议使用图形分析来估计类边界,该分析应用于作为基础学习者的“(k)-最近邻”获得的最小距离。该方法在涉及各种时间序列分类数据集的实验研究中进行了评估。结果表明,我们的方法优于先前模型得到的结果。

MSC公司:

62M10个 统计学中的时间序列、自相关、回归等(GARCH)
60克40 停车时间;最优停车问题;赌博理论
62H30型 分类和区分;聚类分析(统计方面)

软件:

物理工具包
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿哈·D·W。;Kibler,D。;Albert,M.K.,基于实例的学习算法,马赫。学习。,6, 1, 37-66 (1991)
[2] 巴蒂斯塔,G。;Hao,Y。;基奥,E。;Mafra-Neto,A.,《使用廉价传感器对飞行昆虫进行自动分类》,《第十届机器学习与应用国际会议论文集》,第1卷,364-369(2011),IEEE
[3] 北贝古姆。;胡,B。;Rakthanmanon,T。;Keogh,E.,半监督时间序列分类的最小描述长度技术,可重用系统集成。智能系统与计算进展,第263卷,171-192(2014),施普林格国际出版公司
[4] Bergmann,B。;Hommel,G.,《冗余假设系统通用多重测试程序的改进》,《多重假设测试》。《医学信息与统计》,第70卷,100-115(1988),施普林格-柏林-海德堡
[5] Blum,A。;Mitchell,T.,将标记和未标记数据与联合训练相结合,第11届计算学习理论年会论文集,92-100(1998),ACM
[6] 布鲁诺,G。;Garza,P.,《医疗应用的时间模式挖掘》,《智能》。系统。参考图书馆。,25, 9-18 (2012)
[7] 卡尔沃,B。;拉腊尼亚加,P。;Lozano,J.A.,从阳性和未标记的例子中学习贝叶斯分类器,模式识别。莱特。,28, 16, 2375-2384 (2007)
[8] 卡尔沃,B。;北卡罗来纳州洛佩兹·比加斯。;Furney,S.J。;拉腊尼亚加,P。;Lozano,J.A.,《人类显性和隐性疾病基因预测的部分监督分类方法》,计算机。方法进展。生物识别。,85, 3, 229-237 (2007)
[9] 沙佩尔,O。;Schölkopf,B。;Zien,A.,《半监督学习》,2(2006),麻省理工学院出版社,剑桥
[10] 陈,Y。;胡,B。;基奥,E。;Batista,G.E.,DTW-D:时间序列半监督学习的一个例子,第19届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’13,383-391(2013),ACM:美国纽约州纽约市ACM
[11] 丹尼斯,F。;吉列伦,R。;A.劳伦特。;Tommasi,M.,《积极和未标记示例的文本分类和联合训练》,《2003年ICML研讨会论文集:从标记数据到未标记数据的连续体》,80-87(2003)
[12] 丹尼斯,F。;吉列隆,R。;Tommasi,M.,《从正面和未标记示例中进行文本分类》,《第九届基于知识的系统中信息处理和不确定性管理国际会议论文集》,IPMU'021927-1934(2002)
[13] 爱德华兹·R·D。;Magee,J。;Bassetti,W.H.C.,《股票趋势技术分析》(2012年),CRC Press Taylor&Francis Group
[14] 弗莱斯卡,S。;Manco,G。;Masciari,E。;Pontieri,L。;Pugliese,A.,利用结构相似性进行有效的网络信息提取,Data Knowl。工程师,60,1,222-234(2007)
[15] Friedman,M.,《使用秩来避免方差分析中隐含的正态假设》,《美国统计协会期刊》,32,200,675-701(1937)·JFM 63.1098.02号
[16] Fu,T.,时间序列数据挖掘综述,工程应用。Artif公司。智力。,24, 1, 164-181 (2011)
[17] 南卡罗来纳州加西亚。;费尔南德斯,A。;Luengo,J。;Herrera,F.,《计算智能和数据挖掘实验设计中多重比较的高级非参数检验:权力的实验分析》,《信息科学》。,180, 10, 2044-2064 (2010)
[18] 南卡罗来纳州加西亚。;Herrera,F.,《所有成对比较的“多数据集分类器的统计比较”扩展》,J.Mach。学习。第9号决议,2695-2698(2008)
[19] Goldberger,A.L。;洛杉矶阿马拉。;格拉斯,L。;Hausdorff,J.M。;伊万诺夫,P.C。;马克·R·G。;Mietus,J.E。;穆迪,G.B。;彭,C。;Stanley,H.E.,Physiobank,《复杂生理信号新研究资源的生理工具包和生理网络组件》,《循环》,101,23,e215-e220(2000)
[20] Grünwald,P.D。;Myung,I.J。;Pitt,M.A.,《最小描述长度的进展:理论与应用》(2005),麻省理工学院出版社
[21] Y.Hochberg。;Rom,D.,《基于Simes测试的多重测试程序扩展》,J.Stat.Plan。推理,48,2,141-152(1995)·Zbl 0851.62054号
[22] 霍奇斯,J。;Lehmann,E.L.,《方差分析中独立实验组合的秩法》,《数学年鉴》。《法律总汇》第33、2、482-497页(1962年)·Zbl 0112.10303号
[24] 柯克帕特里克,哥伦比亚特区。;Dahlquist,J.R.,《技术分析:金融市场技术人员的完整资源》(2010),英国《金融时报》
[25] 库尔巴利亚,V。;Radovanović,M。;盖勒,Z。;Ivanović,M.,《全球约束对时间序列数据库相似性度量的影响》,Knowl。基于系统。,56, 49-67 (2014)
[26] Li,H.,《时间序列数据挖掘的在线和动态时间扭曲》,国际J·马赫出版社。学习。赛博。,6, 1, 145-153 (2015)
[27] 李,X。;刘,B。;Ng,S.,《学习识别测试集中的意外实例》,《国际人工智能联合会议论文集》,第7卷,2802-2807(2007)
[28] 李,X。;刘,B。;Ng,S.,负面训练数据可能对文本分类有害,《自然语言处理经验方法会议论文集》,218-228(2010)
[29] 刘,B。;戴,Y。;李,X。;Lee,W.S。;Yu,P.S.,使用正面和未标记示例构建文本分类器,第三届IEEE数据挖掘国际会议论文集,179-186(2003)
[30] Nguyen,M.N。;李,X。;Ng,S.,《时间序列分类的积极无标记学习》,第22届国际人工智能联合会议论文集第二卷,1421-1426(2011),AAAI出版社
[31] Nguyen,M.N。;李,X。;Ng,S.,基于集合的时间序列分类正向无标记学习,《高级应用数据库系统学报》,243-257(2012),施普林格出版社
[32] Ordonez,P。;奥茨,T。;伦巴第,M。;赫尔南德斯,G。;霍姆斯,K.W。;Fackler,J。;Lehmann,C.U.,新生儿重症监护室多变量时间序列数据的可视化,IBM J.Res.Dev.,56,5,7:1-7:12(2012)
[33] Ratanamahatana,C.A。;Wanichsan,D.,有效半监督时间序列分类的停止准则选择,(Lee,R.,《软件工程、人工智能、网络和并行/分布式计算》,软件工程、人造智能、网络与并行/分布式计算机,计算智能研究,第149卷(2008),斯普林格-柏林-海德堡出版社),1-14·Zbl 1168.68368号
[34] Sakoe,H。;Chiba,S.,口语识别的动态编程算法优化,IEEE Trans。阿库斯特。语音信号处理。,26, 1, 43-49 (1978) ·兹伯利0371.68035
[35] 塞拉,J。;Arcos,J.L.,《时间序列分类相似性度量的经验评估》,Knowl。基于系统。,67, 0, 305-314 (2014)
[36] 税务博士。;Duin,R.P.,优化单类分类器的统一对象生成,J.Mach。学习。第2号决议,155-173(2002年)·Zbl 1002.68599号
[37] V.Thanh Vinh。;Tuan Anh,D.,基于MDL的时间序列半监督分类的一些新改进,计算集体智能。技术和应用。计算机科学讲稿,8733,483-493(2014),施普林格国际出版公司
[38] Triguero,I。;南卡罗来纳州加西亚。;Herrera,F.,《半监督学习的自我标记技术:分类法、软件和实证研究》,Knowl。信息系统。,1-40 (2013)
[39] 王,X。;Mueen,A。;丁·H。;Trajcevski,G。;谢尔曼,P。;Keogh,E.,时间序列数据表示方法和距离度量的实验比较,data Min.Knowl。发现。,26, 2, 275-309 (2013)
[40] 王,X。;Xing,H。;李毅。;华,Q。;Dong,C。;Pedrycz,W.,《集成学习中基本分类器的泛化能力和模糊性之间关系的研究》,IEEE Trans。模糊系统。,第99页,第1页(2014年)
[42] Wei,L。;Keogh,E.,半监督时间序列分类,第十二届ACM SIGKDD知识发现和数据挖掘国际会议论文集,748-753(2006)
[43] Witten,I.H。;Frank,E.,《数据挖掘:实用机器学习工具和技术》(2005),Morgan Kaufmann·Zbl 1076.68555号
[44] Yarowsky,D.,《无监督词义消歧与监督方法的比较》,计算语言学协会第33届年会论文集,189-196(1995),计算语言学学会
[45] Yu,S。;Li,C.,PE-PUC:一种基于图的PU-学习方法用于文本分类,4571 LNAI,574-584(2007)
[46] 张,B。;Zuo,W.,基于kNN的可靠负值提取,用于正值和未标记示例的学习,J.Comput。,4, 1, 94-101 (2009)
[47] 朱,X。;Goldberg,A.B.,《半监督学习导论》(2009),摩根和克莱普尔出版社·Zbl 1209.68435号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。