陈燕平;郝、袁;塔纳温·拉克坦马农;杰辛·扎卡里亚;胡冰;伊蒙·基奥 从时间序列流中不断学习的一般框架。 (英语) Zbl 1405.68281号 数据最小知识。发现。 29,第6期,1622-1664(2015). 摘要:十多年来,时间序列分类一直是数据挖掘领域的一个活跃研究领域,在学习的易处理性和准确性方面取得了重大进展。然而,几乎所有的工作都假设是一次性的培训课程,其中提供了所有要学习的概念的标记示例。这种假设在少数情况下可能有效,但在大多数医学和科学应用中并不成立,在这些应用中,我们最初可能对可以学习的概念只有最模糊的理解。基于这一观察,我们提出了一个时间序列的永无止境的学习框架,在该框架中,代理检查无限数据流,偶尔向老师(可能是人或算法)请求标签。我们通过实验证明了我们的想法的实用性,这些实验考虑了医学、昆虫学、野生动物监测和人类行为分析等领域的现实问题。 引用于2文件 MSC公司: 68T05型 人工智能中的学习和自适应系统 62H30型 分类和区分;聚类分析(统计方面) 62M10个 统计学中的时间序列、自相关、回归等(GARCH) 关键词:永无止境的学习;分类;数据流;时间序列 软件:UCI-毫升;物理工具包;UCR套件 PDF格式BibTeX公司 XML格式引用 \textit{Y.Chen}等人,Data Min.Knowl。发现。29,第6号,1622-1664(2015年;兹bl 1405.68281) 全文: 内政部 参考文献: [1] Achtert E、Bohm C、Kriegel H-P、Kröger P(2005)《数据仓库环境中的在线分层聚类数据挖掘》。ICDM,第10-17页 [2] Ambert JD、Hodgman TP、Laurent EJ、Brewer GL、Iliff MJ、Dettmers R(2009)《东北部鸟类监测手册》。弗吉尼亚州平原美国鸟类保护协会 [3] Bache K,Lichman M(2013)UCI机器学习库。加利福尼亚大学信息与计算机科学学院,加利福尼亚州欧文。http://archive.ics.uci.edu/ml/datasets/Individual(个人)+家庭+电力+电力+消费 [4] Bardeli R、Wolff D、Kurth F、Koch M、Frommolt KH(2010)《在复杂声学环境中检测鸟类声音并应用于生物声学监测》。模式识别快报31:1524-1534·doi:10.1016/j.patrec.2009.09.014 [5] Barrenetxea G等人(2008年)《传感器示波器:现成的环境监测》。收录:IPSN,旧金山 [6] Batista G、Keogh E、Mafra-Neto A、Rowton E(2011)传感器和软件,用于计算昆虫学,这是数据挖掘的一种新兴应用。收录:KDD,第761-764页 [7] Berges M、Goldman E、Matthews HS、Soibelman L(2010)《利用非侵入性负荷监测加强住宅建筑的电力审计》,《工业经济学杂志》14(5):844-858·数字对象标识代码:10.1111/j.1530-9290.2010.00280.x [8] Berlin E,Laerhoven K(2012)《发现具有密集主题的休闲活动》。摘自:2012年国际通用计算会议记录,第250-259页 [9] Borazio M,Laerhoven K(2012)将可穿戴和环境感知结合起来,成为长期睡眠研究的一种不引人注目的工具。In:第二届ACM SIGHIT [10] Campanharo ASLO、Sirer MI、Malgren RD、Ramos FM、Nunes LAN(2011)时间序列和网络之间的双重性。Plos One 6:e23378·doi:10.1371/journal.pone.0023378 [11] Carlson A、Betteridge J、Kisiel B、Settles B、Hruschka Jr ER、Mitchell TM(2010)《走向永无止境的语言学习架构》。In:程序AAAI [12] Charikar M,Chen K,Farach-Colton M(2002)在数据流中查找频繁项。第29届ICALP自动化、语言和编程国际学术讨论会论文集,第693-703页·Zbl 1057.68600号 [13] 陈毅(2014)项目网页。https://sites.google.com/site/nelframework/。2014年4月3日访问 [14] Chen Y,Why A,Batista G,Mafra Neto A,Keogh E(2014)利用廉价传感器对飞虫进行分类。昆虫行为杂志27(5):657-677·doi:10.1007/s10905-014-9454-4 [15] Chiu B,Keogh E,Lonardi S(2003)时间序列基序的概率发现。摘自:第九届ACM SIGKDD知识发现和数据挖掘国际会议记录,第493-498页 [16] Cormode G,Hadjieleftheriou M(2010)《在数据流中查找频繁项的方法》。VLDB J 19(1):3-20·doi:10.1007/s00778-009-0172-z [17] Dagan I,Engelson SP(1995)基于委员会的抽样用于训练概率分类器。收录于:ICML,第95卷,第150-157页 [18] Dawson DK,Efford MG(2009),根据声音信号估算鸟类种群密度。应用生态学杂志。46(6):1201-1209 ·文件编号:10.1111/j.1365-2664.2009.01731.x [19] 丁H,Trajcevski G,Scheuermann P,Wang X,Keogh EJ(2008)时间序列数据的查询与挖掘。表征和距离测量的实验比较。PVLDB 1(2):1542-1552 [20] Dodge Y(2003)《牛津统计术语词典》。牛津大学出版社。国际标准书号0-19-850994-4·Zbl 1027.62001 [21] Elkan C,Noto K(2008)仅从正面和未标记数据学习分类器。KDD,第213-220页 [22] Estan C,Varghese G(2003)交通计量和核算的新方向:关注大象,忽略老鼠。ACM事务计算系统21(3):270-313·doi:10.1145/859716.859719 [23] Ferreira F、Bota D、Bross A、Mélot C、Vincent J(2001)《SOFA评分预测危重患者预后的系列评估》。JAMA杂志286(14):1754-1758·doi:10.1001/jama.286.14.1754 [24] Fujii A,Tokunaga T,Inui K,Tanaka H(1998)基于示例的词义消歧的选择性抽样。计算机语言学家24(4):573-597 [25] Goldberger A等人(2000)PhysioBank、PhysioToolkit和PhysioNet:复杂生理信号的新研究资源的组成部分。循环101(23):215-220·doi:10.1161/01.CIR.101.23.e215 [26] Goldberger A等人(2013),Physion等人。http://physicnet.ph.biu.ac.il/physicbank/database/chfdb/。2013年2月4日访问 [27] 谷歌预测API。https://developers.google.com/prediction/docs/pricing。2013年7月31日访问 [28] Gupta S、Reynolds S、Patel SN(2010)ElectricSense:使用EMI的单点传感,用于家庭中的电气事件检测和分类。附:普适计算会议记录 [29] Hinman J,Hickey E(2009)使用回归分析建模和预测短期电力负荷。工作文件,伊利诺伊州立大学,师范(美国),秋季 [30] Holyoak DT(2001)Nightjars及其盟友:caprimulgiformes。牛津大学出版社,牛津,纽约。ISBN 0-19-854987-3 [31] Hu B,Chen Y,Keogh EJ(2013)更现实假设下的时间序列分类。输入:SDM·Zbl 1411.62254号 [32] Jin C,Qian W,Sha C,Yu J,Zhou A(2003)在数据流上动态维护频繁项。摘自:第十二届ACM CIKM信息和知识管理国际会议记录,第287-294页 [33] Jin S,Chen Z,Backus E,Sun X,Xiao B(2012)茶树上茶绿叶蝉EPG波形的特征及其与触针活动的相关性。昆虫生理杂志58:1235-1244·doi:10.1016/j.jinspys.2012.06.008 [34] Karp R,Papadimitriou C,Shenker S(2003)一种在集合和包中查找频繁元素的简单算法。ACM Trans数据库系统28:51-55·数字对象标识代码:10.1145/762471.762473 [35] Keogh E,Zhu Q,Hu B,Hao Y,Xi X,Wei L,Ratanamahatana CA(2011)UCR时间序列分类/聚类主页。www.cs.ucr.edu/eamon/time_series_data/ [36] Kolter J,Jaakkola T(2012)加性阶乘HMM中的近似推断及其在能量分解中的应用。J Mach学习研究22:1472-1482 [37] Krishnamurthy A,Balakrishnan S,Xu M,Singh A(2012)《分层聚类的高效主动算法》。arXiv:1206.4672 [38] Lines J、Bagnall A、Caiger-Smith P、Anderson S(2011)《按用电量分类的家用设备》。In:理想,第403-412页 [39] MacLeod J、Greene T、MacKenzie DI、Allen RB(2012)《新西兰保护地上广泛和常见鸟类物种的监测:初步研究》。N Z J经济36(3):300-311 [40] Manku G,Motwani R(2002)数据流的近似频率计数。In:超大数据库国际会议,第346-357页 [41] Mermelstein,P。;Chen,CH(编辑),语音识别的距离测量,心理和工具(1976),纽约 [42] Metwally A,Agrawal D,Abbadi AE(2005)数据流中频繁元素和top-k元素的高效计算。参加:数据库理论国际会议·Zbl 1112.68371号 [43] Mitchell L(1981)使用CDC微型捕蚊器进行时间隔离蚊子采集。蚊子新闻42:12 [44] Morales L、Arbetman MP、Cameron SA、Aizen MA(2013),入侵物种对本地大黄蜂的快速生态替代。生态环境前沿11:529-534·数字对象标识代码:10.1890/120321 [45] Mueen A,Keogh EJ,Young N(2011)《逻辑形状:时间序列分类的表达原语》。收录:KDD,第1154-1162页 [46] Mueen A,Keogh EJ(2010)《时间序列主题的在线发现和维护》。收录:KDD,第1089-1098页 [47] Nassar S,Sander J,Cheng C(2004)动态分层聚类的增量和有效数据摘要。在:SIGMOD会议,第467-478页 [48] Norris JR(1998)马尔可夫链。剑桥大学出版社·Zbl 0938.60058号 [49] PAMAP(2012)《老年人体力活动监测》。www.pamap.org/demo.html。2012年检索 [50] Robbins CS(1981)白天时间对鸟类活动的影响。《种鸡生物学》6:275-286 [51] Roggen D等人(2012)在高度丰富的网络传感器环境中收集复杂活动数据集。In:Proc'7th IEEE INSS,第233-240页 [52] Rakthanmanon T、Campana B、Mueen A、Batista G、Westover B、Zhu Q等人(2012)在动态时间扭曲下搜索和挖掘数万亿时间序列子序列。第18届ACM SIGKDD知识发现和数据挖掘国际会议记录。ACM,纽约,第262-270页 [53] 罗琳·JK(1997)《哈利·波特与密室》。莱文图书(经院哲学),纽约,斯蒂芬·弗莱(Stephan Fry)、亚瑟·A(Arthur A)阅读 [54] Salton G,McGill MJ(1986)《现代信息检索导论》。纽约McGraw-Hill,ISBN 0-07-054484-0 [55] 解决B(2012)主动学习。Morgan&Claypool,圣拉斐尔·Zbl 1270.68006号 [56] Settles B,Craven M,Friedland L(2008)《主动学习与实际注释成本》。附:NIPS成本敏感学习研讨会会议记录 [57] Shrivastava N、Buragohain C、Agrawal D、Suri S(2004)《中值及其以外:传感器网络的新聚合技术》。输入:ACM SenSys [58] Stikic M、Huynh T、Laerhoven KV、Schiele B(2008)基于RFID和加速度计传感组合的ADL识别。收件人:PervasiveHealth,第258-263页 [59] Tur G,Hakkani-Tür D,Schapire RE(2005),结合主动学习和半监督学习促进口语理解。演讲通讯45(2):171-186·doi:10.1016/j.specom.2004.08.002 [60] Van Rijsbergen J(1979)《信息检索》,第二版。巴特沃斯,伦敦·Zbl 0227.68052号 [61] Veeraraghavan A,Chellappa R,Roy Chowdhury AK(2006)活动的功能空间。In:计算机视觉和模式识别 [62] Wu Y,Zhou C,Xiao J,Kurths J,Schellnhuber HJ(2010)人类交流中双峰分布的证据。美国国家科学院院刊107:18803-18808·doi:10.1073/pnas.1013140107 [63] Yu H(2005)SVM选择性抽样排序及其在数据检索中的应用。在:第十一届ACM SIGKDD数据挖掘知识发现国际会议论文集。ACM,纽约 [64] 翟S,Kristensson PO,Appert C,Anderson TH,Cao X(2012)《接触面笔画手势设计的基础问题——综合评述》。发现趋势Hum计算交互5(2):97-205·doi:10.1561/1100000012 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。