×

从时间序列流中不断学习的一般框架。 (英语) Zbl 1405.68281号

摘要:十多年来,时间序列分类一直是数据挖掘领域的一个活跃研究领域,在学习的易处理性和准确性方面取得了重大进展。然而,几乎所有的工作都假设是一次性的培训课程,其中提供了所有要学习的概念的标记示例。这种假设在少数情况下可能有效,但在大多数医学和科学应用中并不成立,在这些应用中,我们最初可能对可以学习的概念只有最模糊的理解。基于这一观察,我们提出了一个时间序列的永无止境的学习框架,在该框架中,代理检查无限数据流,偶尔向老师(可能是人或算法)请求标签。我们通过实验证明了我们的想法的实用性,这些实验考虑了医学、昆虫学、野生动物监测和人类行为分析等领域的现实问题。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
62M10个 统计学中的时间序列、自相关、回归等(GARCH)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Achtert E、Bohm C、Kriegel H-P、Kröger P(2005)《数据仓库环境中的在线分层聚类数据挖掘》。ICDM,第10-17页
[2] Ambert JD、Hodgman TP、Laurent EJ、Brewer GL、Iliff MJ、Dettmers R(2009)《东北部鸟类监测手册》。弗吉尼亚州平原美国鸟类保护协会
[3] Bache K,Lichman M(2013)UCI机器学习库。加利福尼亚大学信息与计算机科学学院,加利福尼亚州欧文。http://archive.ics.uci.edu/ml/datasets/Individual(个人)+家庭+电力+电力+消费
[4] Bardeli R、Wolff D、Kurth F、Koch M、Frommolt KH(2010)《在复杂声学环境中检测鸟类声音并应用于生物声学监测》。模式识别快报31:1524-1534·doi:10.1016/j.patrec.2009.09.014
[5] Barrenetxea G等人(2008年)《传感器示波器:现成的环境监测》。收录:IPSN,旧金山
[6] Batista G、Keogh E、Mafra-Neto A、Rowton E(2011)传感器和软件,用于计算昆虫学,这是数据挖掘的一种新兴应用。收录:KDD,第761-764页
[7] Berges M、Goldman E、Matthews HS、Soibelman L(2010)《利用非侵入性负荷监测加强住宅建筑的电力审计》,《工业经济学杂志》14(5):844-858·数字对象标识代码:10.1111/j.1530-9290.2010.00280.x
[8] Berlin E,Laerhoven K(2012)《发现具有密集主题的休闲活动》。摘自:2012年国际通用计算会议记录,第250-259页
[9] Borazio M,Laerhoven K(2012)将可穿戴和环境感知结合起来,成为长期睡眠研究的一种不引人注目的工具。In:第二届ACM SIGHIT
[10] Campanharo ASLO、Sirer MI、Malgren RD、Ramos FM、Nunes LAN(2011)时间序列和网络之间的双重性。Plos One 6:e23378·doi:10.1371/journal.pone.0023378
[11] Carlson A、Betteridge J、Kisiel B、Settles B、Hruschka Jr ER、Mitchell TM(2010)《走向永无止境的语言学习架构》。In:程序AAAI
[12] Charikar M,Chen K,Farach-Colton M(2002)在数据流中查找频繁项。第29届ICALP自动化、语言和编程国际学术讨论会论文集,第693-703页·Zbl 1057.68600号
[13] 陈毅(2014)项目网页。https://sites.google.com/site/nelframework/。2014年4月3日访问
[14] Chen Y,Why A,Batista G,Mafra Neto A,Keogh E(2014)利用廉价传感器对飞虫进行分类。昆虫行为杂志27(5):657-677·doi:10.1007/s10905-014-9454-4
[15] Chiu B,Keogh E,Lonardi S(2003)时间序列基序的概率发现。摘自:第九届ACM SIGKDD知识发现和数据挖掘国际会议记录,第493-498页
[16] Cormode G,Hadjieleftheriou M(2010)《在数据流中查找频繁项的方法》。VLDB J 19(1):3-20·doi:10.1007/s00778-009-0172-z
[17] Dagan I,Engelson SP(1995)基于委员会的抽样用于训练概率分类器。收录于:ICML,第95卷,第150-157页
[18] Dawson DK,Efford MG(2009),根据声音信号估算鸟类种群密度。应用生态学杂志。46(6):1201-1209 ·文件编号:10.1111/j.1365-2664.2009.01731.x
[19] 丁H,Trajcevski G,Scheuermann P,Wang X,Keogh EJ(2008)时间序列数据的查询与挖掘。表征和距离测量的实验比较。PVLDB 1(2):1542-1552
[20] Dodge Y(2003)《牛津统计术语词典》。牛津大学出版社。国际标准书号0-19-850994-4·Zbl 1027.62001
[21] Elkan C,Noto K(2008)仅从正面和未标记数据学习分类器。KDD,第213-220页
[22] Estan C,Varghese G(2003)交通计量和核算的新方向:关注大象,忽略老鼠。ACM事务计算系统21(3):270-313·doi:10.1145/859716.859719
[23] Ferreira F、Bota D、Bross A、Mélot C、Vincent J(2001)《SOFA评分预测危重患者预后的系列评估》。JAMA杂志286(14):1754-1758·doi:10.1001/jama.286.14.1754
[24] Fujii A,Tokunaga T,Inui K,Tanaka H(1998)基于示例的词义消歧的选择性抽样。计算机语言学家24(4):573-597
[25] Goldberger A等人(2000)PhysioBank、PhysioToolkit和PhysioNet:复杂生理信号的新研究资源的组成部分。循环101(23):215-220·doi:10.1161/01.CIR.101.23.e215
[26] Goldberger A等人(2013),Physion等人。http://physicnet.ph.biu.ac.il/physicbank/database/chfdb/。2013年2月4日访问
[27] 谷歌预测API。https://developers.google.com/prediction/docs/pricing。2013年7月31日访问
[28] Gupta S、Reynolds S、Patel SN(2010)ElectricSense:使用EMI的单点传感,用于家庭中的电气事件检测和分类。附:普适计算会议记录
[29] Hinman J,Hickey E(2009)使用回归分析建模和预测短期电力负荷。工作文件,伊利诺伊州立大学,师范(美国),秋季
[30] Holyoak DT(2001)Nightjars及其盟友:caprimulgiformes。牛津大学出版社,牛津,纽约。ISBN 0-19-854987-3
[31] Hu B,Chen Y,Keogh EJ(2013)更现实假设下的时间序列分类。输入:SDM·Zbl 1411.62254号
[32] Jin C,Qian W,Sha C,Yu J,Zhou A(2003)在数据流上动态维护频繁项。摘自:第十二届ACM CIKM信息和知识管理国际会议记录,第287-294页
[33] Jin S,Chen Z,Backus E,Sun X,Xiao B(2012)茶树上茶绿叶蝉EPG波形的特征及其与触针活动的相关性。昆虫生理杂志58:1235-1244·doi:10.1016/j.jinspys.2012.06.008
[34] Karp R,Papadimitriou C,Shenker S(2003)一种在集合和包中查找频繁元素的简单算法。ACM Trans数据库系统28:51-55·数字对象标识代码:10.1145/762471.762473
[35] Keogh E,Zhu Q,Hu B,Hao Y,Xi X,Wei L,Ratanamahatana CA(2011)UCR时间序列分类/聚类主页。www.cs.ucr.edu/eamon/time_series_data/
[36] Kolter J,Jaakkola T(2012)加性阶乘HMM中的近似推断及其在能量分解中的应用。J Mach学习研究22:1472-1482
[37] Krishnamurthy A,Balakrishnan S,Xu M,Singh A(2012)《分层聚类的高效主动算法》。arXiv:1206.4672
[38] Lines J、Bagnall A、Caiger-Smith P、Anderson S(2011)《按用电量分类的家用设备》。In:理想,第403-412页
[39] MacLeod J、Greene T、MacKenzie DI、Allen RB(2012)《新西兰保护地上广泛和常见鸟类物种的监测:初步研究》。N Z J经济36(3):300-311
[40] Manku G,Motwani R(2002)数据流的近似频率计数。In:超大数据库国际会议,第346-357页
[41] Mermelstein,P。;Chen,CH(编辑),语音识别的距离测量,心理和工具(1976),纽约
[42] Metwally A,Agrawal D,Abbadi AE(2005)数据流中频繁元素和top-k元素的高效计算。参加:数据库理论国际会议·Zbl 1112.68371号
[43] Mitchell L(1981)使用CDC微型捕蚊器进行时间隔离蚊子采集。蚊子新闻42:12
[44] Morales L、Arbetman MP、Cameron SA、Aizen MA(2013),入侵物种对本地大黄蜂的快速生态替代。生态环境前沿11:529-534·数字对象标识代码:10.1890/120321
[45] Mueen A,Keogh EJ,Young N(2011)《逻辑形状:时间序列分类的表达原语》。收录:KDD,第1154-1162页
[46] Mueen A,Keogh EJ(2010)《时间序列主题的在线发现和维护》。收录:KDD,第1089-1098页
[47] Nassar S,Sander J,Cheng C(2004)动态分层聚类的增量和有效数据摘要。在:SIGMOD会议,第467-478页
[48] Norris JR(1998)马尔可夫链。剑桥大学出版社·Zbl 0938.60058号
[49] PAMAP(2012)《老年人体力活动监测》。www.pamap.org/demo.html。2012年检索
[50] Robbins CS(1981)白天时间对鸟类活动的影响。《种鸡生物学》6:275-286
[51] Roggen D等人(2012)在高度丰富的网络传感器环境中收集复杂活动数据集。In:Proc'7th IEEE INSS,第233-240页
[52] Rakthanmanon T、Campana B、Mueen A、Batista G、Westover B、Zhu Q等人(2012)在动态时间扭曲下搜索和挖掘数万亿时间序列子序列。第18届ACM SIGKDD知识发现和数据挖掘国际会议记录。ACM,纽约,第262-270页
[53] 罗琳·JK(1997)《哈利·波特与密室》。莱文图书(经院哲学),纽约,斯蒂芬·弗莱(Stephan Fry)、亚瑟·A(Arthur A)阅读
[54] Salton G,McGill MJ(1986)《现代信息检索导论》。纽约McGraw-Hill,ISBN 0-07-054484-0
[55] 解决B(2012)主动学习。Morgan&Claypool,圣拉斐尔·Zbl 1270.68006号
[56] Settles B,Craven M,Friedland L(2008)《主动学习与实际注释成本》。附:NIPS成本敏感学习研讨会会议记录
[57] Shrivastava N、Buragohain C、Agrawal D、Suri S(2004)《中值及其以外:传感器网络的新聚合技术》。输入:ACM SenSys
[58] Stikic M、Huynh T、Laerhoven KV、Schiele B(2008)基于RFID和加速度计传感组合的ADL识别。收件人:PervasiveHealth,第258-263页
[59] Tur G,Hakkani-Tür D,Schapire RE(2005),结合主动学习和半监督学习促进口语理解。演讲通讯45(2):171-186·doi:10.1016/j.specom.2004.08.002
[60] Van Rijsbergen J(1979)《信息检索》,第二版。巴特沃斯,伦敦·Zbl 0227.68052号
[61] Veeraraghavan A,Chellappa R,Roy Chowdhury AK(2006)活动的功能空间。In:计算机视觉和模式识别
[62] Wu Y,Zhou C,Xiao J,Kurths J,Schellnhuber HJ(2010)人类交流中双峰分布的证据。美国国家科学院院刊107:18803-18808·doi:10.1073/pnas.1013140107
[63] Yu H(2005)SVM选择性抽样排序及其在数据检索中的应用。在:第十一届ACM SIGKDD数据挖掘知识发现国际会议论文集。ACM,纽约
[64] 翟S,Kristensson PO,Appert C,Anderson TH,Cao X(2012)《接触面笔画手势设计的基础问题——综合评述》。发现趋势Hum计算交互5(2):97-205·doi:10.1561/1100000012
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。