×

数据流生存分析:分析动态变化环境中的时间事件。 (英语) Zbl 1295.62093号

摘要:我们介绍了一种对数据流进行生存分析的方法。生存分析(也称为事件历史分析)是一种既定的统计方法,用于研究时间“事件”,或者更具体地说,关于事件发生的时间分布及其对数据源协变量的依赖性的问题。为了使该方法适用于数据流的设置,我们提出了一种与众所周知的Cox比例风险模型密切相关的模型的自适应变体。该方法采用滑动窗口方法,根据当前时间窗口中的事件数据不断更新参数。作为概念验证,我们提供了两个案例研究,其中我们的方法用于不同类型的时空数据分析,即地震数据和推特数据的分析。为了通过数据源的空间位置来解释事件的频率,这两项研究都使用位置作为数据源的协变量。

理学硕士:

62页第12页 统计在环境和相关主题中的应用
62号02 生存分析和删失数据中的估计
62N86号 模糊性、生存分析和审查数据
86甲17 全球动力学,地震问题(MSC2010)
93A30型 系统数学建模(MSC2010)

软件:

TEDAS公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aggarwal,C.C.、Han,J.、Wang,J.和Yu,P.S.(2003)。对不断发展的数据流进行聚类的框架,第29届超大数据库国际会议成果,德国柏林,第81-92页。;
[2] Allan,J.、Papka,R.和Lavrenko,V.(1998年)。在线新事件检测和跟踪,《第21届国际ACM SIGIR信息检索研究与开发会议论文集》(SIGIR 1998),澳大利亚墨尔本,第37-45页。;
[3] Amati,G.、Amodeo,G.和Gaibisso,C.(2012年)。微博搜索新鲜度的生存分析,《第21届ACM信息与知识管理国际会议论文集》(CIKM-2012),毛伊岛,HI,美国,第2483-2486页。;
[4] Amodeo,G.、Blanco,R.和Brefeld,U.(2011年)。未来事件预测的混合模型,《第20届ACM信息和知识管理国际会议论文集》(CIKM-2011),英国格拉斯哥,第1981-1984页。;
[5] Babcock,B.、Babu,S.、Datar,M.、Motwani,R.和Widom,J.(2002年)。数据流系统中的模型和问题,第21届ACM SIGACT-SIGMOD-SIGARTS数据库系统原理研讨会论文集,美国威斯康星州麦迪逊,第1-16页。;
[6] Beringer,J.和H¨ullermier,E.(2006年)。并行数据流、数据和知识工程的在线集群58(2): 180-204.;
[7] Bottou,L.(1998)。在线算法和随机近似,D.Saad(编辑),在线学习和神经网络,剑桥大学出版社,剑桥·Zbl 0968.68127号
[8] Chen,G.,Wu,X.和Zhu,X.(2005)。多流中的顺序模式挖掘,第五届IEEE数据挖掘国际会议论文集,美国德克萨斯州休斯顿,第585-588页。;
[9] Cheon,S.-P.、Kim,S.、Lee,S.-Y.和Lee,C.-B.(2009年)。基于贝叶斯网络的传感器数据罕见事件预测,基于知识的系统22(5): 336-343.;
[10] Cherniack,M.、Balakrishnan,H.、Barazinska,M.,Carney,D.、Cetintemel,U.、Xing,Y.和Zdonik,S.(2003)。可扩展分布式流处理,CIDR-03:1第二届创新数据库系统两年一度会议论文集,美国加利福尼亚州阿西洛马。;
[11] Considine,J.、Li,F.、Kollios,G.和Byers,J.(2004)。传感器数据库的近似聚合技术,ICDE-04:第20届IEEE国际数据工程会议,美国马萨诸塞州波士顿,第449-460页。;
[12] Cormode,G.和Muthukrishnan,S.(2005年)。热门和不热门:动态跟踪最频繁的项目,数据库系统上的ACM事务30(1): 249-278.;
[13] 考克斯·D(1972)。回归模型和生命表,皇家统计学会杂志B34(2): 187-220.; ·Zbl 0243.62041号
[14] Cox,D.R.和Oakes,D.(1984)。生存数据分析,Chapman&Hall,伦敦。;
[15] Das,A.、Gehrke,J.和Riedewald,M.(2003)。数据流上的近似连接处理,《2003年ACM SIGMOD国际数据管理会议论文集》,美国加利福尼亚州圣地亚哥,第40-51页。;
[16] Domingos,P.和Hulten,G.(2003年)。挖掘海量数据流的通用框架,计算与图形统计杂志12(4): 945-949.;
[17] Gaber,M.M.、Zaslavsky,A.和Krishnaswamy,S.(2005年)。挖掘数据流:综述,ACM SIGMOD记录34(1): 18-26.; ·Zbl 1087.68557号
[18] Gama,J.(2012)。从数据流中学习的调查:当前和未来趋势,人工智能进展1(1): 45-55.;
[19] Gama,J.和Gaber,M.M.(2007年)。从数据流学习,Springer-Verlag,柏林/纽约州纽约市·Zbl 1153.68361号
[20] Garofalakis,M.、Gehrke,J.和Rastogi,R.(2002)。查询和挖掘数据流:你只需要看一眼,《2002年ACM SIGMOD国际数据管理会议记录》,美国威斯康星州麦迪逊,第635-635页。;
[21] Golab,L.和Tamer,M.(2003)。数据流管理中的问题,ACM SIGMOD记录32(2): 5-14.;
[22] Hulten,G.、Spencer,L.和Domingos,P.(2001)。挖掘时变数据流,第七届ACMSIGKDD知识发现和数据挖掘国际会议论文集,美国加利福尼亚州旧金山,第97-106页。;
[23] Ikonomovska,E.、Gama,J.和Dzeroski,S.(2011年)。从不断发展的数据流、数据挖掘和知识发现中学习模型树23(1): 128-168.; ·Zbl 1235.68158号
[24] Krizanovic,K.、Galic,Z.和Baranovic,M.(2011)。时空数据流的数据类型和操作,IEEE移动数据管理国际会议(MDM),瑞典卢埃拉,第11-14页。;
[25] Li,R.、Lei,K.H.、Khadiwala,R.和Chang,K.C.-C.(2012)。Tedas:基于推特的事件检测和分析系统,IEEE第28届国际会议数据工程会议记录(ICDE 2012),美国华盛顿特区,第1273-1276页。;
[26] Oliveira,M.和Gama,J.(2012)。用于监测经济和金融问题的集群演化的框架,智能数据分析16(1): 93-111.;
[27] Radinsky,K.和Horvitz,E.(2013)。挖掘网络以预测未来事件,《第六届ACM网络搜索和数据挖掘国际会议论文集》(WSDM 2013),意大利罗马,第255-264页。;
[28] Sakaki,T.、Okazaki,M.和Matsuo,Y.(2013)。实时事件检测和地震报告系统开发的推文分析,IEEE知识与数据工程汇刊25(4) :919-931。;
[29] 翁·J和李·B·S(2011)。推特上的事件检测,第五届网络日志和社交媒体国际会议(ICWSM 2011),西班牙巴塞罗那。;
[30] Yang,Y.、Pierce,T.和Carbonell,J.G.(1998年)。回顾性和在线事件检测研究,《第21届国际ACM SIGIR信息检索研究与开发会议论文集》(SIGIR1998),澳大利亚墨尔本,第28-36页。;
[31] Zadeh,L.(1965年)。模糊集、信息与控制8(3): 338-353.; ·Zbl 0139.24606号
[32] Zupan,B.、Demésar,J.、Kattan,M.W.、Beck,J.R.和Bratko,I.(2000年)。基于机器学习的生存分析:以前列腺癌复发为例20(1): 59-75.;
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。