×

多元时间序列的有效最近邻搜索。 (英语) Zbl 1109.68040号

摘要:多元时间序列(MTS)数据集在各种多媒体、医疗和金融应用中很常见。为了有效地执行MTS数据集的最近邻搜索,我们提出了一种相似性度量Eros(扩展Frobenius范数)、一种索引结构Muse(Eros的多级基于距离的索引结构)和一种特征子集选择技术Ropes(Eros公共主成分上的递归特征消除)。Eros基于主成分分析,通过测量相应主成分使用特征值作为权重的接近程度来计算两个MTS项目之间的相似性。Muse将每个级别构造为一个基于距离的索引结构,而不使用权重,最多可达\(z)级,这些权重在查询时与权重相结合。Ropes递归地利用公共主成分和权重来为Eros选择特征子集。实验结果表明,与早期方法相比,我们的技术具有优越性。

MSC公司:

68页第10页 搜索和排序
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 塔克,A。;斯威夫特,S。;Liu,X.,通过相关性对多元时间序列中的变量进行分组,IEEE Trans。系统。人类网络。B、 31、2、235-245(2001)
[2] C.Shahabi,AIMS:浸入式数据库管理系统,收录于:VLDB CIDR,2003年。;C.Shahabi,AIMS:浸入式数据库管理系统,收录于:VLDB CIDR,2003年。
[3] Zhang,X.L。;贝格利特,H。;波杰斯,B。;Wang,W。;Litke,A.,物体识别任务中的事件相关电位,Brain Res.Bull。,38, 6, 531-538 (1995)
[4] 古特,C。;托夫特,P。;罗斯特鲁普,E。;尼尔森,F.A。;Hansen,L.K.,关于聚类功能磁共振成像时间序列,神经影像,9298-310(1999)
[5] Moon,T.K。;Stirling,W.C.,《信号处理的数学方法和算法》(2000),普伦蒂斯·霍尔:普伦蒂斯霍尔-恩格尔伍德悬崖,新泽西州
[6] Jolliffe,I.T.,主成分分析(2002),施普林格:柏林施普林格出版社·Zbl 1011.62064号
[7] 博姆,C。;Berchtold,S。;Keim,D.A.,《在高维空间中搜索:提高多媒体数据库性能的索引结构》,ACM Compute。调查,33,3(2001年)
[8] 查韦斯,E。;纳瓦罗,G。;Baeza Yates,R。;Marroque,J.L.,在度量空间中搜索,ACM计算。调查,33,3(2001年)
[9] E.Keogh,动态时间扭曲的精确索引,in:Proc。2002年VLDB会议。;E.Keogh,动态时间扭曲的精确索引,in:Proc。2002年VLDB会议。
[10] C.Yu,B.C.Ooi,K.-L.Tan,H.V.Jagadish,索引距离:KNN处理的有效方法,in:Proc。2001年VLDB会议。;C.Yu,B.C.Ooi,K.-L.Tan,H.V.Jagadish,索引距离:KNN处理的有效方法,in:Proc。2001年VLDB会议。
[11] P.Ciaccia,M.Patella,P.Zezula,M-树:度量空间中相似性搜索的一种有效访问方法,在:Proc。VLDB会议,1997年。;P.Ciaccia,M.Patella,P.Zezula,M树:度量空间中相似性搜索的有效访问方法,in:Proc。1997年VLDB会议。
[12] Yoon,H。;Yang,K。;Shahabi,C.,多元时间序列的特征子集选择和特征排序,IEEE Trans。知识。数据工程,17,9,1186-1198(2005)
[13] Krzanowski,W.,《组间主成分比较》,《美国统计协会期刊》,第74、367页(1979年)·Zbl 0459.62042号
[14] K.Yang,C.Shahabi,基于pca的多元时间序列相似性度量,收录于:ACM MMDB,2004。;K.Yang,C.Shahabi,多元时间序列基于pca的相似性度量,收录于:ACM MMDB,2004年。
[15] K.Yang,C.Shahabi,多元时间序列的多级距离索引结构,收录于:IEEE time,2005。;K.Yang,C.Shahabi,多元时间序列的多级距离索引结构,收录于:IEEE time,2005年。
[16] Sakoe,H。;Chiba,S.,口语识别的动态编程算法优化,IEEE Trans。阿库斯特。语音信号处理。,26, 1 (1978) ·Zbl 0371.68035号
[17] L.Chen,M.T.Ø;zsu,V.Oria,运动物体轨迹的鲁棒快速相似性搜索,in:Proc。2005年美国纽约州纽约市ACM SIGMOD会议。;L.Chen,M.T.Ø;zsu,V.Oria,运动物体轨迹的鲁棒快速相似性搜索,in:Proc。2005年美国纽约州纽约市ACM SIGMOD会议。
[18] M.Vlachos,G.Kollios,D.Gunopulos,《发现相似的多维轨迹》,摘自:Proc。2002年国际数据工程会议;M.Vlachos,G.Kollios,D.Gunopulos,《发现相似的多维轨迹》,摘自:Proc。2002年国际数据工程大会·兹比尔1075.68080
[19] C.Yu,《高维索引:高维范围和相似性搜索的转换方法》,ser。计算机科学讲稿,第2341卷,Springer-Verlag,2003年。;C.Yu,《高维索引:高维范围和相似性搜索的转换方法》,ser。《计算机科学讲义》,第2341卷,斯普林格·弗拉格出版社,2003年。
[20] Y.Sakurai,M.Yoshikawa,S.Uemura,H.Kojima,《a树:使用相对近似的高维空间索引结构》,in:Proc。2000年VLDB会议。;Y.Sakurai,M.Yoshikawa,S.Uemura,H.Kojima,《a树:使用相对近似的高维空间索引结构》,in:Proc。2000年VLDB会议。
[21] Y.Cai,R.Ng,用切比雪夫多项式索引时空轨迹,in:Proc。2004年美国纽约州纽约市ACM SIGMOD会议。;Y.Cai,R.Ng,用切比雪夫多项式索引时空轨迹,在:Proc。2004年,美国纽约州纽约市,ACM SIGMOD会议主席。
[22] M.Vlachos,M.Hadjieleftheriou,D.Gunopulos,E.Keogh,支持多重距离测量的多维时间序列索引,见:Proc。2003年ACM SIGKDD会议。;M.Vlachos,M.Hadjieleftheriou,D.Gunopulos,E.Keogh,支持多重距离测量的多维时间序列索引,见:Proc。2003年ACM SIGKDD会议。
[23] Y.Sakurai,M.Yoshikawa,R.Kataoka,S.Uemura,使用空间变换进行自适应椭球体查询的相似性搜索,见:Proc。2001年VLDB会议。;Y.Sakurai,M.Yoshikawa,R.Kataoka,S.Uemura,使用空间变换进行自适应椭球体查询的相似性搜索,见:Proc。2001年VLDB会议。
[24] Ciaccia,P。;Patella,M.,用用户定义的近似距离在公制空间中搜索,ACM Trans。数据库系统。,27, 4, 398-437 (2002)
[25] Han,J。;Kamber,M.,《数据挖掘:概念和技术》(2000),Springer:Springer Berlin,ch.3,p.121
[26] 盖恩,I。;Elisseeff,A.,《变量和特征选择简介》,J.Mach。学习。第3号决议,1157-1182(2003年)·Zbl 1102.68556号
[27] Kohavi,R。;John,G.H.,特征子集选择包装器,Artif。智力。,97, 1-2, 273-324 (1997) ·Zbl 0904.68143号
[28] 盖恩,I。;韦斯顿,J。;巴恩希尔,S。;Vapnik,V.,使用支持向量机进行癌症分类的基因选择,Mach。学习。,46, 1- 3, 389-422 (2002) ·兹比尔0998.68111
[29] Lal,T.N。;施罗德,M。;Hinterberger,T。;韦斯顿,J。;博格丹,M。;北卡罗来纳州伯鲍默。;Schölkopf,B.,《BCI中的支持向量信道选择》,IEEE Trans。生物识别。工程,51,6(2004)
[30] Krzanowski,W.,《分组数据的正交分量:审查和应用》,Stat.Trans。,5, 5, 759-777 (2002)
[31] Flury,B.N.,《(k)群中的常见主成分》,《美国统计协会期刊》,79,388,892-898(1984)
[32] Schott,J.R.,《几个组中常见主要成分的一些测试》,Biometrika,78771-777(1991)·兹比尔0850.62460
[33] H.Liu,L.Yu,M.Dash,H.Motoda,使用类进行主动特征选择,收录于:亚太知识发现和数据挖掘会议,2003年。;H.Liu,L.Yu,M.Dash,H.Motoda,使用类进行主动特征选择,收录于:亚太知识发现和数据挖掘会议,2003年·Zbl 1032.68617号
[34] M.W.Kadous,《时间分类:将分类范式扩展到多元时间序列》,新南威尔士大学博士论文,2002年。;M.W.Kadous,《时间分类:将分类范式扩展到多元时间序列》,新南威尔士大学博士论文,2002年。
[35] Jackson,J.E.,《主要成分用户指南》(1991),Wiley Interscience·Zbl 0743.62047号
[36] R.Tanawongsuwan,A.Bobick,不同速度下时距步态参数的性能分析,收录于:英国吉尔福德第四届基于音频和视频的生物特征身份验证国际会议,2003年6月。;R.Tanawongsuwan,A.Bobick,不同速度下时距步态参数的性能分析,收录于:第四届基于音频和视频的生物特征身份验证国际会议,英国吉尔福德,2003年6月·Zbl 1050.68915号
[37] T.N.Lal、T.Hinterberger、G.Widman、M.Schröder、N.J.Hill、W.Rosenstiel、C.E.Elger、B.Schölkopf、N.Birbaumer,《侵入性人脑-计算机接口的方法》,2005年,第737-744页。;T.N.Lal、T.Hinterberger、G.Widman、M.Schröder、N.J.Hill、W.Rosenstiel、C.E.Elger、B.Schölkopf、N.Birbaumer,《侵入性人脑-计算机接口的方法》,2005年,第737-744页。
[38] Roverso,D.,《通过瞬态分类进行电厂诊断:阿拉丁方法》,国际期刊Intell。系统。(2002) ·Zbl 1002.68578号
[39] 博兹卡亚,T。;Ozsoyoglu,M.,为相似性搜索查询索引大度量空间,ACM Trans。数据库系统,24,3(1999)
[40] 弗雷克斯,W.B。;Baeza-Yates,R.,《信息检索:数据结构和算法》(Information Retrieval:Data Structures and Algorithms)(1992年),《普伦蒂斯·霍尔:普伦蒂斯·霍尔·恩格尔伍德克利夫斯》(Prentice-Hall Englewood Cliffs),新泽西州
[41] R.O.Stehling,M.A.Nascimento,A.X.FalcáO,基于边界/内部像素分类的紧凑高效图像检索方法,见:Proc。2002年ACM-CIKM会议。;R.O.Stehling,M.A.Nascimento,A.X.FalcáO,基于边界/内部像素分类的紧凑高效图像检索方法,见:Proc。2002年ACM-CIKM会议。
[42] D.-H.Kim,C.-W.Chung,《Qcluster:使用自适应聚类进行基于内容的图像检索的相关反馈》,in:Proc。2003年ACM SIGMOD会议。;D.-H.Kim,C.-W.Chung,《Qcluster:使用自适应聚类进行基于内容的图像检索的相关反馈》,in:Proc。2003年ACM SIGMOD会议。
[43] Myers,C。;拉宾纳,L.R。;Rosenberg,A.E.,孤立词识别动态时间扭曲算法的性能权衡,IEEE Trans。阿库斯特。语音信号处理。,28, 6 (1980) ·Zbl 0524.68052号
[44] T.M.Rath,R.Manmatha,多元时间序列动态时间扭曲距离的下限,2002,TR MM-40,马萨诸塞大学阿姆斯特丹分校。;T.M.Rath,R.Manmatha,《多元时间序列动态时间扭曲距离的下限》,2002年,TR MM-40,马萨诸塞大学阿默斯特分校。
[45] A.Singhal,D.Seborg,多元时间序列数据的聚类,摘自:Proc。《美国管制会议》,第5卷,2002年。;A.Singhal,D.Seborg,多元时间序列数据的聚类,在:Proc。美国管制会议,第5卷,2002年。
[46] C.Shahabi,D.Yan,沉浸式传感器数据流的实时模式隔离和识别,收录于:Proc。第九届多媒体建模国际会议,2003年。;C.Shahabi,D.Yan,沉浸式传感器数据流的实时模式隔离和识别,收录于:Proc。第九届多媒体建模国际会议,2003年。
[47] 杜达,R.O。;哈特,体育。;Stork,D.G.,模式分类(2001),威利跨科学·Zbl 0968.68140号
[48] 戈丁·D·Q。;Millstein,T.D。;Kutlu,A.,时间序列数据的有界相似性查询,Inf.Comput。,194, 2, 203-241 (2004) ·Zbl 1090.68029号
[49] L.Chen,R.Ng,《关于lp-norms和edit distance的结合》,in:Proc。2004年VLDB会议。;L.Chen,R.Ng,《关于lp-norms和edit distance的结合》,in:Proc。2004年VLDB会议。
[50] D.Kifer、S.Ben-David、J.Gehrke,《检测数据流中的变化》,摘自:Proc。2004年VLDB会议。;D.Kifer、S.Ben-David、J.Gehrke,《检测数据流中的变化》,摘自:Proc。2004年VLDB会议。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。