×

不确定性下的近邻搜索。一、。 (英语) Zbl 1380.68163号

摘要:最近邻查询(Nearest-neighbor queries)要求返回一组点中查询点的最近邻,由于其应用范围广泛,因此在许多领域都得到了广泛的研究。在许多此类应用中,例如传感器数据库、基于位置的服务、人脸识别和移动数据,数据的位置是不精确的。因此,我们在概率框架中研究最近邻查询,其中每个输入点和/或查询点的位置指定为概率密度函数,目标是返回期望距离最小的点,我们称之为期望最近邻(ENN)。我们提出了在不同的距离函数下,对于给定的误差参数\(0<\varepsilon<1\),计算精确ENN或\(\varepsilon\)-近似ENN的方法。这些方法构建了一个近似线性大小的数据结构,并根据底层函数在多对数或次线性时间内回答ENN查询。据我们所知,这些是第一个回答精确或(varepsilon)近似ENN查询的非平凡方法,并具有可证明的性能保证。此外,我们扩展了结果以回答精确或(varepsilon)-近似(k)-ENN查询。

理学硕士:

68页第10页 搜索和排序
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Afshani,P.,Chan,T.M.:三维最佳半空间范围报告。摘自:第20届ACM-SIAM离散算法年会论文集(SODA'09),第180-186页。SIAM,费城(2009)·Zbl 1422.68230号
[2] Agarwal,P.K.,Aronov,B.,Har-Peled,S.,Phillips,J.M.,Yi,K.,Zhang,W.:不确定性下的最近邻搜索II。在:第32届ACM SIGMOD-SIGACT-SIGAI数据库系统原理研讨会论文集(PODS’13),第115-126页。ACM,纽约(2013)·Zbl 1445.68076号
[3] Agarwal,P.K.,Cheng,S.-W.,Yi,K.:不确定数据的范围搜索。ACM事务处理。算法8(4),第43条(2012年)。数字对象标识代码:10.1145/2344422.2344433·Zbl 1295.68098号
[4] Agarwal,P.K.,Har-Peled,S.,Sharir,M.,Wang,Y.:点和球转换下的Hausdorff距离。ACM事务处理。算法6(4),第71条(2010年)。数字对象标识代码:10.1145/1824777.1824791·Zbl 1300.52011年
[5] 阿加瓦尔,P.K.,马图舍克,J.:光线拍摄和参数搜索。SIAM J.计算。22(4), 794-806 (1993) ·Zbl 0777.68042号 ·doi:10.1137/0222051
[6] 阿加瓦尔,PK;谢里尔,M。;Sack,J-R(编辑);Urrutia,J.(编辑),《安排及其应用》,49-119(2000),阿姆斯特丹·Zbl 0948.52011号 ·doi:10.1016/B978-044482537-7/50003-6
[7] Aggarwal,C.C.(编辑):管理和挖掘不确定数据。《数据库系统进展》,第35卷。柏林施普林格出版社(2009)·Zbl 1185.68271号
[8] Andoni,A.,Indyk,P.:高维近似最近邻的近最优散列算法。Commun公司。ACM 51(1),117-122(2008)·doi:10.145/1327452.1327494
[9] Arya,S.,Malamatos,T.,Mount,D.M.:近似最近邻搜索的时空权衡。J.ACM 57(54),第1条(2009年)。数字对象标识代码:10.1145/1613676.1613677·Zbl 1204.68103号
[10] Aurenhammer,F。;Klein,R。;Sack,J-R(编辑);Urrutia,J.(编辑),Voronoi图表,201-290(2000),阿姆斯特丹·Zbl 0995.65024号 ·doi:10.1016/B978-044482537-7/50006-1
[11] Aurenhammer,F.,Klein,R.,Lee,D.-T.:Voronoi图和Delaunay三角剖分。世界科学,哈肯萨克(2013)·Zbl 1295.52001号 ·doi:10.1142/8685
[12] Beskales,G.,Soliman,M.A.,IIyas,I.F.:在不确定数据库中高效搜索top-\[k\]k可能最近邻。VLDB 1(1),326-339(2008)
[13] Blömer,J.:计算多项式时间内的根和。摘自:第32届计算机科学基础年度研讨会论文集(FOCS’91),第670-677页。IEEE,洛斯阿拉米托斯(1991)·Zbl 0573.68035号
[14] Cabello,S.:扩展点的近似算法。《算法杂志》62(2),49-73(2007)·Zbl 1120.68116号 ·doi:10.1016/j.jalgor.2004.06.009
[15] Cabello,S.,van Kreveld,M.J.:对齐点的近似算法。摘自:《第19届计算几何年度研讨会论文集》(SCD’13),第20-28页。ACM,纽约(2003)·Zbl 1375.68213号
[16] Chan,T.M.:具有冲突的低维线性规划。SIAM J.计算。34(4), 879-893 (2005) ·Zbl 1075.68092号 ·网址:10.1137/S0097539703439404
[17] Chazelle,B.:关于平面集的凸层。IEEE传输。Inf.理论31(4),509-517(1985)·兹比尔0573.68035 ·doi:10.1109/TIT.1985.1057060
[18] Chazelle,B.,Guibas,L.J.:分数级联。一种数据结构技术。算法1(2),133-162(1986)·Zbl 0639.68056号 ·doi:10.1007/BF01840440
[19] Cheng,R.,Chen,J.,Mokbel,M.,Chow,C.:概率验证器:评估不确定数据上的约束最近邻查询。摘自:IEEE第24届国际数据工程会议记录(ICDE'08),第973-982页。IEEE,洛斯阿拉米托斯(2008)·Zbl 0777.68042号
[20] Cheng,R.,Chen,L.,Cheng,J.,Xie,X.:评估不确定数据上的概率阈值k近邻查询。摘自:《第十二届扩展数据库技术国际会议论文集:数据库技术进展》(EDBT'09),第672-683页。ACM,纽约(2009)
[21] Cheng,R.,Xie,X.,Yiu,M.L.,Chen,J.,Sun,L.:UV-diagram:不确定数据的Voronoi图。摘自:IEEE第26届国际数据工程会议记录(ICDE'10),第796-807页。IEEE,洛斯阿拉米托斯(2010)
[22] Cormode,G.,Li,F.,Yi,K.:概率数据和预期排名的排名查询语义。摘自:IEEE第25届国际数据工程会议记录(ICDE'09),第305-316页。IEEE,洛斯阿拉米托斯(2009)·Zbl 1120.68116号
[23] Dalvi,N.,Ré,C.,Suciu,D.:概率数据库:泥土中的钻石。Commun公司。ACM 52(7),86-94(2009)·doi:10.1145/1538788.1538810
[24] de Berg,M.、Cheong,O.、van Kreveld,M.,Overmars,M.和Schwarzkopf,O.:计算几何:算法和应用,第二版。施普林格,柏林(2000)·Zbl 0939.68134号 ·doi:10.1007/978-3-662-04245-8
[25] Driscoll,J.R.,Sarnak,N.,Sleator,D.D.,Tarjan,R.E.:使数据结构持久化。J.计算。系统。科学。38(1), 86-124 (1989) ·Zbl 0667.68026号 ·doi:10.1016/0022-0000(89)90034-2
[26] Guibas,L.,Hershberger,J.,Snoeyink,J.:紧凑区间树:凸壳的数据结构。摘自:第一届ACM-SIAM离散算法年度研讨会论文集(SODA'90),第169-178页。SIAM,费城(1990)·Zbl 0800.68953号
[27] Guttman,A.:R树:用于空间搜索的动态索引结构。1984年ACM SIGMOD国际数据管理会议记录(SIGMOD'84),第47-57页。ACM,纽约(1984)·Zbl 1075.68092号
[28] Har-Peled,S.:几何近似算法。数学调查与专著,第173卷。美国数学学会,普罗维登斯(2011)·Zbl 1230.68215号
[29] Har-Peled,S.,Kumar,N.:深入兔子洞:次线性空间中的稳健邻近搜索和密度估计。SIAM J.计算。43(4), 1486-1511 (2014) ·Zbl 1302.68318号 ·数字对象标识代码:10.1137/130916448
[30] Hua,M.,Pei,J.,Zhang,W.,Lin,X.:不确定数据的排序查询:概率阈值方法。摘自:2008年ACM SIGMOD国际数据管理会议记录(SIGMOD'08),第673-686页。ACM,纽约(2008)
[31] Jooyandeh,M.,Mohades,A.,Mirzakhah,M.:不确定Voronoi图。信息处理。莱特。109(13), 709-712 (2009) ·Zbl 1209.68585号 ·doi:10.1016/j.ipl.2009.03.007
[32] Kamousi,P。;Chan,TM;苏里,S。;Dehne,F.(编辑);Iacono,J.(编辑);Sack,J-R(ed.),随机点的最近对和邮局问题,第6844、548-559号(2011),海德堡·Zbl 1342.68338号 ·doi:10.1007/978-3-642-22300-646
[33] Kriegel,H。;库纳,P。;伦茨,M。;Kotagiri,Ramamohanarao(编辑);等。,不确定对象的概率最近邻查询,第4443、337-348号(2007),柏林·doi:10.1007/978-3-540-71703-4_30
[34] Li,Y.,Li,F.,Yi,K.,Yao,B.,Wang,M.:灵活聚合相似性搜索。2011年ACM SIGMOD国际数据管理会议记录(SIGMOD'11),第1009-1020页。ACM,纽约(2011)
[35] Li,H.,Lu,H,Huang,B.,Huang.,Z.:两种基于椭圆的修剪方法,用于组最近邻查询。摘自:第13届ACM地理信息系统国际研讨会论文集(GIS’05),第192-199页。ACM,纽约(2005)
[36] Li,F.,Yao,B.,Kumar,P.:分组封闭查询。IEEE传输。知识。数据工程23(10),1526-1540(2011)·doi:10.1109/TKDE.2010.181
[37] Lian,X.,Chen,L.:不确定数据库中的概率群最近邻查询。IEEE传输。知识。数据工程20(6),809-824(2008)·doi:10.1109/TKDE.2008.41
[38] Ljosa,V.,Singh,A.K.:APLA:索引任意概率分布。摘自:IEEE第23届国际数据工程会议记录(ICDE'07),第946-955页。IEEE,洛斯阿拉米托斯(2007)
[39] Löffler,M.,van Kreveld,M.:最大边界盒,最小直径,以及不精确点上的相关问题。计算。地理。43(4), 419-433 (2010) ·Zbl 1208.65029号 ·doi:10.1016/j.comgeo.2009.03.007
[40] 罗,Y。;陈,H。;Furuse,K。;Ohbo,N。;Gervasi,O.(编辑);Gavrilova,ML(ed.),通过基于投影的过滤找到聚合最近邻的有效方法,第4707号,821-833(2007),柏林
[41] Matoušek,J.:半空间中的报告点。计算。地理。2(3), 169-186 (1992) ·Zbl 0772.68105号 ·doi:10.1016/0925-7721(92)90006-E
[42] Papadias,D.,Shen,Q.,Tao,Y.,Mouratidis,K.:分组最近邻查询。摘自:《第20届国际数据工程会议论文集》(ICDE'04),第301-312页。IEEE,华盛顿特区(2004)·Zbl 0772.68105号
[43] Papadopoulos,A.N.,Manolopulos,Y.:最近邻搜索:数据库视角。计算机科学系列。施普林格,纽约(2005)·兹比尔1076.68025
[44] Renz,M.,Mamoulis,N.,Emrich,T.,Tang,Y.,Cheng,R.,Züfle,A.,Zhang,P.:多维不确定数据库的基于Voronoi的最近邻搜索。摘自:2013年IEEE国际数据工程会议记录(ICDE'13),第158-169页。IEEE,华盛顿特区(2013)
[45] Sarnak,N.,Tarjan,R.E.:使用持久搜索树进行平面点定位。Commun公司。ACM 29(7),669-679(1986)·Zbl 0732.68102号 ·数字对象标识代码:10.1145/6138.6151
[46] Sember,J.,Evans,W.:不确定位置的保证Voronoi图。摘自:《第20届加拿大计算几何会议论文集》(CCCG'08),第207-210页。CCCG(2008)·Zbl 0639.68056号
[47] Shakhnarovich,G.,Darrell,T.,Indyk,P.:最近邻搜索和度量空间维度。摘自:《近邻学习与视觉方法:理论与实践》,第15-59页。麻省理工学院出版社,马萨诸塞州剑桥(2006)·Zbl 1075.68092号
[48] Sharifzadeh,M.,Shahabi,C.:VoR-tree:具有Voronoi图的R-trees,用于有效处理空间最近邻查询。VLDB 3(1-2),1231-1242(2010)
[49] Sharir,M.,Agarwal,P.K.:Davenport-Schinzel序列及其几何应用。剑桥大学出版社,剑桥(1995)·Zbl 0834.68113号
[50] Soliman,M.A.,Ilyas,I.F.,Chang,K.C.-。C.:不确定数据库中的Top-\[k\]k查询处理。摘自:IEEE第23届国际数据工程会议记录(ICDE'07),第896-905页。IEEE,洛斯阿拉米托斯(2007)
[51] van Krevild,M.,Löffler,M.,Mitchell,J.S.B.:预处理不精确点和分割三角形。SIAM J.计算。39(7), 2990-3000 (2010) ·Zbl 1211.65024号 ·doi:10.1137/090753620
[52] Wang,H.,Zhang,W.:在顶部-[k\]k加权和聚集\[L_1\]L1平面中最近和最远的邻居。arXiv:1211.5084(2012)·Zbl 1493.68378号
[53] Yiu,M.L.,Mamoulis,N.,Papadias,D.:道路网络中的聚合最近邻查询。IEEE传输。知识。数据工程17(6),820-833(2005)·doi:10.1109/TKDE.2005.87
[54] Yuen,S.M.,Tao,Y.,Xiao,X.,Pei,J.,Zhang,D.:取代不确定空间数据库上的最近邻搜索。IEEE传输。知识。数据工程22(7),1041-1055(2010)·doi:10.1010/TKDE.2009.137
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。