×

通过编辑距离对图形进行快速相似性搜索。 (英语。俄文原件) Zbl 1433.68106号

赛博。系统。分析。 55,第6号,1039-1051(2019); 翻译自Kibern。修女。分析。2019年,第6期,178-194(2019)。
摘要:这篇调查文章考虑了索引结构,用于快速搜索由树和图表示的对象的相似性。编辑距离用作相似性度量。考虑精确相似性搜索查询的执行。主要介绍了基于反向索引过滤和细化策略的算法。还考虑了精确计算图形编辑距离及其上下界的算法。

MSC公司:

68第05页 数据结构
68页第10页 搜索和排序
第68页,共15页 数据库理论
68兰特 计算机科学中的图论(包括图形绘制)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Rachkovskij,DA,符号字符串快速相似性搜索的索引结构,控制论与系统分析,55,5,860-878(2019)·Zbl 1434.68145号 ·doi:10.1007/s10559-019-00196-7
[2] Rachkovskij,DA,用于快速距离和相似性估计的实值向量,控制论和系统分析,52,6,967-988(2016)·Zbl 1359.62261号 ·数字对象标识码:10.1007/s10559-016-9899-x
[3] Rachkovskij,DA,用于快速距离和相似性估计的二进制向量,控制论和系统分析,53,1,138-156(2017)·兹比尔1366.93641 ·数字对象标识代码:10.1007/s10559-017-9914-x
[4] Rachkovskij,DA,用于快速相似性搜索的基于距离的索引结构,控制论和系统分析,53,4,636-658(2017)·兹比尔1392.68175 ·doi:10.1007/s10559-017-9966-y
[5] Rachkovskij,DA,二进制向量快速相似性搜索的索引结构,控制论和系统分析,53,5,799-820(2017)·兹比尔1392.68174 ·数字对象标识代码:10.1007/s10559-017-9983-x
[6] Rachkovskij,DA,实值向量快速相似性搜索的索引结构。一、 控制论与系统分析,54,1,152-164(2018)·Zbl 1390.68249号 ·doi:10.1007/s10559-018-0016-1
[7] Rachkovskij,DA,实值向量快速相似性搜索的索引结构。二、 控制论与系统分析,54,2,320-335(2018)·Zbl 1392.68176号 ·数字对象标识代码:10.1007/s10559-018-0034-z
[8] 陆军部Rachkovskij;Slipchenko,SV,基于相似性的检索与结构敏感的稀疏二进制分布式表示,Comp。《情报》,28,1,106-129(2012)·文件编号:10.1111/j.1467-8640.2011.00423.x
[9] P.Bille,“树编辑距离和相关问题的调查”,《理论计算机科学》,第337卷,第1-3期,第217-239页(2005年)·Zbl 1078.68152号
[10] K.-C.Tai,“树对树修正问题”,《计算机协会期刊》,第26卷,422-433页(1979年)·Zbl 0409.68040号
[11] Levenshtein,VI,《能够纠正删除、插入和反转的二进制代码》,《苏联物理学-多克拉迪》,10,8,707-710(1966)·Zbl 0149.15905号
[12] 高,X。;肖,B。;陶,D。;Li,X.,图形编辑距离的调查,模式分析与应用,13,1,113-129(2010)·Zbl 1422.68211号 ·doi:10.1007/s10044-008-0141-y
[13] Sanfeliu,A。;Fu,KS,用于模式识别的属性关系图之间的距离度量,IEEE Trans。系统。人、赛博、。,13, 3, 353-362 (1983) ·Zbl 0511.68060号 ·doi:10.1109/TSMC.1983.6313167
[14] 张凯。;Jiang,T.,关于无序标记树的一些MAX SNP-hard结果,信息处理快报,49,249-254(1994)·Zbl 0795.68073号 ·doi:10.1016/0020-0190(94)90062-0
[15] Pawlik,M。;Augsten,N.,Rted:树编辑距离的稳健算法,VLDB捐赠会议记录,5,4,334-345(2011)·doi:10.14778/209586.2095692
[16] Pawlik先生。;Augsten,N.,《树编辑距离:健壮和节省内存》,信息系统,56,157-173(2016)·doi:10.1016/j.is.2015.08.004
[17] K.Kailing、H.-P.Kriegel、S.Schonauer和T.Seidl,“大型数据库中分层数据的有效相似性搜索”,载于:Proc。EDBT'04(2004),第676-693页。
[18] S.Berchtold、D.Keim和H.P.Kriegel,《X树:高维数据的索引结构》,摘自:Proc。VLDB’96(1996),第28-39页。
[19] R.Yang、P.Kalnis和A.K.H.Tung,“树结构数据的相似性评估”,摘自:Proc。SIGMOD'05(2005),第754-765页。
[20] Guha,S。;贾加迪什,HV;北卡罗来纳州库达斯。;Srivastava,D。;Yu,T.,使用近似联接集成XML数据源,ACM Trans。数据库系统。,31, 1, 161-207 (2006) ·数字对象标识代码:10.1145/1132863.1132868
[21] Akutsu,T。;Fukagawa,D。;Takasu,A.,通过字符串编辑距离近似树编辑距离,Algorithmica,57,2,325-348(2010)·Zbl 1184.68628号 ·doi:10.1007/s00453-008-9213-z
[22] Tang,Y。;蔡,Y。;Mamoulis,N.,《树结构数据上的缩放相似性连接》,Proc。VLDB捐赠,8,11,1130-1141(2015)·doi:10.14778/2809974.2809976
[23] 曾,Z。;东,AKH;Wang,J。;冯,J。;周,L.,《比较恒星:关于近似图形编辑距离》,Proc。VLDB捐赠,2,1,25-36(2009年)·doi:10.14778/1687627.1687631
[24] X.Zhao、C.Xiao、X.Lin和W.Wang,“有效的图形相似性与编辑距离约束相结合”,in:Proc。ICDE’12(2012),第834-845页。
[25] Gouda,K。;Arafa,M.,《改进的图形编辑相似性搜索的全局下限》,Pattern Recogn。莱特。,58, 8-14 (2015) ·doi:10.1016/j.patrec.2015.02.004
[26] 王,G。;王,B。;杨,X。;Yu,G.,为相似性搜索高效索引大型稀疏图,IEEE Trans。知识与数据工程,24,3,440-451(2012)·doi:10.1109/TKDE.2010.28
[27] S.Bougleux、B.Gauzere、D.B.Blumenthal和L.Brun,“带纠错和无成本约束的快速线性和赋值”,《模式识别》。莱特。https://doi.org/10.1016/j.patrec.2018.03.032。
[28] H.W.Kuhn,“分配问题的匈牙利方法”,《海军研究后勤季刊》,第2卷,第1-2期,第83-97页(1955年)·Zbl 0143.41905号
[29] Munkres,J.,《分配和运输问题的算法》,《工业和应用数学学会杂志》,5,1,32-38(1957)·Zbl 0083.15302号 ·数字对象标识代码:10.1137/0105003
[30] X.Wang,X.Ding,A.K.H.Tung,S.Ying和H.Jin,“一种有效的图索引方法”,载于:Proc。ICDE’12,210-221(2012)。
[31] X.赵。;肖,C。;林,X。;Wang,W。;Ishikawa,Y.,具有编辑距离约束的图相似性查询的有效处理,VLDB J,22727-752(2013)·doi:10.1007/s00778-013-0306-1
[32] K.Riesen、S.Fankhauser和H.Bunke,“用二部启发式加速图形编辑距离计算”,见:Proc。MLG'07(2007),第21-24页·Zbl 1381.05068号
[33] 郑伟。;邹,L。;Lian,X。;王,D。;Zhao,D.,大型图形数据库上的高效图形相似性搜索,IEEE TKDE,27,4,964-978(2015)
[34] Z.Li,X.Jian,X.Lian,和L.Chen,“图相似性搜索的有效概率方法”,摘自:Proc。ICDE’18(2018),第533-544页。
[35] 秦,J。;Xiao,C.,Pigeoring:快速阈值相似性搜索的原理,Proc。VLDB Endow,12,1,28-42(2018)·doi:10.14778/3275536.3275539
[36] X.赵。;肖,C。;林,X。;张伟。;Wang,Y.,《高效结构相似性搜索:基于分区的方法》,《VLDB期刊》,27,1,53-78(2018)·doi:10.1007/s00778-017-0487-0
[37] Y.Liang和P.Zhao,“图形数据库中的相似性搜索:多层索引方法”,摘自:Proc。ICDE’17(2017),第783-794页。
[38] Z.Abu-Aisheh、R.Raveaux和J.-Y.Ramel,“图空间中高效的k近邻搜索”,《模式识别字母》。https://doi.org/10.1016/j.patrec.2018.05.001。 ·Zbl 1489.68178号
[39] Blumenthal,DB;Gamper,J.,《改进的图形编辑距离下限》,IEEE TKDE,30,3,503-516(2018)
[40] D.B.Blumenthal和J.Gamper,“关于图形编辑距离的精确计算”,《模式识别快报》(2018年)。https://doi.org/10.1016/j.patrec.2018.05.002。 ·Zbl 1489.68182号
[41] Abu-Aisheh,Z。;Gauzere,B。;Bougleux,S。;Ramel,J-Y;Brun,L。;Raveaux,R。;Heroux,P。;Adam,S.,《图形编辑距离竞赛:结果和未来挑战》,《模式识别快报》,100,96-103(2017)·doi:10.1016/j.patrec.2017.10.007
[42] K.Riesen,M.Neuhaus,H.Bunke,“计算图形编辑距离的二部图匹配”,in:Proc。GbRPR’07(2007),第1-12页·Zbl 1182.68205号
[43] Riesen,K。;Bunke,H.,通过二分图匹配进行近似图编辑距离计算,图像和视觉计算,27,7950-959(2009)·doi:10.1016/j.imavis.2008.04.004
[44] Z.Abu-Aisheh、R.Raveaux、J.Y.Ramel和P.Martineau,《解决模式识别问题的精确图形编辑距离算法》。婴儿车’15。2015年,第271-278页。
[45] Abu-Aisheh,Z。;Raveaux,R。;Ramel,J-Y;Martineau,P.,平行图编辑距离算法,应用专家系统,94,41-57(2018)·doi:10.1016/j.eswa.2017.10.043
[46] Gouda,K。;Hassaan,M.,用于图形编辑相似性计算的全新边缘中心方法,信息系统,80,91-106(2019)·doi:10.1016/j.is.2018.10.003
[47] 陈,X。;霍,H。;黄,J。;Vitter,JS,图形编辑距离计算的有效算法,基于知识的系统,163762-775(2019)·doi:10.1016/j.knosys.2018.10.002
[48] R.Zhou和E.A.Hansen,“波束跟踪搜索:将回溯与波束搜索相结合”,摘自:Proc。ICAPS’05(2005),第90-98页。
[49] L.Chang、X.Feng、X.Lin、L.Qin和W.Zhang,“通过主持人感知的下限估计进行有效的图形编辑距离计算和验证”,arXiv:1709.06810。2017年10月1日。
[50] 正义,D。;Hero,A.,图形编辑距离的二进制线性规划公式,IEEE Trans。模式分析。机器。智力。,28, 8, 1200-1214 (2006) ·doi:10.1109/TPAMI.2006.152
[51] Lerouge,J。;Abu-Aisheh,Z。;Raveaux,R。;Heroux,P。;Adam,S.,计算图形编辑距离的新二进制线性规划公式,模式识别,72,254-265(2017)·doi:10.1016/j.patcog.2017.07.029
[52] Ì. Darwiche、R.Raveaux、D.Conte和V.T'Kindt,“精确上下文中的图形编辑距离”,摘自:Proc。S+SSPR’18(2018),第304-314页。
[53] V.Carletti、B.Gauzere、L.Brun和M.Vento,“结合二部匹配和精确邻域子结构距离的近似图形编辑距离计算”,摘自:Proc。GbRPR’15(2015),第188-197页。
[54] D.Blumenthal、S.Bougleux、J.Gamper和L.Brun,“基于环的图形编辑距离近似”,载于:Proc。S+SSPR’18(2018),第293-303页。
[55] Bougleux,S。;布鲁恩,L。;卡莱蒂,V。;Foggia,P。;Gauzere,B。;Vento,M.,图形编辑距离作为二次分配问题,模式识别字母,87,38-46(2017)·doi:10.1016/j.patrec.2016.1001
[56] E.Daller、S.Bougleux、B.Gauzere和L.Brun,“通过并行的几个局部搜索近似图形编辑距离”,摘自:Proc。ICPRAM’18(2018),第149-158页。
[57] M.Darwiche、D.Conte、R.Raveaux和V.T'Kindt,“解决图形编辑距离问题的局部分支启发式”,Comp.&操作。物件。https://doi.org/10.1016/j.cor.2018.02.002。 ·Zbl 1458.68200元
[58] Gouda,K。;阿拉法,M。;Calders,T.,一种新的基于层次结构的图形编辑距离上限计算框架,模式识别,80,210-224(2018)·doi:10.1016/j.patcog.2018.03.019
[59] 斯利普琴科,SV;Rachkovskij,DA,使用二进制分布表示的相似性进行类比映射,信息理论与应用,16,3,269-290(2009)
[60] Rachkovskij,DA,《结构敏感分布式表示的类比映射的一些方法》,《实验与理论人工智能杂志》,16,3,125-144(2004)·Zbl 1083.68581号 ·doi:10.1080/09528130410001712862
[61] Rachkovskij,DA,用随机二进制投影形成相似性反射二进制向量,控制论与系统分析,51,2,313-323(2015)·Zbl 1317.93233号 ·doi:10.1007/s10559-015-9723-z
[62] 陆军部Rachkovsky;Gritsenko,VI,基于随机投影的矢量数据分布式表示[乌克兰语](2018),基辅:Interservice,基辅
[63] Rachkovskij,DA;Revunova,EG,解决离散不定问题的随机方法,控制论与系统分析,48,4,621-635(2012)·Zbl 1311.65043号 ·doi:10.1007/s10559-012-9443-6
[64] Revunova,EG,基于奇异分解和随机投影解决离散不定问题的线性模型的模型选择标准,控制论和系统分析,52,4,647-664(2016)·Zbl 1347.93006号 ·doi:10.1007/s10559-016-9868-4
[65] E.G.Revunova,“基于随机投影解决离散不定问题时矩阵的平均值”,摘自:Proc。CSIT’17(2017),第473-478页。
[66] Riba,P。;Llados,J。;Fornes,A。;Dutta,A.,使用节点上下文的二进制嵌入对文档图像数据库中的信息进行定位的大比例图索引,《模式识别快报》,87,203-211(2017)·doi:10.1016/j.parec.2016.0.015
[67] A.Narayanan、M.Chandramohan、R.Venkatesan、L.Chen、Y.Liu和S.Jaiswal,“图2vec:学习图的分布式表示”,摘自:Proc。MLG’17(2017),第21:1-21:8页。
[68] 戈亚尔,P。;Ferrara,E.,图嵌入技术、应用和性能:调查,基于知识的系统,15178-94(2018)·doi:10.1016/j.knosys.2018.03.022
[69] 吴振中、潘石屹、陈福成、龙国龙、张振中、余培生,《图形神经网络综合综述》,arXiv:1901.00596。2019年3月10日。
[70] Y.Bai,H.Ding,S.Bian,T.Chen,Y.Sun,W.Wang,“SimGNN:一种快速图相似性计算的神经网络方法”,Proc。WSDM’19(2019),第384-392页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。