×

大不确定图的高效模式匹配。 (英文) 兹比尔1395.68111

摘要:大量研究致力于寻求图上模式匹配问题的有效解决方案。这种兴趣主要是因为许多应用需要这种有效的解决方案,包括蛋白质复合物预测、社会网络分析和结构模式识别。然而,在许多实际应用中,图形数据往往是有噪声的、不完整的和不准确的。换句话说,存在许多不确定图。因此,在本文中,我们研究了大不确定图背景下的模式匹配。具体来说,我们希望检索不确定图中查询模式的所有合格匹配项。虽然不确定图上的模式匹配是NP-hard,但我们使用了过滤和验证框架来加快搜索速度。在滤波阶段,我们提出了一个概率匹配树(PM-tree),该树由一个切割选择过程获得的匹配切割构建而成。基于PM-树,我们设计了一种集体剪枝策略来剪除大量的不合格匹配。在验证阶段,我们开发了一种有效的采样算法来验证其余候选。广泛的实验结果表明了所提算法的有效性和效率。最后,我们展示了如何将我们的解决方案应用于查询知识图。

MSC公司:

第68页,共15页 数据库理论
68第05页 数据结构
68兰特 计算机科学中的图论(包括图形绘制)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿达尔,E。;Re,C.,管理社交网络中的不确定性,IEEE数据工程公告。,30, 2, 15-22, (2007)
[2] 奥尔,S。;C.比彻。;科比拉罗夫,G。;莱曼,J。;Cyganiak,R。;Ives,Z.,《Dbpedia:开放数据网的核心》,(2007),施普林格出版社
[3] 巴拉斯,E。;Xue,J.,分数着色上界的加权和未加权最大团算法,算法,15397-412,(1996)·Zbl 0846.68078号
[4] Bollacker,K。;埃文斯,C。;Paritosh等人。;斯特奇,T。;Taylor,J.,Freebase:一个合作创建的用于构建人类知识的图形数据库,《数据管理特别兴趣小组会议录》,1247-1250,(2008),美国医学会
[5] Chandran,L.S。;RAM,L.S.,关于图中的最小割数,SIAM J.离散数学。,18, 1, 177-194, (2004) ·兹比尔1071.05046
[6] Cheng,J。;Ke,Y。;楚,S。;Cheng,C.,《大型图中距离查询的高效处理:顶点覆盖方法》(Special Interest Group on Management of Data,(2012),ACM),457-468
[7] Cheng,J。;Ke,Y。;Ng,W。;Lu,A.,Fg-index:面向图形数据库的无验证查询处理,《数据管理特别兴趣小组会议录》,857-872,(2007),ACM
[8] Cheng,J。;于建新。;丁,B。;余,P.S。;Wang,H.,快速图形模式匹配,(国际数据工程会议论文集,(2008),IEEE),913-922
[9] Cheng,Y。;袁,Y。;Chen,L。;Wang,G.,大型相关不确定图上基于阈值的最短路径查询,J.Compute。科学。技术。,30, 4, 762-780, (2015)
[10] Chui,H。;Sung,W.-K。;Wong,L.,利用间接邻域和拓扑权重从蛋白质相互作用中预测蛋白质功能,生物信息学,22,13,47-58,(2007)
[11] Colbourn,C.J.,《网络可靠性组合数学》(1987),牛津大学出版社
[12] 库克·W·J。;坎宁安,W.H。;滑轮板,W.R。;Schrijver,A.,组合优化,(1997),Wiley Interscience
[13] Dimitrov博士。;辛格,L。;Mann,J.,《比较不确定图形的查询操作符》,《大尺度数据和知识中心系统交易》第十八卷,第18卷,第115-152页,(2015),施普林格出版社
[14] 杜,L。;李,C。;陈,H。;Tan,L。;Zhang,Y.,不确定图上的概率simrank计算,Inform。科学。,295, 521-535, (2015) ·Zbl 1360.68834号
[15] Hochbaum,D.S.,NP-Hard问题的近似算法,(1997),PWS
[16] Ernst,P。;小A。;Weikum,G.,《Knowlife:构建生物医学科学大型知识图的通用方法》,BMC Bioinform。,16, 157-167, (2015)
[17] 法比安,M。;Gjergji,K。;Gerhard,W.,Yago:统一wordnet和wikipedia的语义知识核心,(第16届国际万维网会议,(2007),ACM),697-706
[18] 风扇,W。;李,J。;罗,J。;Tan,Z。;王,X。;Wu,Y.,增量图模式匹配(Incremental graph pattern matching),《数据管理特别兴趣小组会议录》(2011),美国医学会,925-936
[19] 风扇,W。;李,J。;马,S。;Tang,N。;Wu,Y.,将正则表达式添加到图形可达性和模式查询中,(数据工程国际会议论文集,(2011),IEEE),39-50
[20] 风扇,W。;李,J。;马,S。;Tang,N。;Wu,Y。;Wu,Y.,图模式匹配:从难处理到多项式时间,《超大数据库学报》,264-275,(2010),ACM
[21] 方,L。;Sarma,A.D。;Yu,C。;Bohannon,P.,Rex:解释实体对之间的关系,Proc。荷兰VLDB。,5, 3, 241-252, (2011)
[22] Fishman,G.S.,基于产品形态估计的蒙特卡罗抽样计划,第23届冬季模拟会议论文集,1012-1017,(1991),IEEE计算机学会
[23] Fu,A.W.-C。;Wu,H。;Cheng,J。;Wong,R.C.-W.,Is-label:一种基于独立集的点到点距离查询标记方案,Proc。荷兰VLDB。,6, 6, 457-468, (2013)
[24] 高,Y。;Yang,L。;李,S。;Kar,S.,关于不确定图中直径的分布函数,Inform。科学。,296, 61-74, (2015) ·Zbl 1360.05131号
[25] Garey,M.R。;Johnson,D.S.,《计算机与不可纠正性:NP-完备性理论指南》,(1979),W.H.Freeman·Zbl 0411.68039号
[26] Gomory,R.E。;Hu,T.C.,多终端网络流,SIAM,9551-570,(1961)·Zbl 0112.12405号
[27] 韩,S。;彭,Z。;Wang,S.,不确定网络的最大流问题,Inform。科学。,265, 167-175, (2014) ·Zbl 1328.90018号
[28] 赫尔曼,J.L。;阿拉斯加州诺瓦克。;Lyngsø,R.B。;萨博,A。;米克洛斯,I。;Hein,J.,使用有向无环图有效表示多序列比对中的不确定性,BMC Bioninform。,16, 108-134, (2015)
[29] Hogan,A。;梅洛特,M。;鲍威尔,G。;Stampouli,D.,面向RDF的模糊查询松弛,语义Web:研究与应用,687-702,(2012),Springer
[30] Hua,M。;Pei,J.,《道路网络中的概率路径查询:交通不确定性感知路径选择》,(扩展数据库技术国际会议论文集,(2010),ACM),347-358
[31] 黄,H。;Liu,C.,概率rdf数据库的查询评估,(WISE学报,(2009),Springer),307-320
[32] 金·R。;刘,L。;Aggarwal,C.C.,《在不确定图中发现高度可靠的子图》,(数据库知识发现学报,(2011),ACM),992-1000
[33] 金·R。;刘,L。;丁,B。;Wang,H.,不确定图中的距离约束可达性计算,(《超大数据库学报》,(2011),ACM),551-562
[34] 金·R。;Wang,G.,简单、快速和可扩展的可达性oracle,Proc。荷兰VLDB。,6, 14, 1978-1989, (2013)
[35] Kasneci,G。;Elbassuoni,S。;Weikum,G.,Ming:挖掘信息实体关系子图,信息与知识管理会议论文集,1653-1656,(2009),ACM
[36] Kasneci,G。;Suchanek,F.M。;伊弗里姆,G。;拉马纳(M.Ramanath)。;Weikum,G.,Naga:搜索和排序知识,国际数据工程会议,953-962,(2008),IEEE
[37] A.Khan。;Wu,Y。;阿加瓦尔,C.C。;Yan,X.,Nema:具有标签相似性的快速图形搜索,Proc。荷兰VLDB。,181-192年6月3日(2013年)
[38] K.Thompson,S.,《抽样第三版》,《概率统计中的威利级数》(2012),威利出版社·Zbl 1267.62020号
[39] Chen,L。;Lian,X.,概率rdf图中的高效查询应答,(数据管理特别兴趣小组会议记录,(2011),ACM),157-168
[40] Liben-Nowell,D。;Kleinberg,J.,《社交网络的链接预测问题》(The link prediction problem for social networks),(信息与知识管理会议论文集,(2003),ACM),556-569
[41] 刘,L。;金·R。;阿格拉瓦尔,C。;Shen,Y.,不确定图上的可靠聚类,ICDM论文集,459-468,(2012),IEEE
[42] 马,S。;曹毅。;风扇,W。;怀,J。;Wo,T.,捕获图模式匹配中的拓扑,(《超大数据库学报》,(2012年),ACM),310-321
[43] Makino,K。;Uno,T.,枚举所有最大团的新算法,(SWAT学报,(2004),Springer),260-272·Zbl 1095.68626号
[44] Mitzenmacher先生。;Upfal,E.,《概率与计算:随机算法与概率分析》,(2005),剑桥大学出版社·Zbl 1092.60001号
[45] Morsey先生。;莱曼,J。;奥尔,S。;Ngomo,A.-C.N.,Dbpedia sparql基准绩效评估与实际数据的实际查询,语义网-ISWC 2011,454-469,(2011),Springer
[46] Nguyen,H.H。;艾敏,A。;Rusinovitch,M.,《通过不确定性语义匿名社会图》,(第十届ACM信息研讨会论文集,计算机与通信安全(CCS’15),(2015),ACM),495-506
[47] Page,L。;布林,S。;Motwani,R。;Winograd,T.,《pagerank引文排名:给网络带来秩序》,斯坦福信息实验室,9,1,1-14,(1999)
[48] O.帕帕彼得鲁。;Ioannou,E。;Skoutas,D.,《不确定图数据库中频繁子图模式的高效发现》(《扩展数据库技术国际会议论文集》,(2011),ACM),355-366
[49] B.Pasdeloup,R.Alami,V.Gripon,M.Rabbat,《关于加权图的不确定性原理》,arXiv预印本arXiv:153.032912015年。
[50] Potamias,M。;邦奇,F。;Gionis,A。;Kollios,G.,不确定图中的K-最近邻,(《超大数据库学报》,(2010),ACM),997-1008
[51] Rezvanian,A。;Meybodi,M.R.,使用分布式学习自动机在随机图中寻找最大团,Int.J.Uncertain。模糊。知识-基于系统。,23, 1, 1-32, (2015) ·Zbl 1323.05113号
[52] Rintaro,S。;Harukazu,S。;Yoshihide,H.,《相互作用共性:评估蛋白质相互作用可靠性的测量》,Nucl。《酸类研究》,30,5,1163-1168,(2002)
[53] 苏丘,D。;Dalvi,N.N.,《查询概率答案的基础》,(数据管理特别利益小组会议记录,(2005),ACM),963
[54] Suthram,S。;Shlomi,T。;鲁平,E。;沙兰,R。;Ideker,T.,蛋白质相互作用置信分配方案的直接比较,生物信息学,7,1,360-370,(2006)
[55] Tong,H。;Faloutsos,C.,《中段子图:问题定义和快速解决方案》,《数据库中的知识发现学报》,404-413,(2006),ACM
[56] Topkis,D.M.,《超模块性和互补性》(1998),普林斯顿大学出版社
[57] 魏,H。;于建新。;卢,C。;Jin,R.,可达性查询:一种独立的置换标记方法,Proc。荷兰VLDB。,7, 12, 1191-1201, (2014)
[58] 吴,W。;李,H。;Wang,H。;朱克强,《Probase:文本理解的概率分类法》,《数据管理特别兴趣小组会议录》,481-492,(2012),ACM
[59] 徐,L。;Jeavons,P.,《来自大自然的模式:用简单的信息和最少的图形知识进行分布式贪婪着色》,Inform。科学。,316, 550-566, (2015) ·Zbl 1390.90453号
[60] 严,X。;余,P.S。;Han,J.,图表索引:一种基于频繁结构的方法,(《数据管理特别兴趣小组会议录》,(2004),ACM),335-346
[61] Yang,S。;Wu,Y。;Sun,H。;Yan,X.,无模式和无结构图查询,Proc。荷兰VLDB。,7, 7, 565-576, (2014)
[62] Yang,S。;谢毅。;Wu,Y。;Wu,T。;Sun,H。;吴杰。;严,X.,SLQ:一个用户友好的图形查询系统,(数据管理特别兴趣小组,(2014),ACM),893-896
[63] Yeh,L。;王,B。;Su,H.,通过非减权枚举切割问题的高效算法,算法,56,3,297-312,(2010)·Zbl 1187.68689号
[64] 袁,Y。;王,G。;Chen,L.,大不确定图中的模式匹配查询,(信息与知识管理会议,(2014),ACM),519-528
[65] 袁,Y。;王,G。;Chen,L。;Wang,H.,大型概率图数据库的高效子图相似性搜索,(《超大数据库学报》,(2012),ACM),800-811
[66] 袁,Y。;王,G。;Chen,L。;Wang,H.,不确定图形数据的高效关键词搜索,TKDE,25,12,2767-2779,(2013)
[67] 袁,Y。;王,G。;Chen,L。;Wang,H.,大型不确定图形数据库的图形相似性搜索,VLDB J.,24,2,271-296,(2014)
[68] 袁,Y。;王,G。;Wang,H。;Chen,L.,大型不确定图的高效子图搜索,(《超大数据库学报》,(2011),ACM),876-886
[69] 袁,Y。;王,G。;Xu,J.Y。;Chen,L.,高效分布子图相似性匹配,VLDB J.,24,3,369-394,(2015)
[70] Zhang,Q.,用于知识表示和概率推理的动态不确定因果图:有向循环图和联合概率分布,IEEE Trans。神经网络。学习。系统。,26, 7, 1503-1517, (2015)
[71] Zhang,Q.,用于知识表示和推理的动态不确定因果图:连续变量、不确定证据和故障预测,IEEE Trans。系统。人类网络:系统。,45, 7, 990-1003, (2015)
[72] 赵,P。;于建新。;Yu,P.S.,图索引:树+增量>=图,(《超大数据库学报》,(2007),ACM),938-949
[73] Zong,B。;Raghavendra,R。;Srivatsa,M。;严,X。;辛格,A.K。;Lee,K.,通过子图匹配的云服务布局,(国际数据工程会议,(2014),IEEE),832-843
[74] 邹,L。;Chen,L。;Ozsu,M.T.,距离连接:大型图形数据库中的模式匹配查询,(《超大数据库学报》,(2009),ACM),886-897
[75] 邹,L。;黄,R。;Wang,H。;于建新。;他,W。;Zhao,D.,《基于RDF的自然语言问答:图形数据驱动方法》(Special Interest 840 Group on Management of data,(2014),ACM),第313-324页
[76] 邹,Z。;高,H。;Li,J.,在概率语义下发现不确定图数据库上的频繁子图,(数据库知识发现学报,(2010),ACM),633-642
[77] 邹,Z。;高,H。;李,J。;Zhang,S.,从不确定图数据中挖掘频繁子图模式,TKDE,22,9,1203-1218,(2010)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。