×

关于具有图生成依赖关系的属性图的推理。 (英语) Zbl 07864686号

摘要:数据依赖是数据管理中的一个关键概念,已经在数据集成、数据质量和查询优化方面进行了研究。随着图形结构数据在各种应用中的使用越来越多,人们对图形数据依赖性的研究也越来越感兴趣。在这种情况下,文献中提出了不同类别的图数据依赖。在这项工作中,我们研究了图形生成依赖(GGD)类。图形生成依赖项(GGD)非正式地表示两个(可能不同的)图形模式之间的约束,它们在两个图形的数据(通过属性值约束)及其结构(通过拓扑约束)。虽然以前提出的大多数图形数据依赖类都侧重于推广图形数据的等式生成依赖,但图形生成依赖(GGD)可以表示属性图上的元组生成依赖和等式生成依存,这两种依赖在图形数据管理中都有广泛的应用。考虑到这类新的依赖关系,在本文中,我们讨论了属性图上GGD背后的推理。我们提出了解决三个主要推理问题的算法:可满足性,含义,以及验证GGD的问题并分析其复杂性。通过研究这些问题,我们可以了解GGD在实际应用中的表现力和局限性。为了演示GGD的实际应用,我们提出了一种通过验证GGD发现数据不一致的算法。我们的实验表明,尽管GGD的验证具有很高的计算复杂性,但GGD可以用于在合成数据和真实数据的可行执行时间内发现数据不一致。

MSC公司:

68单位35 信息系统的计算方法(超文本导航、接口、决策支持等)
第68页,共15页 数据库理论
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 巴塞洛,P。;佩雷斯,J。;Reutter,J.,图形数据库的模式映射和数据交换,(第16届数据库理论国际会议论文集,ICDT’13,2013,计算机械协会:美国纽约州纽约市计算机械协会),189-200
[2] 波哈农,P。;风扇,W。;Geerts,F。;贾,X。;Kementsietsidis,A.,数据清理的条件函数依赖性,(2007年IEEE第23届国际数据工程会议,2007年),746-755
[3] 风扇,W。;Geerts,F.,《数据质量管理基础》,《数据管理综合讲座》,2012年,Morgan&Claypool出版社·Zbl 1252.68016号
[4] Fan,W.,《图形的依赖性:挑战和机遇》,J.Data Inf.Qual。,11, 2, 2019
[5] 风扇,W。;Lu,P.,图的依赖性,ACM Trans。数据库系统。,44, 2, 2019 ·Zbl 1474.68097号
[6] 风扇,W。;Wu,Y。;Xu,J.,图的函数依赖性,(2016年国际数据管理会议论文集,SIGMOD’16,2016,计算机械协会:美国纽约州纽约市计算机械协会),1843-1857
[7] 弗朗西斯,N。;Libkin,L.,数据图的模式映射,(第36届ACM SIGMOD-SIGACT-SIGAI数据库系统原理研讨会论文集,PODS’17,2017,计算机械协会:美国纽约州纽约市计算机械协会),389-401
[8] 伊利亚斯,I.F。;Chu,X.,数据清理,2019年,美国纽约州纽约市计算机械协会
[9] Bonifati,A。;弗莱彻,G。;Voigt,H。;Yakovets,N.,Querying Graphs,2018,摩根&克莱普尔出版社·Zbl 1398.68006号
[10] 南部夸什。;刘,L。;刘杰。;Stumptner,M。;李,J。;Yang,L.,Certus:一种有效的图形微分依赖实体解析方法,Proc。荷兰VLDB。,12, 6, 653-666, 2019
[11] 下村,L.C。;弗莱彻,G。;Yakovets,N.,Ggds:图形生成依赖性,(第29届ACM信息和知识管理国际会议论文集,CIKM’20,2020,计算机械协会:美国纽约州纽约市计算机械协会),2217-2220
[12] 宋,S。;Chen,L.,《差异依赖:推理和发现》,ACM Trans。数据库系统。,36, 3, 2011
[13] 风扇,W。;Geerts,F。;贾,X。;Kementsietsidis,A.,捕获数据不一致的条件函数依赖性,ACM Trans。数据库系统。,33, 2, 2008
[14] 南部夸什。;刘杰。;李,J。;Ye,F.,《挖掘差异依赖:子空间聚类方法》(Wang,H.;Sharaf,M.a.,《数据库理论与应用》,2014年,Springer International Publishing:Springer国际出版公司Cham),50-61
[15] 南部夸什。;刘杰。;李,J。;Ye,F.,通过关联规则挖掘高效发现差异依赖,(Sharaf,M.A.;Cheema,M.A;Qi,J.,数据库理论与应用,2015,Springer International Publishing:Springer国际出版公司Cham),3-15
[16] 宋,S。;Chen,L。;Cheng,H.,差分相关性距离阈值的有效确定,IEEE Trans。知识。数据工程,2014年9月26日,2179-2192
[17] 比里,C。;Vardi,M.Y.,《数据相关性的证明程序》,J.ACM,31,4718-7411984年·Zbl 0632.68097号
[18] 费金,R。;Kolaitis,P.G。;米勒,R.J。;Popa,L.,《数据交换:语义和查询应答》,(Calvanee,D.;Lenzerini,M.;Motwani,R.,《数据库理论-ICDT 2003》,2003年,斯普林格·柏林-海德堡:斯普林格尔·柏林-海德堡-柏林,海德堡),207-224·Zbl 1022.68510号
[19] 马,S。;风扇,W。;Bravo,L.,用条件扩展包含依赖性,Theor。计算。科学。,515, 64-95, 2014 ·Zbl 1277.68067号
[20] 杜尔施,F。;斯坦纳。;Windheuser,F。;费舍尔,M。;弗里德里希,T。;斯特雷洛,N。;布莱夫,T。;Harmouch,H。;江,L。;Papenbrock,T。;Naumann,F.,《包含依赖发现:十三种算法的实验评估》,(第28届ACM信息和知识管理国际会议论文集,CIKM’2019年19月,计算机械协会:美国纽约州纽约市计算机械协会),219-228
[21] 克鲁斯,S。;Jentzsch,A。;Papenbrock,T。;高迪,Z。;基安·鲁伊斯,J.-A。;Naumann,F.,Rdfind:rdf数据集中的可扩展条件包含依赖发现,(2016年国际数据管理会议论文集,SIGMOD’16,2016,计算机械协会:美国纽约州纽约市计算机械协会),953-967
[22] Maher,M.J。;Srivastava,D.,Chasing约束元组生成依赖,(第十五届ACM SIGACT-SIGMOD-SIGART数据库系统原理研讨会论文集,1996),128-138
[23] Cheng,Y。;Chen,L。;袁,Y。;Wang,G.,基于规则的图修复:语义和高效修复方法,(2018年IEEE第34届国际数据工程会议(ICDE),2018),773-784
[24] 风扇,W。;王,X。;Wu,Y。;Xu,J.,关联规则与图形模式,Proc。荷兰VLDB。,8, 12, 1502-1513, 2015
[25] Alipourlangouri,M。;曼斯菲尔德,A。;蒋,F。;Wu,Y.,时序图功能依赖性,2022,技术报告
[26] Zada,M.S.H。;袁,B。;Anjum,A。;阿扎德,医学硕士。;汗,W.A。;Reiff Marganiec,S.,使用图概率依赖性(gpds)的大规模数据集成,(2020 IEEE/ACM大数据计算、应用和技术国际会议(BDCAT),2020),27-36
[27] Chandra,A.K。;Merlin,P.M.,关系数据库中联合查询的优化实现,(第九届ACM计算理论研讨会论文集,STOC’77,1977,计算机械协会:美国纽约州纽约市计算机械协会),77-90
[28] Greco,S。;莫里纳罗,C。;Spezzano,F.,关系数据库中的不完整数据和数据依赖,Synth。莱克特。数据管理。,4, 5, 1-123, 2012 ·Zbl 1254.68006号
[29] Calautti,M。;Gottlob,G。;Pieris,A.,保护存在规则的大通终止,(第34届ACM SIGMOD-SIGACT-SIGAI数据库系统原理研讨会论文集,PODS’15,2015,计算机械协会:美国纽约州纽约市计算机械协会),91-103
[30] Gogacz,T。;Marcinkowski,J。;Pieris,A.,All-instances restricted chase termination,(第39届ACM SIGMOD-SIGACT-SIGAI数据库系统原理研讨会论文集,PODS’20,2020,计算机械协会:美国纽约州纽约市计算机械协会),245-258
[31] 费金,R。;Kolaitis,P.G。;米勒,R.J。;Popa,L.,《数据交换:语义和查询应答》,数据库理论。数据库理论,Theor。计算。科学。,336, 1, 89-124, 2005 ·Zbl 1080.68019号
[32] Papadimitriou,C.,计算复杂性,理论计算机科学,1994,Addison-Wesley·Zbl 0833.68049号
[33] 皮克勒,R。;Skritek,S.,评估元组生成依赖的复杂性,(第14届数据库理论国际会议论文集,ICDT’11,2011,计算机械协会:美国纽约州纽约市计算机械协会),244-255
[34] 地狱,P。;Nešetřil,J.,关于h着色的复杂性,J.Comb。理论,Ser。B、 1990年9月1日至110日,第48页·Zbl 0639.05023号
[35] 基鲁西斯,L.M。;Kolaitis,P.G.,最小可满足性问题的复杂性,(Ferreira,A.;Reichel,H.,STACS 2001,2001,Springer Berlin Heidelberg:Springer Barlin Heitelberg Berlin,Heidelbrg),407-418·Zbl 0976.68078号
[36] 费德,T。;Vardi,M.Y.,《单调单子snp和约束满足的计算结构:通过数据日志和群论的研究》,SIAM J.Compute。,28, 1, 57-104, 1998 ·Zbl 0914.68075号
[37] 阿罗拉,S。;Barak,B.,《计算复杂性:现代方法》,2009年,剑桥大学出版社·Zbl 1193.68112号
[38] Bonifati,A。;马滕斯,W。;Timm,T.,大型SPARQL查询日志的分析研究,VLDB J.,29,2,655-6792020
[39] McGregor,J.J.,回溯搜索算法和最大公共子图问题,Softw。实践。实验,1982年12月1日,23-34日·Zbl 0466.68053号
[40] Lewis,J.M.,《关于最大子图问题的复杂性》,(第十届ACM计算理论年会论文集,STOC’78,1978,计算机械协会:美国纽约州纽约市计算机械协会),265-274·Zbl 1282.68124号
[41] Koch,I.,枚举两个图中的所有连通最大公共子图,Theor。计算。科学。,250, 1, 1-30, 2001 ·Zbl 0952.68105号
[42] Decker,S。;梅尔尼克,S。;范·哈梅伦(F.van Harmelen)。;芬塞尔,D。;克莱因,M。;布罗克斯特拉,J。;埃尔德曼,M。;Horrocks,I.,《语义网:xml和rdf的作用》,IEEE互联网计算。,4, 5, 63-73, 2000
[43] 角度,R。;阿雷纳斯,M。;巴赛罗,P。;Boncz,P。;弗莱彻,G。;古铁雷斯,C。;Lindaaker,T.等人。;Paradies,M。;Plantikow,S。;Sequeda,J。;O·范·雷斯特。;Voigt,H.,G-core:未来图形查询语言的核心,(2018年国际数据管理会议论文集,SIGMOD’18,2018,计算机械协会:美国纽约州纽约市计算机械协会),1421-1432
[44] Alexe,B。;10 Cate,B。;Kolaitis,P.G。;Tan,W.-C.,通过数据示例设计和完善模式映射,(2011年ACM SIGMOD国际数据管理会议论文集,SIGMOD’112011,计算机械协会:美国纽约州计算机械协会),133-144
[45] Bonifati,A。;麦加,G。;Pappalardo,A。;劳尼奇,S。;Summa,G.,Schema mapping verification:the spice way,(第11届扩展数据库技术国际会议论文集:数据库技术进展,EDBT’08,2008,计算机械协会:美国纽约州纽约市计算机械协会),85-96
[46] Sun,J。;尚,Z。;李·G。;邓,D。;Bao,Z.,Balance-aware分布式基于字符串相似性的查询处理系统,Proc。荷兰VLDB。,12, 9, 961-974, 2019
[47] 佩雷斯,J。;阿雷纳斯,M。;Gutierrez,C.,《sparql的语义和复杂性》(Cruz,I.;Decker,S.;Allemang,D.;Preist,C.;Schwabe,D.;Mika,P.;Uschold,M.;Aroyo,L.M.,《语义网-ISWC 2006,2006,斯普林格-柏林-海德堡:斯普林格–柏林-海德堡-柏林》,海德堡),第30-43页
[48] 姜瑜。;李·G。;冯,J。;Li,W.S.,《字符串相似性连接:实验评估》,Proc。荷兰VLDB。,7, 8, 625-636, 2014
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。