×

魔术集及其在数据集成中的应用。 (英语) Zbl 1115.68047号

摘要:近年来,有效的方法通过在稳定模型语义下对Datalog程序进行谨慎推理,对数据集成系统和不一致数据库中的查询应答进行建模。由于此任务的计算成本很高(共同NP-完成),因此显然需要合适的查询优化技术,以便使这些方法适用于数据密集型应用程序。
我们将著名的Magic Sets技术推广到在稳定模型语义下具有(可能未经批准的)否定的Datalog(^{neg})程序。我们的技术生成了一个新程序,该程序的求值通常更有效(由于实例化较小),同时保持了勇敢和谨慎推理的完全查询等效性,前提是原始程序是一致的。即使原始程序不一致,谨慎推理下的稳健性始终得到保证。
为了正式证明我们的Magic Sets转换的正确性,我们在稳定模型语义下为Datalog(^{neg})引入了一个新的模块性概念,它比以前的模块定义更适合于查询应答。我们证明了对这样一个模块的查询可以独立于程序的其余部分进行评估,同时在谨慎的推理下保持合理性。重要的是,对于一致的程序,勇敢的推理和谨慎的推理都保证了其可靠性和完整性。
我们的Magic Sets优化是提高数据集成系统性能的一种有效方法,其中通过对Datalog(^{neg})程序进行谨慎推理来执行查询应答。事实上,在欧盟项目INFOMIX中的实验结果表明,魔术集是系统可扩展性的基础。

MSC公司:

68N17号 逻辑编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ullman,J.D.,《数据库和知识库系统原理》(1989),计算机科学出版社
[2] Gelfond,M。;Lifschitz,V.,《逻辑编程的稳定模型语义》(logic programming:Proceedings Fifth International Conference and Symposium(1988)),麻省理工学院出版社:麻省剑桥大学出版社,1070-1080
[3] 比多特,N。;Froidevaux,C.,默认否定和不可计算逻辑程序,定理。计算。科学。,78, 85-112 (1991) ·Zbl 0716.68075号
[4] Dantsin,E。;艾特,T。;戈特洛布,G。;Voronkov,A.,逻辑编程的复杂性和表达能力,ACM计算。调查,33,3,374-425(2001)
[5] 塞拉利昂,北卡罗来纳州。;Pfeifer,G。;Faber,W。;艾特,T。;Gottlob,G。;佩里,S。;Scarcello,F.,《用于知识表示和推理的DLV系统》,ACM Trans。计算。日志。,7, 3, 499-562 (2006) ·Zbl 1367.68308号
[6] I.Niemelä,P.Simons,T.Syrjänen,Smodels:答案集编程系统,见:C.Baral,M.Truszczynski(编辑),第八届非单调推理国际研讨会论文集,NMR 2000,美国科罗拉多州布雷肯里奇,2000;I.Niemelä,P.Simons,T.Syrjänen,Smodels:答案集编程系统,收录于:C.Baral,M.Truszczynski(编辑),第八届非单调推理国际研讨会论文集,NMR 2000,美国科罗拉多州布雷肯里奇,2000
[7] 阿里纳斯,M。;贝托西,L.E。;Chomicki,J.,《使用逻辑程序指定和查询数据库修复(有例外)》,(第四届灵活查询应答系统国际会议程序,FQAS 2000(2000),Springer),27-41
[8] 格雷科·G。;Greco,S。;Zumpano,E.,《集成、修复和查询不一致数据库的逻辑编程方法》(第17届逻辑编程国际会议,ICLP’01)。程序。第17届逻辑编程国际会议,ICLP’01,《人工智能讲义》,第2237卷(2001),Springer),348-364·Zbl 1053.68564号
[9] P.Barceló,L.Bertossi,用带注释的谓词逻辑修复数据库,收录于:Proc。第十届非单调推理国际研讨会,NMR 20022002,第160-170页;P.Barceló,L.Bertossi,用带注释的谓词逻辑修复数据库,收录于:Proc。第十届非单调推理国际研讨会,NMR 20022002,第160-170页
[10] A.Cal,D.Lembo,R.Rosati,《数据集成系统中约束条件下的查询重写和应答》,摘自:Proc。第18届国际人工智能联合会议,IJCAI 2003年,2003年,第16-21页;A.Cal,D.Lembo,R.Rosati,《数据集成系统中约束条件下的查询重写和应答》,摘自:Proc。第18届国际人工智能联合会议,IJCAI 2003年,2003年,第16-21页
[11] L.Bravo,L.Bertossi,一致查询数据集成系统的逻辑编程,收录于:Proc。第18届国际人工智能联合会议,IJCAI 2003年,2003年,第10-15页;L.Bravo,L.Bertossi,一致查询数据集成系统的逻辑编程,摘自:Proc。第18届国际人工智能联合会议,IJCAI 2003年,2003年,第10-15页
[12] 乔米奇,J。;Marcinkowski,J.,使用元组删除的最小更改完整性维护,Inform。和计算。,197、1-2、90-121(2005年)·Zbl 1075.68022号
[13] Schlipf,J.,《逻辑编程语义的表达能力》,J.Compute。系统科学。,51,1,64-86(1995),摘要:Proc。PODS’90,第196-204页·兹比尔08316.8012
[14] F.Bancilhon、D.Maier、Y.Sagiv、J.D.Ullman,《魔术集和其他实现逻辑程序的奇怪方法》,摘自:Proc。1986年国际数据库系统原理研讨会,第1-16页;F.Bancilhon、D.Maier、Y.Sagiv、J.D.Ullman,《魔术集和其他实现逻辑程序的奇怪方法》,摘自:Proc。1986年国际数据库系统原理研讨会,第1-16页
[15] 比里,C。;罗摩克里希南,R.,《论魔法的力量》,《逻辑程序》。,10, 1-4, 255-259 (1991) ·Zbl 0722.68018号
[16] 穆米克,I.S。;芬克尔斯坦,S.J。;Pirahesh,H。;Ramakrishnan,R.,Magic is relevant,in:《1990年ACM SIGMOD国际数据管理会议论文集》,1990年,第247-258页,网址:
[17] Lifschitz,V。;Turner,H.,Splitting a logic program,(Van Hentenryck,P.,《第十一届逻辑程序设计国际会议论文集》,ICLP’94(1994),麻省理工学院出版社:麻省理学院出版社Santa Margherita Ligure),23-37
[18] 艾特,T。;Gottlob,G。;Mannila,H.,分离数据日志,ACM Trans。数据库系统,22,3,364-418(1997)
[19] Gelfond,M。;Lifschitz,V.,逻辑程序和析取数据库中的经典否定,新一代计算,9365-385(1991)·Zbl 0735.68012号
[20] M.Lenzerini,《数据集成:理论视角》,摘自:Proc。第21届ACM SIGACT SIGMOD SIGART Symp。《数据库系统原理》,PODS 2002年,2002年,第233-246页;M.Lenzerini,《数据集成:理论视角》,摘自:Proc。第21届ACM SIGACT SIGMOD SIGART Symp。数据库系统原理,PODS 2002,2002,第233-246页
[21] L.Bertossi,J.Chomicki,A.Cortes,C.Gutierrez,综合数据源的一致答案,摘自:Proc。第六届国际灵活问答系统大会,FQAS 20022002,第71-85页;L.Bertossi,J.Chomicki,A.Cortes,C.Gutierrez,综合数据源的一致答案,摘自:Proc。第六届国际灵活问答系统大会,FQAS 20022002,第71-85页
[22] 贝托西,L。;Chomicki,J.,《不一致数据库中的查询应答》,(Chomicki,J.;van der Meyden,R.;Saake,G.,《数据库新兴应用的逻辑》(2003),Springer),第43-83页,(第2章)
[23] 乔米奇,J。;马钦科夫斯基,J。;Staworke,S.,Hippo:计算一类SQL查询的一致答案的系统,(第九届扩展数据库技术国际会议,EDBT 2004(2004),Springer),841-844
[24] 乔米奇,J。;Marcinkowski,J。;Staworke,S.,《使用冲突超图计算一致查询答案》,(第13届ACM信息和知识管理会议论文集,CIKM 2004(2004),ACM出版社),417-426
[25] A.Fuxman,E.Fazli,R.J.Miller,《征服:不一致数据库的有效管理》,载于:SIGMOD会议,2005年;A.Fuxman,E.Fazli,R.J.Miller,《征服:不一致数据库的有效管理》,载于:SIGMOD会议,2005年
[26] 富克斯曼,A。;Miller,R.J.,《不一致数据库的一阶查询重写》,(Eiter,T.;Libkin,L.,《第十届数据库理论国际会议论文集》,ICDT 2005。第十届数据库理论国际会议论文集,ICDT 2005,计算机课堂讲稿。科学。,第3363卷(2005年),施普林格出版社),337-351·Zbl 1112.68367号
[27] 阿里纳斯,M。;贝托西,L。;Chomicki,J.,FD非一致数据库中的标量聚合,(国际数据库理论会议,ICDT 2001(2001),Springer),39-53·Zbl 1047.68560号
[28] 乔米奇,J。;Marcinkowski,J.,使用元组删除的最小更改完整性维护,Inform。和计算。,197, 90-121 (2005) ·Zbl 1075.68022号
[29] 阿里纳斯,M。;贝托西,L.E。;Chomicki,J.,《不一致数据库中的一致查询答案》(第18届ACM SIGACT SIGMOD SIGART数据库系统原理研讨会论文集,PODS’99(1999)),68-79
[30] Dung,P.M.,《关于逻辑程序的稳定语义和基础良好语义之间的关系》,Theoret。计算。科学。,105, 1, 7-25 (1992) ·Zbl 0774.68028号
[31] Ullman,J.D.,《数据库和知识库系统原理》,第2卷(1989),计算机科学出版社
[32] Abiteboul,S。;赫尔,R。;维亚努,V.,《数据库基础》(1995),艾迪森·韦斯利·Zbl 0848.68031号
[33] Arkin,E.M。;Papadimitriou,C.H。;Yannakakis,M.,图中循环和路径的模块化,J.ACM,38,2,255-274(1991)·Zbl 0799.68146号
[34] Johnson,D.S.,《复杂性类目录》(van Leeuwen,J.,《理论计算机科学手册》,A卷(1990),爱思唯尔科学),(第2章)·Zbl 0900.68246号
[35] M.Y.Vardi,关系查询语言的复杂性,摘自:第14届计算理论研讨会论文集,STOC,1982年,第137-146页;M.Y.Vardi,关系查询语言的复杂性,摘自:第14届计算理论研讨会论文集,STOC,1982年,第137-146页
[36] A.Cal,D.Lembo,R.Rosati,《关于不一致和不完整数据库上查询应答的可判定性和复杂性》,摘自:Proc。第22届ACM SIGACT SIGMOD SIGART Symp。《数据库系统原理》,PODS 2003年,2003年,第260-271页;A.Cal,D.Lembo,R.Rosati,《关于不一致和不完整数据库上查询应答的可判定性和复杂性》,摘自:Proc。第22届ACM SIGACT SIGMOD SIGART Symp。《数据库系统原理》,PODS 20032003,第260-271页
[37] INFOMIX项目团队,演示场景(2004年6月),技术代表INFOMIXS7-1,INFOMIX-Project Consortium,网址:
[38] 卡尔?,A。;Calvanee,D。;德贾科莫,G。;Lenzerini,M.,《完整性约束下的数据集成》,Inform。系统。,2147-163年2月29日(2004年)
[39] D.Lembo,M.Lenzerini,R.Rosati,查询重写的方法和技术,技术代表D5.2,Infomix Consortium,2003年10月;D.Lembo,M.Lenzerini,R.Rosati,查询重写的方法和技术,技术代表D5.2,Infomix Consortium,2003年10月
[40] D.Lembo,《处理数据集成中的不一致性和不完整性》,博士论文,罗马大学“La Sapienza”,2004年;D.Lembo,《处理数据集成中的不一致性和不完整性》,罗马大学“La Sapienza”博士论文,2004年
[41] Stuckey,P.J。;Sudarshan,S.,编译查询约束,(第十三届数据库系统原理研讨会论文集,PODS’94(1994),ACM出版社),56-67
[42] Ross,K.A.,《带否定的数据日志程序的模块分层和魔术集》,J.ACM,41,6,1216-1266(1994)·Zbl 0830.68028号
[43] 坎普,D.B。;Srivastava,D。;Stuckey,P.J.,《基础良好模型的自下而上评估和查询优化》,理论。计算。科学。,146, 145-184 (1995) ·Zbl 0873.68032号
[44] 塞沙德里,P。;Hellerstein,J.M。;Pirahesh,H。;Leung,T.Y.C。;Ramakrishnan,R。;Srivastava,D。;Stuckey,P.J。;Sudarshan,S.,《基于成本的魔术优化:代数与实现》,(Jagadish,H.V.;Mumick,I.S.,1996年ACM SIGMOD国际数据管理会议论文集(1996),ACM出版社),435-446
[45] Behrend,A.,演绎数据库中基于Magic Set的查询评估的软分层,(第二十届ACM SIGACT-SIGMOD-SIGART数据库系统原理研讨会论文集(2003),ACM出版社),102-110
[46] Greco,S.,《优化绑定析取查询的绑定传播技术》,IEEE Trans。知识与数据工程,15,2368-385(2003)
[47] 坎博,C。;Faber,W。;Greco,G.,《增强析取数据日志程序的魔法集方法》,(2004年第20届逻辑编程国际会议论文集)。2004年第20届逻辑编程国际会议论文集,计算机课堂讲稿。科学。,第3132卷(2004)),371-385·Zbl 1104.68371号
[48] G.Greco,S.Greco,I.Trubitsyna,E.Zumpano,带约束的界析取查询的优化,逻辑编程的理论与实践;G.Greco,S.Greco,I.Trubitsyna,E.Zumpano,带约束的界析取查询的优化,逻辑编程的理论与实践·Zbl 1085.68019号
[49] T.Eiter,M.Fink,G.Greco,D.Lembo,《查询数据集成系统的逻辑程序的有效评估》,摘自:Proc。第19届逻辑编程国际会议,ICLP’03,2003,第163-177页;T.Eiter,M.Fink,G.Greco,D.Lembo,《查询数据集成系统的逻辑程序的有效评估》,摘自:Proc。第19届逻辑编程国际会议,ICLP’03,2003年,第163-177页·Zbl 1204.68080号
[50] 费金,R。;科莱提斯,P。;米勒,R.J。;Popa,L.,《数据交换:语义和查询回答》,2003年数据库理论国际会议论文集专刊。2003年数据库理论国际会议论文集专刊。计算。科学。,336, 89-124 (2005) ·兹比尔1080.68019
[51] 费金,R。;Kolaitis,P.G。;Popa,L.,《数据交换:走向核心》,ACM Trans。数据库系统,30,1,174-210(2005)·Zbl 1326.68119号
[52] Gottlob,G.,数据交换的计算核心:新算法和实用解决方案,(PODS’05:第二十四届ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会论文集(2005),ACM出版社:纽约州ACM出版社),148-159
[53] Kolaitis,P.G。;Panttaja,J。;Tan,W.,《数据交换的复杂性》,(PODS’06:第二十五届ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会论文集(2006),ACM出版社:纽约ACM出版社),30-39
[54] Gottlob,G。;Nash,A.,《数据交换:多项式时间内计算核》,(PODS’06:第二十五届ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会论文集(2006),ACM出版社:ACM出版社,纽约州纽约市),40-49
[55] O.Benjelloun。;Sarma,A.D。;海沃思,C。;Widom,J.,《ULDB和trio系统简介》,《概率数据库专刊》。概率数据库专刊,IEEE数据工程公告,29,5-16(2006)
[56] Dalvi,N.N。;米克劳,G。;Suciu,D.,合取查询的渐近条件概率,(Eiter,T.;Libkin,L.,《第十届数据库理论国际会议论文集》,ICDT’05。第十届数据库理论国际会议论文集,ICDT'05,计算机课堂讲稿。科学。,第3363卷(2005),施普林格),289-305·Zbl 1112.68363号
[57] Boulos,J。;Dalvi,N。;Mandhani,B。;马图尔,S。;关于C。;Suciu,D.,MYSTIQ:使用概率寻找更多答案的系统,(SIGMOD’05:2005年ACM SIGMOD-国际数据管理会议记录(2005),ACM出版社:纽约ACM出版社),891-893
[58] J.Widom,《三重奏:数据、准确性和谱系综合管理系统》,载于:2005年第二届创新数据系统研究国际研究发展委员会两年期会议记录,第262-276页;J.Widom,《Trio:数据、准确性和血统综合管理系统》,摘自:2005年第二届创新数据系统研究国际研究发展委员会两年期会议记录,第262-276页
[59] Libkin,L.,《数据交换和不完全信息》,(PODS’06:第二十五届ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会论文集(2006),ACM出版社:ACM出版社,纽约州纽约市),60-69
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。