×

信息集成中的查询优化。 (英语) Zbl 1270.68107号

摘要:尽管进行了多年的持续研究,但与广泛应用相关的分散数据共享问题仍然是重大理论和实践挑战的来源。
在本文中,我们关注使用全局视图方法的信息集成系统中查询评估效率的挑战,目的是开发在实际应用中广泛适用且易于实现的查询处理策略。我们的算法考虑了当今数据共享应用程序的重要特征:XML可能是数据源的接口或表示;跨数据源的信息重叠的可能性;以及对源间处理的需要,如跨源的数据联接。
本文的重点是我们为信息集成中的高效查询处理提出的几种替代方法的性能相关特性,包括使用物化重组视图的方法。我们在信息集成系统外壳的实现中使用了合成数据集和真实数据集,并提供了实验结果,证明了我们的算法在信息集成环境中是高效且具有竞争力的。
此外,我们的实验结果允许我们对从我们提出的备选方案中选择查询处理方法提出上下文特定的建议。因此,我们的方法可以在许多实际环境中为信息集成和互操作中的可伸缩查询处理奠定基础。

MSC公司:

68第20页 信息存储和数据检索
68第05页 数据结构
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abiteboul,S.,Duschka,O.M.:使用物化视图回答查询的复杂性。摘自:ACM数据库系统原理研讨会论文集,第254-263页(1998年)
[2] 学术部本体:http://www.daml.org/ontologies/65 ·Zbl 0949.68063号
[3] Arenas,M.,Kantere,V.,Kementsietsidis,A.,Kiringa,I.,Miller,R.,Mylopoulos,J.:hyperion项目:从数据集成到数据协调。SIGMOD记录32(3),53-58(2003)(对等数据管理专刊)
[4] Arenas,M.,Libkin,L.:XML数据交换:一致性和查询应答。摘自:ACM satabase系统原理研讨会论文集,第13-24页(2005)·Zbl 1326.68116号
[5] Bleiholder,J.,Naumann,F.:数据融合。ACM计算。Surv公司。41(1), 1-41 (2008) ·Zbl 0991.68702号
[6] Calvanee,D.,De Giacomo,G.,Lenzerini,M.:使用描述逻辑知识库的视图回答查询。摘自:AAAI会议记录,第386-391页(2000年)·Zbl 0949.68063号
[7] Calvanee,D.,De Giacomo,G.,Lenzerini,M.,Vardi,M.Y.:使用视图回答常规路径查询。摘自:IEEE数据、工程国际会议论文集,第389-398页(2000)·Zbl 1080.68019号
[8] Calvanee,D.,De Giacomo,G.,Lenzerini,M.,Vardi,M.Y.:基于视图的查询处理,用于带反转的常规路径查询。收录于:ACM数据库系统原理研讨会论文集,第58-66页(2000年)
[9] Calvanee,D.,De Giacomo,G.,Lenzerini,M.,Vardi,M.Y.:基于视图的查询应答和半结构化数据的查询包含。摘自:DBPL会议记录,第40-61页(2001年)·Zbl 1098.68560号
[10] Chen,D.,Chirkova,R.,Kormilitsin,M.,Sadri,F.,Salo,T.J.:基于XML的信息集成中的查询优化。载:《信息与知识管理国际会议论文集》,第1405-1406页(2008年)
[11] Chen,D.,Chirkova,R.,Sadri,F.:设计信息集成和互操作系统——第一步。技术报告NCSU CSC TR-2006-29。可在http://www.csc.ncsu.edu/research/tech/reports.php2006年10月
[12] Chen,D.,Chirkova,R.,Sadri,F.:使用重组视图的查询优化:理论和实验。信息系统。34(3), 353-370 (2009) ·doi:10.1016/j.is.2008.10.02
[13] Chirkova,R.,Sadri,F.:使用重组视图进行查询优化。摘自:信息与知识管理国际会议记录,第642-651页(2006年)
[14] Christophides,V.、Karvounarakis,G.、Magkanaraki,A.、Plexousakis,D.、Tannen,V.:ICS-FORTH语义Web集成中间件(SWIM)。收录于:IEEE数据,工程公告,第11-18页(2003年)
[15] CiteSeer公司:http://citeseer.ist.psu.edu/
[16] Copeland,G.P.,Khoshavian,S.:分解-存储模型。摘自:ACM SIGMOD国际数据管理会议记录,第268-279页(1985)·Zbl 1136.68386号
[17] Cunningham,C.,Graefe,G.,Galindo-Legaria,C.A.:PIVOT和UNPIVOT:关系数据库管理系统中的优化和执行策略。摘自:大型数据库国际会议论文集,第998-1009页(2004)
[18] DAML本体库:http://www.daml.org/本体/
[19] Dar,S.、Franklin,M.J.、Thór Jónsson,B.、Srivastava,D.、Tan,M.:语义数据缓存和替换。摘自:《超大数据库国际会议论文集》,第330-341页(1996年)·Zbl 1012.68910号
[20] Davidson,S.、Fan,W.、Hara,C.、Qin,J.:将XML约束传播到关系。收录:IEEE数据工程国际会议论文集(2003)·Zbl 1115.68055号
[21] 数据库链接:http://www.informatik.uni-trier.de/ley/db/index.html
[22] Dong,X.,Halevy,A.:索引数据空间。摘自:ACM SIGMOD国际数据管理会议记录,第43-54页(2007)
[23] Duschka,O.M.、Genesereth,M.R.、Levy,A.Y.:数据集成的递归查询计划。J.日志。程序。43(1), 49-73 (2000) ·兹伯利0949.68063 ·doi:10.1016/S0743-1066(99)00025-4
[24] Elmagarmid,A.K.,Ipeirotis,P.G.,Verykios,V.S.:重复记录检测:一项调查。IEEE传输。知识。数据工程19(1),1-16(2007)·doi:10.1109/TKDE.2007.250581
[25] Fagin,R.,Kolaitis,P.G.,Miller,R.J.,Popa,L.:《数据交换:语义和查询回答》,载于《数据库理论国际会议论文集》,第207-224页(2003)·Zbl 1022.68510号
[26] Fagin,R.,Kolaitis,P.G.,Miller,R.J.,Popa,L.:数据交换:语义和查询回答。Theor。计算。科学。336(1), 89-124 (2005) ·Zbl 1080.68019号 ·doi:10.1016/j.tcs.2004.10.033
[27] Fensel,D.:《信息与本体论的集成:工业环境中基于本体的信息集成》。威利,纽约(2005)
[28] Franklin,M.J.、Thór Jónsson,B.、Kossmann,D.:客户端-服务器查询处理的性能权衡。摘自:ACM SIGMOD国际数据管理会议记录,第149-160页(1996)
[29] Grahne,G.,Mendelzon,A.O.:通过全局模式查询信息源的Tableau技术。摘自:数据库理论国际会议论文集,第332-347页(1999)
[30] Gyssens,M.,Lakshmanan,L.V.S.,Subramanian,I.N.:表格作为查询和重组的范例。摘自:ACM数据库系统原理研讨会论文集,第93-103页(1996)
[31] Halevy,A.Y.:使用视图回答查询。LDB J.10(4),270-294(2001)·Zbl 1012.68910号
[32] Halevy,A.Y.:数据集成:状态报告。摘自:《德国数据库会议记录》(Datenbanksysteme für Business,Technologie und Web,BTW),第24-29页(2003)
[33] Halevy,A.Y.、Etzioni,O.、Doan,A.、Ives,Z.G.、Madhavan,J.、McDowell,L.、Tatarinov,I.:跨越结构鸿沟。附:创新数据、系统研究两年期会议记录(2003年)
[34] Halevy,A.Y.、Ives,Z.G.、Madhavan,J.、Mork,P.、Suciu,D.、Tatarinov,I.:Piazza对等数据管理系统。IEEE传输。知识。数据工程16(7),787-798(2004)·doi:10.1109/TKDE.2004.1318562
[35] Hernández,M.A.,Papotti,P.,Tan,W.C.:通过数据元数据翻译进行数据交换。程序。荷兰VLDB。1(1), 260-273 (2008)
[36] Kossmann,D.:分布式查询处理的最新技术。ACM计算。Surv公司。32(4), 422-469 (2000) ·数字对象标识代码:10.1145/371578.371598
[37] Krishnamurthy,R.、Litwin,W.、Kent,W.:具有示意图差异的数据库互操作性的语言特征。摘自:ACM SIGMOD国际数据管理会议记录,第40-49页(1991)
[38] Lacroix,Z.,Raschid,L.,Vidal,M.-E.:整合生物资源的语义模型。参加:ICDE研讨会(2006年)
[39] Lakshmanan,L.V.S.,Sadri,F.:XML数据的互操作性。载:《国际语义网络会议论文集》,第146-163页(2003年)
[40] Lakshmanan,L.V.S.,Sadri,F.,Subramanian I.N.:关于异构数据库系统中模式集成和演化的逻辑基础。摘自:演绎和面向对象数据库国际会议论文集,第81-100页(1993)
[41] Lakshmanan,L.V.S.,Sadri,F.,Subramanian,I.N.:SchemaSQL:关系型多数据库系统中的互操作性语言。摘自:《超大数据库国际会议论文集》,第239-250页(1996年)
[42] Lakshmanan,L.V.S.,Sadri,F.,Subramanian,S.N.:关于在SQL数据库系统上有效实现SchemaSQL。摘自:《超大数据库国际会议论文集》,第471-482页(1999年)
[43] Lakshmanan,L.V.S.,Sadri,F.,Subramanian,S.N.:SchemaSQL——用于多数据库互操作性的SQL扩展。ACM事务处理。数据库系统。26(4), 476-519 (2001) ·Zbl 1136.68386号 ·doi:10.1145/503099.503102
[44] Lenzerini,M.:数据整合:理论视角。摘自:ACM数据库系统原理研讨会论文集,第233-246页(2002年)
[45] Levy,A.Y.,Mendelzon,A.O.,Sagiv,Y.,Srivastava,D.:使用视图回答查询。摘自:ACM数据库系统原理研讨会论文集,第95-104页(1995年)
[46] Levy,A.Y.、Rajaraman,A.、Ordille,J.J.:使用源描述查询异构信息源。摘自:《超大数据库国际会议论文集》,第251-262页(1996年)
[47] Liu,L.,Özsu,M.(编辑):数据库系统百科全书。柏林施普林格出版社(2009)·兹比尔1183.68252
[48] Madhavan,J.、Cohen,S.、Luna Dong,X.、Halevy,A.Y.、Jeffery,S.R.、Ko,D.、Yu,C.:网络级数据集成:您可以支付随用随付。摘自:创新数据、系统研究(CIDR)两年一度会议记录,第342-350页(2007年)
[49] Madhavan,J.,Halevy,A.Y.:构建数据源之间的映射。摘自:《超大数据库国际会议记录》,第572-583页(2003年)·Zbl 0991.68702号
[50] Marnette,B.,Mecca,G.,Papotti,P.:具有功能依赖性的可扩展数据交换。程序。荷兰VLDB。3(1), 105-116 (2010)
[51] Miller,R.J.、Hernández,M.A.、Haas,L.M.、Yan,L.-L.、Howard Ho,C.T.、Fagin,R.、Popa,L.:Clio项目:管理异质性。SIGMOD记录30(1),78-83(2001)
[52] NCSU-UNCG信息集成项目:http://dbgroup.ncsu.edu/?page_id=205
[53] Noy,N.F.:语义整合:基于本体论的方法综述。SIGMOD记录33(4),65-70(2004)·数字对象标识代码:10.1145/1041410.1041421
[54] Noy,N.F.,McGuinness,D.L.:本体开发101:创建第一个本体的指南。http://ksl.stanford.edu/people/dlm/papers/ontology-tutorial-noy-mcguiness.pdf (2001)
[55] Poess M.、Othayoth N.R.:网格上的大型数据仓库:Oracle数据库10g和HP ProLiant系统。摘自:《超大数据库国际会议论文集》,第1055-1066页(2005年)
[56] PostgreSQL:网址:http://www.postgresql.org/ ·Zbl 1173.68478号
[57] Pottinger,R.,Halevy,A.Y.:Minicon:使用视图回答查询的可扩展算法。VLDB J.10(2-3),182-198(2001)·兹比尔0991.68702
[58] Pottinger,R.,Levy,A.Y.:使用视图回答查询的可扩展算法。摘自:《超大数据库国际会议论文集》,第484-495页(2000年)
[59] Sanket Sahoo,S.、Thomas,C.、Sheth,A.P.、York,W.S.、Tartir,S.:知识建模及其在生命科学中的应用:两个本体论的故事。摘自:WWW国际会议记录,第317-326页(2006)
[60] Saxonica、XSLT和XQuery处理:http://www.saxonica.com网站/
[61] 语义Web:http://www.w3c.org/2001/sw/
[62] 信号模式:网址:http://www.sigmod.org/
[63] Stonebraker,M.、Abadi,D.J.、Batkin,A.、Chen,X.、Cherniack,M.和Ferreira,M.,Lau,E.,Lin,A.,Madden,S.、O'Neil,E.J.、O'Neil,P.E.、Rasin,A.和Tran,N.、Zdonik,S.B.:C-store:面向专栏的dbms。摘自:《超大数据库国际会议论文集》,第553-564页(2005年)
[64] Tatarinov,I.,Halevy,A.:对等数据管理系统中的高效查询重新制定。摘自:ACM SIGMOD国际数据管理会议记录,第539-550页(2004)
[65] Ullman,J.D.:《数据库和知识库系统原理》,第一卷,计算机科学出版社,Rockville(1988)
[66] Ullman,J.D.:使用逻辑视图的信息集成。摘自:数据库理论国际会议论文集,第19-40页(1997)·Zbl 1136.68386号
[67] Wiederhold,G.:未来信息系统架构中的中介。IEEE计算。25(3), 38-49 (1992) ·doi:10.1109/2.121508
[68] Wilkinson,K.,Sayers,C.,Kuno,H.A.,Reynolds,D.:Jena2高效RDF存储和检索。摘自:VLDB语义网和数据库研讨会论文集,第131-150页(2003年)
[69] Wyss,C.M.,Robertson,E.L.:元数据集成的关系语言。ACM事务处理。数据库系统。30(2), 624-660 (2005) ·数字对象标识代码:10.1145/1071610.1071618
[70] XML路径语言(XPath):http://www.w3c.org/TR/xpath
[71] Yu,C.,Popa,L.:用于数据集成的基于约束的XML查询重写。摘自:ACM SIGMOD国际数据管理会议记录,第371-382页(2004)·Zbl 0991.68702号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。