×

中介中基于成本的灵活可扩展查询规划:一种转换方法。 (英语) Zbl 0938.68848号

摘要:互联网提供了获取丰富信息的途径。对于任何给定的主题或应用程序域,都有各种可用的信息源。然而,当前的系统,如搜索引擎或万维网中的主题目录,仅提供非常有限的定位、组合和组织信息的功能。中介器是为分布在异构源上的信息提供集成访问和类似数据库的查询功能的系统,对于实现对网络信息进行有意义访问的全部潜力至关重要。查询规划是调解人系统的核心,它的任务是生成一个经济高效的计划,该计划从相关信息源计算用户查询。然而,由于处理数据的操作中存在大量可能的源和可能的顺序,查询规划是一个计算困难的问题。此外,数据源的选择、数据处理操作及其排序强烈影响计划成本。在本文中,我们提出了一种中介中的查询规划方法,该方法基于一种称为重写规划(PbR)的通用规划范式。我们的工作产生了一些贡献。首先,我们的基于PbR的查询规划器将源的选择和操作的排序结合到单个搜索空间中,在其中优化计划质量。其次,通过使用局部搜索技术,我们的规划师有效地探索了组合搜索空间,并生成了高质量的计划。第三,因为我们的查询规划器是一个域依赖框架的实例化,所以它非常灵活,可以按原则进行扩展。第四,我们的规划师有随时随地的行为。最后,我们提供的实证结果表明,我们的基于PbR的查询规划器在可扩展性和规划质量方面优于以前的方法,这些方法包括经典人工智能规划和动态编程查询优化技术。

MSC公司:

68层35 人工智能语言和软件系统理论(基于知识的系统、专家系统等)
68平方米 计算机系统环境下的性能评估、排队和调度
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aboulnaga,A。;Chaudhuri,S.,《自校正直方图:在不查看数据的情况下构建直方图》(Delis,A.;Faloutsos,C.;Ghandharizadeh,S.),《ACM SIGMOD国际数据管理会议程序》(SIGMOD-99),《SIGM OD记录》,第28卷(2)(1999),ACM出版社:ACM出版社,纽约),181-192
[2] 阿达利,S。;Selcuk Candan,K。;Papkonstantinou,Y。;Subrahmanian,V.S.,分布式中介系统中的查询缓存和优化,SIGMOD记录(ACM数据管理特别兴趣小组),第25、2、137-148卷(1996)
[3] Ambite,J.L.,《改写规划》,博士论文(1998),南加州大学:南加州大学马里纳德尔雷分校·Zbl 0994.68138号
[4] Ambite,J.L.(安比特,J.L.)。;Knoblock,C.A.,《改写规划:高效生成高质量计划》(Proc.AAAI-97,Providence,RI(1997))·Zbl 0994.68138号
[5] J.L.Ambite,C.A.Knoblock,I.Muslea,A.Philpot,《编译源代码描述以实现高效灵活的信息集成》,J.智能信息系统(即将出版);J.L.Ambite,C.A.Knoblock,I.Muslea,A.Philpot,《编译源代码描述以实现高效灵活的信息集成》,J.智能信息系统(即将出版)·Zbl 1012.68197号
[6] Ambros-Ingerson,J.,IPEM:综合规划、执行和监控,埃塞克斯大学计算机科学系博士论文(1987)
[7] 阿伦斯,Y。;Chee,C.Y。;徐,C.-N。;Knoblock,C.A.,从多个信息源检索和集成数据,国际。J.智能与合作信息系统,第2、2、127-158卷(1993年)
[8] 阿伦斯,Y。;Knoblock,C.A。;沈伟明,动态信息集成的查询重构,J.智能信息系统(智能信息集成专刊),第6卷,第2-3卷,第99-130页(1996)
[9] 阿什什,N。;Knoblock,C.A。;Levy,A.,《带有传感行动的信息收集计划》(Steel,S.;Alami,R.,《人工智能规划的最新进展:第四届欧洲规划会议》,ECP’97(1997),Springer:Springer New York)
[10] Brachman,R。;Schmolze,J.,《知识表示系统,认知科学。,第9卷,第2卷,171-216(1985)
[11] Cherniack,M。;Zdonik,S.B.,基于规则的优化器的规则语言和内部代数,SIGMOD记录(ACM数据管理特别兴趣小组),第25、2、401-412卷(1996)
[12] Cherniack,M。;Zdonik,S.B.,《更改规则:基于规则的优化器的转换》(Proc.ACM SIGMOD International Conference on Management of Data,Seattle,WA(1998)),第61-72页
[13] 朱,W.W。;Hurley,P.,分布式数据库系统的最佳查询处理,IEEE Trans。计算。,第31卷,第9卷,第835-850页(1982年)·兹比尔0488.68070
[14] 科尔,R.L。;Graefe,G.,动态查询评估计划的优化,SIGMOD记录(ACM数据管理特别兴趣小组),第23、2、150-160卷(1994)
[15] Deutsch,A。;费尔南德斯,M。;Florescu,D。;利维,A。;Maier,D。;Suciu,D.,查询XML数据,Bull。数据工程技术委员会,第22、3、27-34卷(1999年)
[16] 德雷珀,D。;汉克斯,S。;Weld,D.,《信息收集和应急执行的概率规划》(第二届人工智能规划系统国际会议,伊利诺伊州芝加哥,1994年),31-36
[17] Duschka,O.M.,《信息集成中的查询规划和优化》,斯坦福大学博士论文(1997)
[18] O.M.杜施卡。;Genesereth,M.R.,《使用视图回答递归查询》(Proc.16th ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems,Tucson,AZ(1997))
[19] O.M.杜施卡。;Genesereth,M.R.,Infomaster——一种信息集成工具(Proc.Internat.智能信息集成研讨会,德国弗莱堡(1997))
[20] 埃罗尔,K。;Nau,D。;Hendler,J.,UMCP:分层任务网络规划的合理完整规划程序,(第二届人工智能规划系统国际会议论文集,伊利诺伊州芝加哥(1994)),249-254
[21] 弗里德曼,M。;Weld,D.S.,《高效执行信息收集计划》(Proc.IJCAI-97,日本名古屋(1997)),785-791
[22] 加斯纳,P。;Lohman,G。;Schierfer,K.B。;Wang,L.,IBM DB2家族中的查询优化,数据工程技术委员会公报(商业数据库系统中查询处理专刊),第16、4、4-18卷(1993年)
[23] Graefe,G.,《大型数据库ACM计算调查的查询评估技术》,第25卷,第2卷,第73-170页(1993年)
[24] Graefe,G.,《商业数据库系统查询处理专刊》,数据工程技术委员会公报,第16卷,第4期(1993年)
[25] Graefe,G.,查询优化的级联框架,数据工程技术委员会公报(数据库查询处理专刊),第18、3、19-29卷(1995年)
[26] Graefe,G.,数据库查询处理专刊,数据工程技术委员会公报,第18卷,第3期(1995年)
[27] 格雷夫,G。;科尔,R.L。;Davison,D.L。;麦肯纳,W.J。;Wolniewicz,R.H.,《火山中的可扩展查询优化和并行执行》(Freytag,J.C.;Vossen,G.;Maier,D.,《高级数据库应用程序的查询处理》(1994),Morgan Kaufmann:Morgan Koufmann San Francisco,CA),305-381
[28] 格雷夫,G。;DeWitt,D.J.,《EXODUS优化器生成器》,SIGMOD记录,第16、3、160-172卷(1987年),摘自:Proc。1987年ACM SIGMOD国际数据管理会议
[29] 格雷夫,G。;McKenna,W.J.,《火山优化器生成器:可扩展性和高效搜索》(IEEE国际数据工程会议论文集,奥地利维也纳(1993)),209-218
[30] 格雷夫,G。;Ward,K.,《动态查询优化计划》,ACM SIGMOD记录,第18卷,第2卷(1989年),另发表于/作为:第19届ACM SIGM数据管理会议,俄勒冈州波特兰,1989年5月-6月
[31] 哈斯,L.M。;Freytag,J.C。;Lohman,G.M。;Pirahesh,H.,《Starburst中的可扩展查询处理》(Clifford,J.;Lindsay,B.G.;Maier,D.,Proc.1989 ACM SIGMOD国际数据管理会议,俄勒冈州波特兰(1989),ACM出版社:ACM出版社纽约),377-388
[32] 哈斯,L.M。;科斯曼,D。;Wimmers,E.L。;Yang,J.,《跨不同数据源优化查询》,(第23届超大数据库国际会议(VLDB-97)(1997),276-285
[33] 哈默,J。;Garcia-Molina,H。;爱尔兰,K。;Papakonstantinou,Y。;Ullman,J。;Widom,J.,《TSIMMIS系统中的信息翻译、中介和基于马赛克的浏览》(美国计算机学会SIGMOD国际数据管理会议,加利福尼亚州圣何塞,1995年)
[34] 约安尼迪斯,Y。;Kang,Y.C.,优化大型连接查询的随机算法,(Proc.ACM SIGMOD国际数据管理会议,新泽西州大西洋城(1990)),312-321
[35] 约安尼迪斯,Y.E。;Christodulakis,S.,《关于连接结果大小错误的传播》,SIGMOD记录(ACM数据管理特别兴趣小组),第20卷,第2卷,第268-277页(1991年)
[36] 艾夫斯,Z.G。;Florescu,D。;弗里德曼,M。;利维,A。;Weld,D.S.,《数据集成的自适应查询执行系统》,SIGMOD记录,第28卷,第2卷,第299-310页(1999年),收录于:A.Delis,C.Faloutsos,S.Ghandharizadeh(编辑),Proc。ACM SIGMOD国际数据管理会议(SIGMOD-99)
[37] Jarke,M。;Koch,J.,数据库系统中的查询优化,ACM计算调查,第16卷,第2卷,第111-152页(1984年)·Zbl 0548.68099号
[38] 北卡罗来纳州卡布拉。;DeWitt,D.J.,《次优查询执行计划的高效中间查询再优化》,SIGMOD记录,第27卷,第2卷,第106-117页(1998年),收录于:Proc。ACM SIGMOD国际数据管理会议(SIGMOD-98)
[39] Kambhampati,S。;Knoblock,C.A。;Yang,Q.,《作为细化搜索的规划:评估部分顺序规划中设计权衡的统一框架》,《人工智能》,第76卷,第1-2卷,第167-238页(1995)
[40] Knoblock,C.A.,信息收集的规划、执行、传感和重新规划,(Proc.IJCAI-95,魁北克省蒙特利尔市(1995年))
[41] Knoblock,C.A.,《构建信息收集规划师:来自战壕的报告》(第三届人工智能规划系统国际会议论文集,苏格兰爱丁堡(1996))
[42] Knoblock,C.A。;明顿,S。;Ambite,J.L。;Philpot,A.G。;阿什什,N。;莫迪,P.J。;穆斯莱一世。;Tejada,S.,《信息集成的网络资源建模》(Proc.AAAI-98,Madison,WI(1998))
[43] Kushmerick,N.,《信息提取的包装归纳法》,华盛顿大学计算机科学与工程系博士论文(1997)
[44] Kwok,C.T。;Weld,D.S.,《计划收集信息》(Proc.AAAI-96,Portland,OR(1996))
[45] 兰布雷希特,E。;Kambhampati,S。;Gnanaprakasam,S.,《优化递归信息收集计划》(Proc.IJCAI-99,斯德哥尔摩,瑞典(1999))·Zbl 1075.68532号
[46] 利维,A.Y。;门德尔松,A.O。;萨吉夫,Y。;Srivastava,D.,使用视图回答查询(第14届ACM数据库系统原理研讨会,加利福尼亚州圣何塞(1995))
[47] 利维,A.Y。;Rajaraman,A。;Ordille,J.J.,《使用源描述查询异构信息源》(第22届超大数据库国际会议论文集,印度孟买(1996))
[48] 利维,A.Y。;Srivastava,D。;Kirk,T.,《全球信息系统中的数据模型和查询评估》,J.智能信息系统(网络信息发现和检索专刊),第5、2、121-143卷(1995年)
[49] Lohman,G.M.,《表示查询优化备选方案的类语法函数规则》(Boral,H.;Larson,P.Au.,Proc.1988 ACM SIGMOD International Conference on Management of Data,Chicago,IL(1988),ACM Press:ACM Press New York),18-27
[50] MacGregor,R.,《基于分类的知识表示系统的发展技术》(Sowa,J.,《语义网络原理:知识表示的探索》(1990),Morgan Kaufmann:Morgan Koufmann San Mateo,CA)
[51] Minton,S.,《基于解释学习效用的定量结果》,《人工智能》,第42卷,第2-3卷,第363-392页(1990年)
[52] 穆斯莱一世。;明顿,S。;Knoblock,C.A.,《半结构化、基于web的信息源的包装归纳法》(宾夕法尼亚州匹兹堡自动化学习会议和从文本和网络学习探索研讨会议事录(1998))
[53] 小野,K。;Lohman,G.M.,测量查询优化中联接枚举的复杂性,(McLeod,D.;Sacks Davis,R.;Schek,H.-J.,Proc.16th International Conference on Very Large Data Bases,Brisbane,Queensland,Australia(1990),Morgan Kaufmann:Morgan Kaufmann San Mateo,CA),314-325
[54] 彭伯蒂,J.S。;Weld,D.S.,《UCPOP:ADL的合理、完整、部分订单规划师》,(马萨诸塞州剑桥市第三届知识表示和推理原则国际会议论文集(1992)),189-197年
[55] 佩特,M。;Smith,D.,条件非线性规划,(Hendler,J.,Proc.First International Conference on AI planning Systems,College Park,MD(1992),Morgan Kaufmann:Morgan Koufmann San Mateo,CA),189-197年
[56] 罗斯,M.T。;Arya,M。;哈斯,L.M。;凯里,M.J。;科迪,W。;费金,R。;施瓦兹,P.M。;托马斯·J。;Wimmers,E.L.,大蒜项目,SIGMOD记录(ACM数据管理特别兴趣小组),第25、2、557-558卷(1996年)
[57] 罗斯,M.T。;Schwarz,P.M.,别扔了,包起来!遗留数据源的包装器体系结构,(第23届超大数据库国际会议(VLDB-97)(1997)),266-275
[58] 罗素,S。;Norvig,P.,《人工智能:现代方法》(1995),普伦蒂斯·霍尔:普伦蒂斯霍尔-恩格尔伍德悬崖,新泽西州·Zbl 0835.68093号
[59] Silberschatz,A。;科尔斯,H.F。;Sudarshan,S.,《数据库系统概念》(1997),McGraw-Hill:McGraw-Hill纽约·Zbl 0910.68066号
[60] Swami,A.,《大型连接查询的优化:结合启发式和组合技术》(Proc.ACM SIGMOD International Conference on Management of Data,Portland,OR(1989)),367-376
[61] 斯瓦米,A。;Gupta,A.,大型连接查询的优化,SIGMOD记录(ACM数据管理特别兴趣小组),第17、3、8-17卷(1988年)
[62] Tate,A.,《生成项目网络》(Proc.IJCAI-77,Cambridge,MA(1977)),888-893
[63] 托马西奇,A。;拉希德,L。;Valduriez,P.,利用DISCO扩展对异构数据源的访问,IEEE Trans。知识与数据工程,第10卷,第5卷,808-823(1998)
[64] Ullman,J.D.,《使用逻辑视图的信息集成》(第六届数据库理论国际会议论文集,希腊德尔福(1997))·Zbl 0944.68047号
[65] Urhan,T。;富兰克林,M.J。;Amsaleg,L.,《初始延迟的基于成本的查询加扰》,SIGMOD记录,第27卷,第2卷,第130-141页(1998年),收录于:Proc。ACM SIGMOD国际数据管理会议(SIGMOD-98)
[66] Weld,D.S.,《最低承诺计划导论》,AI杂志,第15卷,第4期(1994年)
[67] Weld,D.S.,人工智能规划的最新进展,《人工智能杂志》,第20卷,第2期(1999年)
[68] Wiederhold,G.,《未来信息系统架构中的中介》,IEEE Computer(1992)
[69] Yan,W.P。;P.奥勒·拉尔森。,加入前分组表演,(Elmagarmid,A.K.;Neuhold,E.,第十届国际数据工程会议,德克萨斯州休斯顿(1994),IEEE计算机学会出版社)
[70] Yan,W.P。;P.奥勒·拉尔森。,渴望聚合和懒惰聚合,(McLeod,D.;Sacks-Davis,R.;Schek,H.,Proc.21st International Conference on Very Large Database,Zurich,Switzerland(1995))
[71] 扎多罗日尼,V。;Bright,L。;拉希德,L。;Urhan,T。;Vidal,M.E.,《网络资源中介查询的有效评估》,技术报告(1999),UMIACS,马里兰大学
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。