×

从搜索文本到查询XML流。 (英语) Zbl 1118.68462号

摘要:XML数据是用一种称为XPath的语言用有限形式的正则表达式查询的。新的XML流处理应用程序,如基于内容的路由或选择性信息传播,需要在传入的XML流上以较高、持续的速率同时评估数千或数百万个XPath表达式。在最简单的近似方法中,XPath求值问题类似于文本搜索问题,其中需要将一个或多个正则表达式与给定文本匹配。在更精细的层次上,它与树模式匹配问题有关。然而,与传统设置不同,这里的正则表达式数量要大得多,而“文本”要短得多,因为它对应于XML流的深度。在本文中,我们研究了为XML流处理提出的技术,并描述了一些开放的问题。

MSC公司:

第68页,共15页 数据库理论
65年第68季度 形式语言和自动机
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abiteboul,S。;Buneman,P。;Suciu,D.,《网络上的数据:从关系到半结构化数据和XML》(1999),Morgan Kaufmann
[2] Aho,A。;Corasick,M.,《高效字符串匹配:书目搜索的辅助工具》,美国通信协会,第18期,第333-340页(1975年)·Zbl 0301.68048号
[3] 阿尔蒂诺,M。;Franklin,M.,高效过滤XML文档以进行选择性传播,(VLDB会议记录,开罗,埃吉特(2000)),53-64
[4] 阿维拉·坎皮略,I。;格林·T·J。;古普塔,A。;Onizuka,M。;Raven,D。;Suciu,D.,XMLTK:一个用于可伸缩XML流处理的XML工具包,(PLANX学报(2002))
[5] Babcock,B。;巴布,S。;数据员,M。;Motwani,R。;Widom,J.,数据流系统中的模型和问题,(ACM SIGART/SIGMOD数据库系统原理研讨会论文集(2002)),1-16
[6] Bosak,J.,《XML、java和网络的未来》,《万维网杂志》,第2期,第4期,第219-227页(1997年)
[7] Chan,C。;费尔伯,P。;Garofalakis,M。;Rastogi,R.,用XPath表达式高效过滤XML文档(2002年国际数据工程会议论文集)·Zbl 1060.68025号
[8] 克里斯托菲德斯五世。;Abiteboul,S。;克鲁特,S。;Scholl,M.,《从结构化文档到新型查询工具》(Snodgrass,R.;Winslett,M.),《1994年ACM SIGMOD国际数据管理会议论文集》,明尼阿波利斯,明尼苏达州(1994),313-324
[9] J.Clark,XML路径语言(XPath),1999年,网址:http://www.w3.org/TR/xpath; J.Clark,XML路径语言(XPath),1999,网址:http://www.w3.org/TR/xpath
[10] W.W.W.联盟,可扩展标记语言(xml)1.0,1998年,http://www.w3.org/TR/REC-xml; W.W.W.联盟,可扩展标记语言(xml)1.0,1998年,http://www.w3.org/TR/REC-xml
[11] 科尔曼,T.H。;Leiserson,C.E。;Rivest,R.L.,《算法导论》(1990),麻省理工学院出版社·Zbl 1158.68538号
[12] Diao,Y。;菲舍尔,P。;富兰克林,M。;To,R.,Yfilter:高效且可扩展的xml文档过滤,(加州圣何塞国际数据工程会议论文集(2002))
[13] Goldman,R。;Widom,J.,《数据指南:在半结构化数据库中实现查询公式化和优化》(《超大数据库学报》(1997)),436-445
[14] Gonnet,G。;Baeza Yates,R。;Snider,T.,《文本的词汇索引:倒置文件与PAT树》,(Frakes,W.B.;Baeza-Yates,R.A.,《信息检索:数据结构与算法》(1992),Prentice-Hall:Prentice-Hall Englewood Cliffs,NJ),66-82
[15] Gonnet,G。;Tompa,F.,《注意语法:文本建模的新方法》(第13届超大数据库国际会议论文集(1987)),339-346
[16] 格林·T·J。;米克劳,G。;Onizuka,M。;Suciu,D.,用确定性自动机处理XML流,(ICDT论文集(2003))·Zbl 1022.68512号
[17] M.Gudgin、M.Hadley、J.Moreau、H.Nielsen,SOAP版本1.2第1部分:消息传递框架,2001年,可从W3C获得,http://www.w3.org/2000/xp/Group/; M.Gudgin、M.Hadley、J.Moreau、H.Nielsen,SOAP版本1.2第1部分:消息传递框架,2001年,可从W3C获得,http://www.w3.org/2000/xp/Group/
[18] M.Gudgin、M.Hadley、J.Moreau、H.Nielsen,SOAP版本1.2第2部分:附件,2001年,可从W3C获得,http://www.w3.org/2000/xp/Group/; M.Gudgin、M.Hadley、J.Moreau、H.Nielsen,SOAP版本1.2第2部分:附件,2001年,可从W3C获得,http://www.w3.org/2000/xp/Group/
[19] 古普塔,A。;Suciu,D.,带谓词的XPath查询流处理,(ACM SIGMOD数据管理会议论文集(2003))
[20] 古普塔,A。;苏秋(D.Suciu)。;Halevy,A.,基于xml内容路由的视图选择问题,(PODS论文集(2003))
[21] 霍夫曼,C.M。;O'Donnell,M.J.,《树木中的模式匹配》,美国计算机学会,29,1,68-95(1982)·Zbl 0477.68067号
[22] 霍普克罗夫特,J。;Ullman,J.,《自动机理论、语言和计算导论》(1979),Addison-Wesley:Addison-Whesley Englewood Cliffs,NJ·Zbl 0426.68001号
[23] Z.Ives,A.Halevy,D.Weld,网络数据的XML查询引擎,2001年,未出版;Z.Ives,A.Halevy,D.Weld,网络数据的XML查询引擎,2001年,未出版·Zbl 1047.68049号
[24] Liefke,H。;Suciu,D.,XMill:一种高效的XML数据压缩器(SIGMOD论文集,德克萨斯州达拉斯(2000)),153-164
[25] 马库斯,M。;圣托里尼,B。;Marcinkiewicz,M.A.,《建立一个大型注释英语语料库:宾夕法尼亚大学特伦巴克分校》,计算语言学,19(1993)
[26] NASA天文数据中心,ADC XML资源页,http://xml.gsfc.nasa.gov/; NASA天文数据中心,ADC XML资源页,http://xml.gsfc.nasa.gov/
[27] 纳瓦罗,G。;Baeza-Yates,R.,《邻近节点:按内容和结构查询文档数据库的模型》,ACM Trans。通知。系统。,15, 4, 400-435 (1997)
[28] Rozenberg,G。;Salomaa,A.,《形式语言手册》(1997),Springer-Verlag:Springer-Verlag Berlin·兹伯利0866.68057
[29] Salminen,A。;Tompa,F.W.,Pat表达式:文本搜索的代数,(计算词典学论文:COMPLEX’92(1992)),309-332
[30] Salminen,A。;Tompa,F.W.,Pat表达式:文本搜索的代数,匈牙利语言学学报,41,1-4,277-306(1994)
[31] 斯诺伦,A。;康利,K。;Gifford,D.,使用XML的基于网格的内容路由,(第18届操作系统原理研讨会论文集(2001))
[32] H.Thompson,D.Beech,M.Maloney,N.Mendelsohn,XML模式第1部分:结构,2001年5月,http://www.w3.org/TR/xmlschema-1/; H.Thompson,D.Beech,M.Maloney,N.Mendelsohn,XML模式第1部分:结构,2001年5月,http://www.w3.org/TR/xmlschema-1/
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。