×

DIME上无序XML的模式。 (英语) Zbl 1347.68109号

摘要:我们研究了用于无序XML的模式语言,这些无序XML在同级之间没有相对顺序。首先,我们建议无序正则表达式(URE),本质上是正则表达式无序串联它不是标准的串联,而是定义无序单词的语言来模拟节点允许的内容(即子节点标签的集合)。然而,无限制的URE在计算上过于昂贵,因为我们显示了URE的两个基本决策问题的难处理性:无序词对URE语言的隶属度和两个URE的包含。因此,我们提出了一种实用且易于处理的URE限制,析取区间重数表达式(DIME)。接下来,我们使用DIME定义无序树的语言,并提出两种模式语言:析取区间多重模式(DIMS)及其限制,无析取区间多重模式(智能弹药系统)。我们研究了以下静态分析问题的复杂性:模式可满足性,树对模式语言的隶属度,模式包含,以及存在模式时的小查询可满足性、隐含和包含。最后,我们研究了所提出的模式语言的表达能力,并将其与无序树的尺度语言(FO、MSO和Presburger约束)和交换闭包下的DTD进行了比较。我们的结果表明,所提出的模式语言能够表达许多无序树的实用语言,并具有理想的计算特性。

MSC公司:

第68页第15页 数据库理论
65年第68季度 算法和问题复杂性分析
65年第68季度 形式语言和自动机
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abiteboul,S.,Bourhis,P.,Vianu,V.:无序数据树的高表达性查询语言。In:ICDT,第46-60页(2012年)·Zbl 1352.68075号
[2] Albert,J.,Giammaresi,D.,Wood,D.:扩展无上下文文法的范式算法。西奥。计算。科学。267(1-2), 35-47 (2001) ·Zbl 0984.68092号 ·doi:10.1016/S0304-3975(00)00294-2
[3] Amer-Yahia,S.、Cho,S.,Lakshmanan,L.V.S.、Srivastava,D.:树模式查询最小化。VLDB J.11(4),315-331(2002)·兹比尔1047.68040 ·doi:10.1007/s00778-002-0076-7
[4] Beeri,C.,Milo,T.:结构化和半结构化数据的集成和翻译模式。In:ICDT,第296-313页(1999年)
[5] Benedikt,M.,Fan,W.,Geerts,F.:DTD存在下的XPath可满足性。J.ACM 55(2)(2008年)·Zbl 1326.68154号
[6] Berglund,M.,Björklund,H.,Högberg,J.:识别混乱的语言。收录:LATA,第142-154页(2011年)·Zbl 1330.68142号
[7] Bex,G.J.,Neven,F.,Schwentick,T.,Vansummeren,S.:简明正则表达式和DTD的推理。ACM事务处理。数据库系统35(2)(2010)·Zbl 1294.68067号
[8] Bex,G.J.,Neven,F.,Van den Bussche,J.:DTD与XML模式的实践研究。收录:WebDB,第79-84页(2004年)
[9] Björklund,H.,Martens,W.,Schwentick,T.:关于模式信息的树模式查询的有效性MFCS,第171-182页(2013)·Zbl 1398.68187号
[10] Boneva,I.,Ciucanu,R.,Staworke,S.:无序XML的简单模式。In:WebDB(2013)·Zbl 1347.68109号
[11] Boneva,I.,Gayo,J.E.L.,Hym,S.,Prud'hommeau,E.G.,Solbrig,H.R.,Staworki,S.:使用形状表达式验证RDF。arXiv:CoRRabs/1404.1270 CoRR(2014)
[12] Boneva,I.,Talbot,J.:无序树的自动机和逻辑。收录:RTA,第500-515页(2005年)·Zbl 1078.03035号
[13] Boneva,I.、Talbot,J.、Tison,S.:树的空间逻辑表达。收入:LICS,第280-289页(2005年)
[14] Brüggemann-Klein,A.,Wood,D.:一种模糊的正则语言。Inf.计算。142(2), 182-206 (1998) ·Zbl 0912.68112号 ·doi:10.1006/inco.1997.2695
[15] Cardelli,L.,Ghelli,G.:TQL:基于环境逻辑的半结构化数据查询语言。数学。结构。计算。科学。14(3), 285-327 (2004) ·Zbl 1085.68035号 ·doi:10.1017/S0960129504004141
[16] Ciucanu,R.,Staworke,S.:无序XML的学习模式。致:DBPL(2013)·兹比尔1347.68109
[17] Colazzo,D.,Ghelli,G.,Pardini,L.,Sartiani,C.:XML正则表达式类型的几乎线性包含。ACM事务处理。数据库系统。38(3), 15 (2013) ·Zbl 1321.68242号 ·doi:10.1145/2508020.2508022
[18] Colazzo,D.,Ghelli,G.,Sartiani,C.:有效包含一类具有交错和计数的XML类型。信息系统。34(7), 643-656 (2009) ·Zbl 1294.68067号 ·doi:10.1016/j.i.s.2008.10.001
[19] Czerwinski,W.,David,C.,Losemann,K.,Martens,W.:通过确定性正则表达式确定可定义性。收录:FoSSaCS,第289-304页(2013年)·Zbl 1260.68199号
[20] Dal-Zilio,S.、Lugiez,D.:XML模式、树逻辑和滑轮自动机RTA,第246-263页(2003)·Zbl 1038.68039号
[21] Gelade,W.、Martens,W.和F.Neven.:优化XML、数值约束和交错的模式语言。SIAM J.计算。38(5), 2021-2043 (2009) ·Zbl 1187.68191号 ·数字对象标识代码:10.1137/070697367
[22] Ghelli,G.,Colazzo,D.,Sartiani,C.:带交错和计数的正则表达式类中的线性时间成员关系。In:CIKM,第389-398页(2008年)·Zbl 1474.68089号
[23] Grijzenhout,S.,Marx,M.:XML web的质量。《网络期刊》第19期,第59-68页(2013年)·doi:10.1016/j.websem.2012.12.001
[24] Hashimoto,K.、Kusunoki,Y.、Ishihara,Y.和Fujiwara,T.:存在DTD时使用通配符的正XPath查询的有效性。致:DBPL(2011)·Zbl 0984.68092号
[25] Hovland,D.:具有无序串联和数值约束的正则表达式的成员资格问题。收录:LATA,第313-324页(2012年)·Zbl 1351.68140号
[26] Kopczynski,E.,To,A.:语法复杂性和应用的Parikh图像。收入:LICS,第80-89页(2010年)
[27] Martens,W.,Neven,F.:关于自上而下的XML转换类型检查的复杂性。西奥。计算。科学。336(1), 153-180 (2005) ·Zbl 1080.68021号 ·doi:10.1016/j.tcs.2004.10.035
[28] Martens,W.,Neven,F.,Gyssens,M.:类型检查自上而下的XML转换修复了输入或输出模式。Inf.计算。206(7)、806-827(2008)·兹比尔1154.68370 ·doi:10.1016/j.ic.2008.01.002
[29] Martens,W.,Neven,F.,Schwentick,T.:简单正则表达式决策问题的复杂性。收录:MFCS,第889-900页(2004年)·Zbl 1097.68066号
[30] Martens,W.,Neven,F.,Schwentick,T.:XML模式和链正则表达式决策问题的复杂性。SIAM J.计算。39(4), 1486-1530 (2009) ·兹比尔1211.68162 ·doi:10.1137/080743457
[31] Mayer,A.J.,Stockmeyer,L.J.:单词问题——这次是交错。Inf.计算。115(2), 293-311 (1994) ·doi:10.1006/inco.1994.1098
[32] Miklau,G.,Suciu,D.:XPath片段的包含和等价。J.ACM 51(1),2-45(2004)·Zbl 1316.68047号 ·doi:10.1145/962446.962448
[33] Montazerian,M.,Wood,P.T.,Mousavi,S.R.:XPath查询可满足性以实际DTD的PTIME表示XSym,第17-30页(2007)
[34] Neven,F.,Schwentick,T.:无序XML模式(1999)
[35] Neven,F.,Schwentick,T.:关于存在析取、DTD和变量时XPath包含的复杂性。计算机科学中的逻辑方法2(3)(2006)·Zbl 1126.68376号
[36] Oppen,D.C.:关于Presburger算法复杂性的222pn(2^{2^{2_{2^}p_n}}})上界。J.计算。系统。科学。16(3), 323-332 (1978) ·Zbl 0381.03021号 ·doi:10.1016/0022-0000(78)90021-1
[37] Papakonstantinou,Y.,Vianu,V.:XML数据视图的DTD推断。收入:PODS,第35-46页(2000年)
[38] Schaefer,T.J.:可满足性问题的复杂性。收件人:STOC,第216-226页(1978年)·Zbl 1282.68143号
[39] Schmidt,A.、Waas,F.、Kersten,M.、Carey,M.,Manolescu,I.、XMark,R.Busse:XML数据管理VLDB基准,第974-985页(2002)
[40] Schwentick,T.:树、自动机和XML PODS,第222页(2004)
[41] Segoufin,L.,Sirangelo,C.:针对DTD对流式XML文档进行常量内存验证。In:ICDT,第299-313页(2007年)·Zbl 1211.68162号
[42] Segoufin,L.,Vianu,V.:验证流式XML文档。在:PODS,第53-64页(2002年)·兹比尔0984.68092
[43] Seidl,H.、Schwentick,T.、Muscholl,A.:数字文档查询。收录:PODS,第155-166页(2003年)
[44] Seidl,H.、Schwentick,T.、Muscholl,A.:树木计数。收录:逻辑与自动化,第575-612页(2008年)·Zbl 1226.03049号
[45] Staworke,S.,Wieczorek,P.:学习树枝和路径查询。在:ICDT,第140-154页(2012年)
[46] Stockmeyer,L.J.,Meyer,A.R.:需要指数时间的单词问题STOC初步报告,第1-9页(1973)·Zbl 0359.68050号
[47] W3C:XML路径语言(XPath)1.0(1999)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。