×

具有反向引用的确定性正则表达式。 (英文) Zbl 1423.68251号

摘要:大多数用于正则表达式匹配的现代库都允许反向引用(即重复操作符),这大大提高了表达能力,但也会导致难以处理。为了在表达性和可处理性之间找到更好的平衡,我们将这些与XMLDTD和XMLSchema中使用的正则表达式的确定性概念结合起来。这包括定义一个合适的自动机模型,以及对Glushkov构造的概括。我们证明,与它们的非确定性超类相比,这些具有反向引用的确定性正则表达式具有理想的算法属性(即,在静态分析中有效地解决了成员问题和一些可判定问题),同时,它们的表达能力超过了没有反向引用的确定性正则表达式。

MSC公司:

65年第68季度 形式语言和自动机
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Abigail,Re:perl中的随机数,在新闻组comp.lang.perl.misc中发布,消息IDslrn64sudh.qp.abigail@betelgeuse.wayne.fnx.com, 1997.; Abigail,Re:perl中的随机数,在新闻组comp.lang.perl.misc中发布,消息IDslrn64sudh.qp.abigail@betelgeuse.wayne.fnx.com, 1997.
[2] Aho,A.V.,《寻找字符串模式的算法》,(van Leeuwen,J.,《理论计算机科学手册》,A卷(1990),Elsevier:Elsevier阿姆斯特丹),255-300,第5章·Zbl 0900.68249号
[3] Angluin,D.,《寻找一组字符串的共同模式》,J.Compute。系统。科学。,21, 46-62 (1980) ·Zbl 0454.68108号
[4] 巴塞洛,P。;Hurtado,C.A。;利布金,L。;Wood,P.T.,《图形结构数据路径查询的表达语言》(Proc.PODS 2010(2010))
[5] 贝克斯,G.J。;Gelade,W。;Neven,F。;Vansummeren,S.,学习从XML数据推断模式的确定性正则表达式,ACM Trans。Web,4,14(2010)
[6] 鲍耶,P。;佩蒂特,A。;Thérien,D.,《数据和时间语言的代数表征》(Proc.CONCUR 2001(2001)),248-261·Zbl 1006.68078号
[7] Braun,M.,moar–带反向引用的确定性正则表达式(2016)
[8] Bray,T。;Paoli,J。;Sperberg-McQueen,C.M。;马勒,E。;Yergeau,F.,可扩展标记语言XML 1.0(2008),W3C
[9] Brüggemann-Klein,A.,有限自动机的正则表达式,Theor。计算。科学。,120, 197-213 (1993) ·Zbl 0811.68096号
[10] Brüggemann-Klein,A。;Wood,D.,《一种模糊正则语言》,Inf.Comput。,142, 182-206 (1998) ·Zbl 0912.68112号
[11] Cámpeanu,C。;萨洛马,K。;Yu,S.,《实用正则表达式的正式研究》,Int.J.Found。计算。科学。,14, 1007-1018 (2003) ·Zbl 1101.68443号
[12] B·卡尔。;Narendran,P.,关于扩展正则表达式,(Proc.LATA 2009(2009))·Zbl 1234.68202号
[13] Caron,P。;韩,Y。;Mignot,L.,《广义一明确性》(DLT 2011年(2011)公报),129-140·Zbl 1221.68119号
[14] Chrobak,M.,有限自动机和一元语言,Theor。计算。科学。,47, 149-158 (1986) ·Zbl 0638.68096号
[15] Chrobak,M.,勘误表:“有限自动机和一元语言”,Theor。计算。科学。,302, 497-498 (2003)
[16] Cox,R.,正则表达式匹配可以简单快速(但在Java、Perl、PHP、Python、Ruby…中速度较慢)(2007)
[17] 泽温斯基,W。;大卫·C。;Losemann,K。;Martens,W.,《通过确定性正则表达式确定可定义性》,J.Compute。系统。科学。,88, 75-89 (2017) ·Zbl 1371.68146号
[18] Diekert,V.,马卡宁算法(2002),载于:[43],第12章
[19] Diekert,V.,1700多年的单词方程,(2015年计算机辅助教学期刊)·Zbl 1402.68146号
[20] Diekert,V。;Jeż,A。;Plandowski,W.,用对合求自由群和幺半群方程的所有解,Inf.Comput。,251, 263-286 (2016) ·Zbl 1382.68347号
[21] 费金,R。;Kimelfeld,B。;赖斯,F。;Vansummeren,S.,《文档扳手:信息提取的正式方法》,J.ACM,62,12(2015)·Zbl 1333.68098号
[22] 费尔瑙,H。;Schmid,M.L.,《变量模式匹配:多元复杂性分析》,Inf.Comput。,242, 287-305 (2015) ·Zbl 1370.68124号
[23] Fernau,H。;施密德,M.L。;Villanger,Y.,关于字符串态射问题的参数化复杂性,理论计算。系统。,59, 24-51 (2016) ·Zbl 1350.68139号
[24] Freydenberger,D.D.,《扩展正则表达式:简洁性和可判定性》,理论计算。系统。,53, 159-193 (2013) ·兹比尔1286.68281
[25] Freydenberger,D.D.,《文档扳手的逻辑》,《理论计算》。系统。(2019) ·Zbl 1402.68047号
[26] Freydenberger,D.D。;Holldack,M.,《文档扳手:从表达能力到决策问题》,《理论计算》。系统。,62, 854-898 (2018) ·Zbl 1392.68167号
[27] Freydenberger,D.D。;Schweikardt,N.,《扩展连接正则路径查询的表达性和静态分析》,J.Compute。系统。科学。,79, 892-909 (2013) ·Zbl 1409.68082号
[28] 高S.S。;Sperberg-McQueen,C.M。;Thompson,H.S.,《W3C XML模式定义语言(XSD)1.1第1部分:结构》(2012),W3C
[29] Garey,M.R。;Johnson,D.S.,《计算机与难治性》(1979),W.H.Freeman and Company·Zbl 0411.68039号
[30] Gelade,W。;Gyssens,M。;Martens,W.,带计数的正则表达式:弱决定论与强决定论,SIAM J.Comput。,41, 160-190 (2012) ·Zbl 1252.68146号
[31] Goyvaerts,J.,正则表达式教程(2018)
[32] 格罗兹,B。;Maneth,S.,确定性正则表达式的高效测试和匹配,J.Compute。系统。科学。,89, 372-399 (2017) ·Zbl 1372.68157号
[33] Han,Y.S。;Wood,D.,1-确定性正则语言的推广,Inf.Compute。,206, 1117-1125 (2008) ·Zbl 1154.68069号
[34] 霍普克罗夫特,J.E。;Ullman,J.D.,《自动机理论、语言和计算导论》(1979),Addison-Wesley·兹标0426.68001
[35] 卡明斯基,M。;Francez,N.,有限记忆自动机,Theor。计算。科学。,134, 329-363 (1994) ·Zbl 0938.68711号
[36] 卡明斯基,M。;Tan,T.,无限字母语言的正则表达式,Fundam。通知。,69, 301-318 (2006) ·Zbl 1096.68083号
[37] Kay,M.,XPath和XQuery函数和运算符3.0 W3C建议书(2014),W3C
[38] Kleene,S.C.,《神经网络和有限自动机中事件的表示》(Shannon,C.E.;McCarthy,J.;Ashby,W.R.,《自动机研究》(1956),普林斯顿大学出版社:普林斯顿大学出版,新泽西州普林斯顿),3-42
[39] Kozen,D.,自然证明系统的下界,(Proc.FOCS 1977(1977))
[40] 拿铁咖啡,M。;Niewerth,M.,带计数器的弱确定性正则表达式的可定义性是可判定的(Proc.MFCS 2015(2015))·Zbl 1465.68159号
[41] 利布金,L。;马滕斯,W。;Vrgoc,D.,用数据查询图形,J.ACM,63,14:1-14:53(2016)·Zbl 1426.68080号
[42] Losemann,K。;马滕斯,W。;Niewerth,M.,确定性正则表达式的闭包属性和描述复杂性,Theor。计算。科学。,627, 54-70 (2016) ·Zbl 1338.68154号
[43] Lothare,M.,《代数组合论》,《数学及其应用百科全书》,第90卷(2002年),剑桥大学出版社·Zbl 1001.68093号
[44] 卢,P。;Bremer,J。;陈浩,正则语言的决定论,理论计算。系统。,57, 97-139 (2015) ·Zbl 1339.68151号
[45] 马滕斯,W。;Neven,F。;Schwentick,T.,XML模式和链正则表达式决策问题的复杂性,SIAM J.Compute。,391486-1530(2009年)·Zbl 1211.68162号
[46] Mount,D.W.,《生物信息学:序列和基因组分析》(2004),纽约州伍德伯里市冷泉港实验室出版社
[47] Murata,M。;Lee,D。;马尼,M。;Kawaguchi,K.,《使用形式语言理论的XML模式语言分类》,ACM Trans。互联网技术。,5, 660-704 (2005)
[48] Neven,F。;Schwentick,T。;Vianu,V.,无限字母字符串的有限状态机,ACM Trans。计算。日志。,5, 403-435 (2004) ·Zbl 1367.68175号
[49] Niewerth,M.,《XML存储库管理系统的数据定义语言》(2015),TU Dortmund博士论文
[50] J.Ponty。;齐亚迪,D。;Champarnaud,J.,将正则表达式转换为自动机的新二次算法(Proc.WIA'96(1996))
[51] Schmid,M.L.,《正则表达式语言类内部》,Int.J.Found。计算。科学。,24, 1117-1134 (2013) ·Zbl 1293.68189号
[52] Schmid,M.L.,用配备因子引用的正则语言表征REGEX语言,Inf.Compute。,249, 1-17 (2016) ·Zbl 1344.68130号
[53] Sperberg-McQueen,C.M。;Thompson,H.,XML模式(2005)
[54] Vardi,M.Y.,《从一元逻辑到PSL》,《计算机科学支柱》(2008),施普林格出版社:柏林施普林格·Zbl 1133.68380号
[55] 沃尔,L。;Christiansen,T。;Orwant,J.,《编程Perl》(2000),O'Reilly Media:O'Relly Media Sebastopol,CA·Zbl 0949.68015号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。