×

XML的正则表达式模式匹配。 (英语) Zbl 1093.68556号

摘要:我们建议将正则表达式模式匹配作为用于操作XML的编程语言的核心功能。我们使用正则表达式操作符扩展了传统的模式匹配工具(如ML),例如重复(ast)、交替(|)等,这些操作符可以匹配任意长的子树序列,从而允许紧凑模式从复杂序列的中间提取数据。然后,我们将展示如何检查这些模式的穷尽性和冗余性的标准概念。正则表达式模式旨在用于具有基于正则表达式类型的类型系统的语言中。为了避免过多的类型注释,我们开发了一种类型推理方案,将类型约束从输入值的类型传播到模式变量。类型推理算法将类型和模式转换为常规树自动机,然后根据树自动机上的标准闭包操作(并集、交集和差集)工作。主要的技术挑战是如何处理重复和交替模式与第一场比赛策略的相互作用,这就产生了有关分析的终止和精确性的微妙问题。我们通过引入表示这些封闭操作的数据结构来解决这些问题。

MSC公司:

68甲15 编程语言理论
68第05页 数据结构
PDF格式BibTeX公司 XML格式引用
全文: 内政部