×

XML处理的基础。树自动机方法。 (英语) Zbl 1235.68004号

剑桥:剑桥大学出版社(ISBN 978-0-521-19613-0/hbk;978-0-511-90402-8/电子书)。xi,第226页。(2011).
这本书是对XML的树自动机方法的结果的非常详细的总结。作者使用模式来考虑XML数据。所考虑的方案基于标准化的XML方案语言,如DTD、XML Schema和RELAX NG。
这本书分为15章。引言包含本书的全局概述以及有关树转换和类型检查的基本信息。强调本书中使用的方法的一个重要备注涉及精确类型检查和近似类型检查。前言总结了后续阅读书籍所必需的基本概念,如正则表达式和字符串自动机。
简短的第3章介绍了作者对XML方案的方法。他没有直接使用众所周知的XML模式语言,但他引入了自己的模式模型来捕捉这些语言的本质。该模型主要支持XML模式的结构属性,而不支持现有的完整性约束,例如在XML模式语言中。第4章正式定义了作者方法中使用的基本概念,即树自动机。本文特别关注树自动机的自顶向下和自下而上决定论,即区分自动机属性的特征。在第5章中,作者介绍了从输入树中提取子树的模式的概念。这些定义自然会继续定义标记树自动机。本章还介绍了如何将模式转换为这些自动机的方法。本书的第一部分描述了基本主题,第7章专门讨论了XML文档上下文中的类型检查。首先,作者概述了XML类型检查的各种方法,特别是其精确版本和近似版本。他提出了函数语言XDouce的一个子集,并为XML处理构建了一个简单但功能强大的类型系统。
第二部分专门讨论高级主题,从第8章开始,介绍与XML处理相关的重要问题的实时算法,即树自动机的成员关系、标记树自动机评估和树自动机包含。本章包括自顶向下和自下而上算法。这些算法通过指定其复杂性和威力的定理来完成。第9章介绍了树自动机的一个扩展,称为交替树自动机,允许使用“集合交集”操作符。
第10章描述了树变换器,即一类不仅接受树,而且对树进行变换的有限状态模型。本章介绍了两个框架,即自顶向下的树变换器和宏变换器,并显示了它们的属性。
第11章专门讨论最简单的树转换语言的精确类型检查,即下拉树变换器。第12章介绍了一种称为路径表达式的子树提取替代方法。虽然模式是用于匹配子树的结构约束,但路径表达式使用导航。这些表达式在非常著名的语言XPath中使用。在同一章中,作者介绍了相应自动机的框架,称为树行走自动机。在那里,它们的表现力与普通树自动机的表现力进行了比较。第三种子树提取方法使用一阶逻辑及其扩展的一元二阶逻辑。第13章介绍了基于逻辑的查询。
最后两章第14章和第15章专门讨论了模糊性,即正则表达式或模式具有多种匹配可能性的情况,以及XML的无序性。(回想一下,XML结构是有序的。)作者回顾了以前一些解决无序XML文档问题的建议。
一个附录完成了这本书。它总结了选定练习的解决方案。事实上,这本书还可以作为XML语言高级课程的教科书。
这本书可以被推荐为对XML理论的基本贡献。它还提供了可以在实践中使用的算法。

MSC公司:

68-01 与计算机科学相关的介绍性说明(教科书、教程论文等)
68-02 与计算机科学有关的研究博览会(专著、调查文章)
第68页,共15页 数据库理论
65年第68季度 形式语言和自动机
68第05页 数据结构
65年第68季度 算法和问题复杂性分析
68问题65 抽象数据类型;代数规范
PDF格式BibTeX公司 XML格式引用