×

基于面向图形的语义模型从半结构化数据中提取局部模式。 (英语) Zbl 1006.68045号

摘要:许多现代应用程序(电子商务、数字图书馆等)需要集成访问各种信息源(从传统的RDBMS到半结构化Web存储库):从半结构化数据中提取模式是集成异构信息源的先决条件。提取全局模式的传统方法可能需要时间(和空间)随着源中对象和边的数量呈指数级增加。本文提出了一种新的局部模式提取方法。在该方法中,该算法通过检测目标集的语义距离,利用Hash类及其路径距离操作,控制“模式直径”内模式提取的规模。这种方法对于抑制模式扩展是非常有效的。原型验证了新方法。

MSC公司:

第68页,共15页 数据库理论
68第05页 数据结构
68M10个 计算机系统中的网络设计和通信
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 谢尔盖·阿比特布尔。查询半结构化数据。计算机科学课程讲稿1186,Foto Afrati,Phokion Kolaties(编辑),InProc。国际数据库理论会议,纽约:Springer-Verlag,1997年,第1-18页。
[2] Nestorov S,Abiteboul S,Motwani R.从半结构化数据中提取模式。1998年5月于华盛顿州西雅图举行的ACM SIGMOD国际数据管理会议记录,第295-306页。
[3] Buneman P、Davidson S、Fernandez M、Suciu D。为非结构化数据添加结构。《数据库理论国际会议论文集》,希腊德尔福,1997年1月,第335-350页。
[4] Goldman R,Widom J.数据指南:在半结构化数据库中实现查询公式化和优化。《第二十届超大数据库国际会议论文集》,Bymatthias Jarke(编辑),希腊雅典:Morgan Kaufmann,1997年。第436-445页。
[5] Nestorov S,Ullman J,Wiener J,Chawathe S。代表性对象:半结构化层次数据的简明表示。《国际数据工程会议论文集》,英国伯明翰,1997年4月,第79-90页。
[6] Prasenjit Mitra、Gio Wiederhold、Martin Kersten。一种面向图的模型,用于表达本体的相互依赖性。《扩展数据库技术会议论文集》(EDBT 2000),德国康斯坦茨,2000年3月,第86-100页。
[7] Papakonstantinou Y,Garcia-Molina H,Widom J.跨异构信息源的对象交换。《第十一届国际数据工程会议论文集》,Philip S Yu,Arbeee L P Chen(编辑),台北:IEEE计算机学会,1995年,第251–260页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。