跳到主要内容
10.5555/1287369.1287425法律诉讼程序文章/章节视图摘要出版物页面超大规模数据库会议记录会议集合
第条

ProTDB:XML中的概率数据

出版:2002年8月20日出版历史

摘要

由于传统数据库只管理确定性信息,因此许多使用数据库的应用程序都涉及不确定数据。本文提出了一个概率树数据库(ProTDB)来管理以XML表示的概率数据。

我们的方法不同于以前开发概率关系系统的方法,因为我们构建了一个概率XML数据库。这种设计是由涉及数据的应用程序需求驱动的,这些数据不容易接受关系表示。XML数据提出了几个建模挑战:由于其结构,由于在多个粒度上存在不确定性关联的可能性,以及由于子元素丢失和重复的可能性。我们提出了一个概率XML模型来解决所有这些挑战。我们使用我们的概率模型设计了一个XML查询操作的实现,并通过实验证明了我们实现的效率。

我们使用ProTDB管理来自两个应用领域的数据:来自生物信息学领域的蛋白质化学数据,以及使用自然语言分析系统从web获取的信息提取数据。我们对后者进行了简要的案例研究,以证明概率XML数据管理的价值。

工具书类

  1. {1}http://www.cia.gov/cia/publications网站/资料手册/。谷歌学者谷歌学者
  2. {2} XML检索评估倡议。http://qmir.dcs.qmw.ac.uk/INEX/。谷歌学者谷歌学者
  3. {3} Serge Abiteboul、Dallan Quass、Jason McHugh、Jennifer Widom和Janet Wiener。半结构化数据的Lorel查询语言。数字图书馆期刊1996年11月。谷歌学者谷歌学者
  4. {4} 丹尼尔·巴巴拉(Daniel Barbará)、赫克托尔·加西亚·莫利纳(Hector Garcia-Molina)和达里尔·波特(Daryl Porter)。概率数据的管理。IEEE知识与数据工程汇刊,4(5):487-5021992年10月。谷歌学者谷歌学者数字图书馆数字图书馆
  5. {5} 罗杰·卡瓦洛和迈克尔·皮塔雷利。概率数据库理论。第13届国际VLDB会议记录,第71-81页,1987年。谷歌学者谷歌学者数字图书馆数字图书馆
  6. {6} Debabrata Dey和Sumit Sarkar。概率关系模型和代数。ACM数据库系统事务,21(3):339-3691996年9月。谷歌学者谷歌学者数字图书馆数字图书馆
  7. {7} Debabrata Dey和Sumit Sarkar。PSQL:概率关系数据的查询语言。数据与知识工程, 28: 107-120, 1998.谷歌学者谷歌学者数字图书馆数字图书馆
  8. {8} 丹尼尔·埃格诺和罗伯特·洛德。使用XML的结构化信息检索。SIGIR XML和信息检索研讨会的非正式会议记录, 2000.谷歌学者谷歌学者
  9. {9} 托马斯·艾特、托马斯·卢卡西维茨和迈克尔·沃尔特。将关系代数扩展到概率复值。信息和知识系统基础国际研讨会会议记录,第94-1152000页。谷歌学者谷歌学者数字图书馆数字图书馆
  10. {10} 诺伯特·福尔和凯·格罗·约翰。XIRQL:一种用于XML文档中信息检索的查询语言。第24届国际ACM SIGIR会议记录2001年9月,路易斯安那州新奥尔良。谷歌学者谷歌学者数字图书馆数字图书馆
  11. {11} 诺伯特·富尔(Norbert Fuhr)和托马斯·罗列克(Thomas Rölleke)。用于集成信息检索和数据库系统的概率NF2关系代数。第二届世界集成设计和工艺技术会议记录,第17-30页,1996年。谷歌学者谷歌学者
  12. {12} 诺伯特·富尔(Norbert Fuhr)和托马斯·罗列克(Thomas Rölleke)。用于信息检索和数据库系统集成的概率关系代数。美国计算机学会信息系统汇刊, 15(1): 32-66, 1997.谷歌学者谷歌学者数字图书馆数字图书馆
  13. {13} 索尔·戈登和哈罗德·布雷彻。生活是不确定的。。先吃甜点!:找到你应得的快乐Dell Books,1996年4月。谷歌学者谷歌学者
  14. {14} W3C工作组。XML路径语言(XPath)。http://www.w3.org/TR/xpath。谷歌学者谷歌学者
  15. {15} W3C工作组。XQuery:一种XML查询语言。http://www.w3.org/TR/xquery/。谷歌学者谷歌学者
  16. {16} Yoshihiko Hayashi、Junji Tomita和Gen'ichiro Kikui。使用相关性排序搜索文本丰富的XML文档。SIGIR XML和信息检索研讨会的非正式会议记录, 2000.谷歌学者谷歌学者
  17. {17} H.V.Jagadish、Shurg Al-Khalifa、Laks Lakshmanan、Andrew Nierman、Stylianos Paparizos、Jignesh Patel、Divesh Srivastava和Yuqing Wu。Timber:原生XML数据库。密歇根大学技术报告,2002年4月。http://www.ecs.umich.edu/db/木材/。谷歌学者谷歌学者
  18. {18} H.V.Jagadish、Laks Lakshmanan、Divesh Srivastava和Keith Thompson。税务:XML的树代数。DBPL会议记录,马里诺,罗马,意大利。谷歌学者谷歌学者数字图书馆数字图书馆
  19. {19} Laks V.S.Lakshmanan、Nicola Leone、Robert Ross和V S.Subrahmanian。ProbView:一个灵活的概率数据库系统。ACM数据库系统事务, 22(3): 419-469, 1997.谷歌学者谷歌学者数字图书馆数字图书馆
  20. {20} 穆尼娅·拉尔马斯。Dempster-Shafer的证据理论应用于结构化文档:建模不确定性。第20届国际ACM SIGIR会议记录1997年7月,宾夕法尼亚州费城。谷歌学者谷歌学者数字图书馆数字图书馆
  21. {21}迈克尔·皮塔雷利。概率数据库的代数。IEEE知识与数据工程汇刊, 6(2): 293-303, 1994.谷歌学者谷歌学者数字图书馆数字图书馆
  22. {22}Dragomir Radev、Kelsey Libner和Weigo Fan。获取网络上自然语言查询的答案。美国信息科学与技术学会杂志, 2002.谷歌学者谷歌学者数字图书馆数字图书馆
  23. {23}德拉戈米尔·拉德夫(Dragomir R.Radev)、范伟国(Weigo Fan)、洪琪(Hong Qi)和阿马尔代普·格雷瓦尔(Amardeep Grewal)。网络上的概率问答。第十一届国际万维网会议记录, 2002.谷歌学者谷歌学者数字图书馆数字图书馆
  24. {24}安贾·西奥博尔德(Anja Theobald)和格哈德·魏库姆(Gerhard Weikum)。基于索引的XXL搜索引擎,用于查询具有相关性排名的XML数据。EDBT会议记录2002年3月,捷克共和国布拉格。谷歌学者谷歌学者数字图书馆数字图书馆
  25. {25}埃斯特班·齐曼伊。概率关系数据库中的查询评估。理论计算机科学, 171: 179-219, 1997.谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. ProTDB:XML中的概率数据

                建议

                评论

                登录选项

                检查您是否可以通过登录凭据或您的机构访问本文。

                登录

                完全访问权限

                • 发布于

                  封面图片DL主持会议
                  VLDB’02:第28届超大数据库国际会议论文集
                  2002年8月
                  1110页

                  出版商

                  VLDB捐赠

                  出版历史

                  • 出版:2002年8月20日

                  限定符

                  • 第条

                PDF格式

                以PDF文件查看或下载。

                PDF格式

                电子阅读器

                使用eReader联机查看。

                电子阅读器