×

文档扳手:信息提取的正式方法。 (英语) Zbl 1333.68098号


MSC公司:

68第20页 信息存储和数据检索
68第05页 数据结构
65年第68季度 形式语言和自动机

软件:

图形日志
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿尔弗雷德·阿霍。1990.字符串模式查找算法。《理论计算机科学手册》A卷:算法与复杂性(A)。北荷兰,255-300·Zbl 0900.68249号
[2] 詹姆斯·艾伦。1983.保持对时间间隔的了解。Commun公司。ACM第26、11、832–843页·兹比尔0519.68079 ·数字对象标识代码:10.1145/182.358434
[3] 道格拉斯·E·阿佩尔特(Douglas E.Appelt)和博扬·奥尼什凯维奇(Boyan Onyshkevych)。1998。通用模式规范语言。《TIPSTER文本程序会议录:第三阶段:计算语言学协会》,23-30。
[4] 马塞洛·阿雷纳斯(Marcelo Arenas)、利奥波多·贝尔托西(Leopoldo E.Bertossi)和扬·乔米奇(Jan Chomicki)。1999.不一致数据库中的一致查询答案。PODS会议记录。ACM,68–79·Zbl 1079.68026号 ·数字对象标识代码:10.1145/303976.303983
[5] 巴勃罗·巴克尔(Pablo Barcel);,Diego Figueira和Leonid Libkin,2012a。具有有理关系的图逻辑和广义交集问题。在LICS的诉讼中。IEEE,115–124·Zbl 1362.68063号
[6] 巴勃罗·巴塞尔ó,利奥尼德·利金(Leonid Libkin)、安东尼·威贾贾·林(Anthony Widjaja Lin)和彼得·伍德(Peter T.Wood)。2012年b。图形结构数据上的路径查询的表达式语言。ACM事务处理。数据库。系统。37, 4, 31. 内政部:http://dx.doi.org/10.1145/2389241.2389250 ·数字对象标识代码:10.1145/2389241.2389250
[7] 巴勃罗·巴塞尔ó,Juan L.Reutter和Leonid Libkin,2013年。参数化正则表达式及其语言。理论。计算。科学。474, 21–45. ·Zbl 1259.68104号
[8] 迈克尔·贝内迪克特(Michael Benedikt)、列奥尼德·利布金(Leonid Libkin)、托马斯·施温蒂克(Thomas Schwentick)和吕克·塞古芬(Luc Segoufin)。2003.字符串上的可定义关系和一阶查询语言。美国临床医学杂志50、5、694–751·Zbl 1325.03031号 ·doi:10.1145/876638.876642
[9] 让·伯斯特尔。1979年,转喻和上下文无关语言。Teubner Studienbü斯图加特谢尔。 ·doi:10.1007/978-3-663-09367-1
[10] 安东尼·邦纳(Anthony J.Bonner)和吉安萨瓦托雷·麦加(Giansalvatore Mecca)。1998年。序列、数据日志和传感器。J.计算。系统。科学。57, 3, 234–259. ·Zbl 0917.68053号 ·doi:10.1006/jcss.1998.1562
[11] 迭戈·卡尔瓦内斯(Diego Calvanee)、朱塞佩·德贾科莫(Giuseppe De Giacomo)、毛里齐奥·伦泽里尼(Maurizio Lenzerini)和莫舍·瓦尔迪(Moshe Y.Vardi)。2000年a。包含带反转的连接正则路径查询。KR 2000会议记录。176–185. ·Zbl 1015.68083号
[12] 迭戈·卡尔瓦内斯(Diego Calvanee)、朱塞佩·德贾科莫(Giuseppe De Giacomo)、毛里齐奥·伦泽里尼(Maurizio Lenzerini)和莫舍·瓦尔迪(Moshe Y.Vardi)。2000年b。基于视图的查询处理和约束满足。在LICS的诉讼中。361–371. ·Zbl 1108.68443号 ·doi:10.1109/LICS.2000.855784
[13] Cezar公司;mpeanu、Kai Salomaa和Sheng Yu。2003.实用正则表达式的正式研究。发现的国际期刊。计算。科学。14, 6, 1007–1018. ·Zbl 1101.68443号
[14] 塞萨尔Câmpeanu和Nicolae Santean。2009年,关于正则语言与正则语言的交集。理论。计算。科学。第410页,第24–25页,第2336–2344页·Zbl 1167.68031号
[15] 本杰明·卡尔和巴利亚特·纳伦德兰。2009.关于扩展正则表达式。LATA 2009年会议记录。计算机科学讲义,第5457卷。279–289. ·Zbl 1234.68202号
[16] Laura Chiticariu、Rajasekar Krishnamurthy、Yunyao Li、Sriram Raghavan、Frederick Reiss和Shivakumar Vaithyanathan。2010年,SystemT:声明性信息提取的代数方法。计算机语言学协会(ACL’10)第48届年会/会议记录。128–137.
[17] 玛丽亚诺·康森斯(Mariano P.Consens)和阿尔贝托·门德尔松(Alberto O.Mendelzon)。1990年。GraphLog:真实生活递归的可视化形式主义。PODS会议记录。美国医学会,404–416·doi:10.1145/298514.298591
[18] Isabel F.Cruz、Alberto O.Mendelzon和Peter T.Wood。支持递归的图形查询语言。SIGMOD会议记录。美国医学会,323–330·doi:10.1145/38713.38749
[19] 哈米什·坎宁安。2002。GATE,文本工程的通用架构。计算。人类。36, 2, 223–254. ·doi:10.1023/A:1014348124664
[20] Alin Deutsch和Val Tannen。2001.连接规则路径查询类的优化属性。DBPL诉讼中。21–39. ·Zbl 1098.68563号
[21] 卡尔文·埃尔戈特(Calvin C.Elgot)和J.E.梅泽伊(J.E.Mezei)。关于广义有限自动机定义的关系。IBM研究开发杂志。9, 47–68. ·Zbl 0135.00704号 ·数字对象标识代码:10.1147/rd.91.0047
[22] 罗纳德·费金(Ronald Fagin)、本尼·基梅尔菲尔德(Benny Kimelfeld)、弗雷德里克·赖斯(Frederick Reiss)和斯蒂恩·范萨梅伦(Stijn Vansummeren)。2013.扳手:信息提取的正式框架。PODS会议记录。37–48之间·Zbl 1333.68098号 ·doi:10.1145/2463664.2463665
[23] 罗纳德·费金(Ronald Fagin)、本尼·基梅尔菲尔德(Benny Kimelfeld)、弗雷德里克·赖斯(Frederick Reiss)和斯蒂恩·范萨梅伦(Stijn Vansummeren)。2014.通过优先修复清除信息提取中的不一致。第33届ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会会议记录(PODS’14)。美国医学会,164-175·Zbl 1333.68098号 ·doi:10.1145/2594538.2594540
[24] Daniela Florescu、Alon Y.Levy和Dan Suciu。1998.使用正则表达式的连接查询的查询包含。PODS会议记录。139–148. ·doi:10.1145/275487.275503
[25] 达恩·弗雷塔格。1998.面向信息提取的通用学习。COLING-ACL会议记录。404–408.
[26] 多米尼克·D·弗雷登伯格。2011.扩展正则表达式:简洁性和可判定性。在STACS(LIPIcs)会议记录中。第9卷,达格斯图尔宫-莱布尼茨-泽特鲁姆富尔信息馆,507–518·Zbl 1230.68129号
[27] 杰弗里·弗里德尔。2006.掌握正则表达式。奥莱利传媒。
[28] 西摩·金斯伯格和肖恩·王晓阳。1998.常规序列操作及其在数据库查询中的使用。J.计算。系统。科学。56, 1, 1–26. ·Zbl 0916.68035号 ·doi:10.1006/jcss.1997.1514
[29] Gösta Grahne,Matti Nykänen和Esko Ukkonen。1999.数据库中字符串的推理。J.计算。系统。科学。59, 1, 116–162.
[30] 拉尔夫·格里什曼(Ralph Grishman)和贝斯·桑德海姆(Beth Sundheim)。1996年,信息理解会议-6:简史。在COLING诉讼程序中。466–471.
[31] Orna Grumberg、Orna Kupferman和Sarai Sheinvald。2010.无限字母上的可变自动机。LATA会议记录。561–572. ·Zbl 1284.68352号 ·doi:10.1007/978-3-642-13089-2_47
[32] 唐纳德·科努特(Donald E.Knuth)。1968.无上下文语言的语义。数学。系统。理论2,2,127–145·Zbl 0169.01401号 ·doi:10.1007/BF01692511
[33] 唐纳德·科努特(Donald E.Knuth)。1971.更正:无语境语言的语义。数学。系统。理论5,1,95-96·Zbl 0219.68035号 ·doi:10.1007/BF01702865
[34] 拉贾塞卡·克里希纳穆尔西(Rajasekar Krishnamurthy)、李云耀(Yunyao Li)、斯里拉姆·拉加万(Sriram Raghavan)、弗雷德里克·赖斯(Frederick Reiss)、西瓦库马尔·瓦西亚纳坦(Shivakumar Vaithyanathan)。SystemT:声明性信息提取系统。SIGMOD记录37、4、7–13。
[35] John D.Lafferty、Andrew McCallum和Fernando C.N.Pereira。2001.条件随机场:分割和标记序列数据的概率模型。ICML会议记录。摩根·考夫曼,282-289。
[36] T.R.韭菜。1997年。使用隐马尔可夫模型进行信息提取。加州大学圣地亚哥分校硕士论文。
[37] 彼得·林茨。2001年,《形式语言与自动机导论》,第三版,Jones and Bartlett Publishers,Inc.,萨德伯里,马萨诸塞州·Zbl 1230.68010号
[38] B.Liu、L.Chiticariu、V.Chu、H.V.Jagadish和F.R.Reiss。2010.信息提取的自动规则优化。程序。荷兰VLDB。3、1–2、588–597·数字对象标识代码:10.14778/1920841.1920916
[39] Andrew McCallum、Dayne Freitag和Fernando C.N.Pereira。信息提取和分割的最大熵马尔可夫模型。ICML会议记录。摩根·考夫曼,591-598。
[40] Frank Neven和Thomas Schwentick。2002.有限树上的查询自动机。理论。计算。科学。275, 2, 633–674. ·Zbl 1026.68081号 ·doi:10.1016/S0304-3975(01)00301-2
[41] 弗兰克·内文(Frank Neven)和简·范登·巴斯彻(Jan Van den Bussche)。2002.基于属性语法的结构化文档查询语言的表达性。美国临床医学杂志49,1,56–100·Zbl 1323.68253号 ·doi:10.1145/505241.505245
[42] 莫里斯·尼瓦特。1968.乔姆斯基语言转载。《傅里叶年鉴》18,339–455·Zbl 0313.68065号 ·doi:10.5802/aif.287
[43] Frederick Reiss、Sriram Raghavan、Rajasekar Krishnamurthy、Huaiyu Zhu和Shivakumar Vaithyanathan。2008.基于规则的信息提取的代数方法。ICDE会议记录。IEEE,933–942·doi:10.1109/ICDE.2008.4497502
[44] 埃伦·里洛夫。1993年。为信息提取任务自动构建词典。AAAI会议记录。AAAI出版社/麻省理工学院出版社,811-816。
[45] 斯蒂芬·索德兰(Stephen Soderland)、大卫·费希尔(David Fisher)、乔纳森·阿塞尔廷(Jonathan Aseltine)和温迪·莱纳特(Wendy G.Lehnert)。1995.晶体:产生概念词典。IJCAI会议记录。摩根·考夫曼(Morgan Kaufmann),1314-1321年。
[46] 斯拉威克·斯塔奥维(Slawek Staworke)、扬·乔米奇(Jan Chomicki)和杰里·马尔金科夫斯基(Jerzy Marcinkowski)。2012.在关系数据库中优先修复和一致的查询回答。安。数学。Artif公司。智力。64, 2–3, 209–246. ·Zbl 1250.68099号 ·doi:10.1007/s10472-012-9288-8
[47] 盛宇。1997年,常规语言。在《形式语言手册》中,Grzegorz Rozenberg和Arto Salomaa(编辑),第1卷,Springer,第2章·doi:10.1007/978-3-642-59136-52
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。