罗纳德·费金;本尼·基梅尔菲尔德;弗雷德里克·赖斯;斯迪恩·范萨梅伦 文档扳手:信息提取的正式方法。 (英语) Zbl 1333.68098号 美国临床医学杂志 62,第2号,第12条,51页(2015年). 引用于5评论引用于14文件 MSC公司: 68第20页 信息存储和数据检索 68第05页 数据结构 65年第68季度 形式语言和自动机 关键词:信息提取;文件扳手;有限状态自动机;正则表达式 软件:图形日志 PDF格式BibTeX公司 XML格式引用 \textit{R.Fagin}et al.,J.ACM 62,No.2,Article No.12,51 p.(2015;Zbl 1333.68098) 全文: 内政部 参考文献: [1] 阿尔弗雷德·阿霍。1990.字符串模式查找算法。《理论计算机科学手册》A卷:算法与复杂性(A)。北荷兰,255-300·Zbl 0900.68249号 [2] 詹姆斯·艾伦。1983.保持对时间间隔的了解。Commun公司。ACM第26、11、832–843页·兹比尔0519.68079 ·数字对象标识代码:10.1145/182.358434 [3] 道格拉斯·E·阿佩尔特(Douglas E.Appelt)和博扬·奥尼什凯维奇(Boyan Onyshkevych)。1998。通用模式规范语言。《TIPSTER文本程序会议录:第三阶段:计算语言学协会》,23-30。 [4] 马塞洛·阿雷纳斯(Marcelo Arenas)、利奥波多·贝尔托西(Leopoldo E.Bertossi)和扬·乔米奇(Jan Chomicki)。1999.不一致数据库中的一致查询答案。PODS会议记录。ACM,68–79·Zbl 1079.68026号 ·数字对象标识代码:10.1145/303976.303983 [5] 巴勃罗·巴克尔(Pablo Barcel);,Diego Figueira和Leonid Libkin,2012a。具有有理关系的图逻辑和广义交集问题。在LICS的诉讼中。IEEE,115–124·Zbl 1362.68063号 [6] 巴勃罗·巴塞尔ó;,利奥尼德·利金(Leonid Libkin)、安东尼·威贾贾·林(Anthony Widjaja Lin)和彼得·伍德(Peter T.Wood)。2012年b。图形结构数据上的路径查询的表达式语言。ACM事务处理。数据库。系统。37, 4, 31. 内政部:http://dx.doi.org/10.1145/2389241.2389250 ·数字对象标识代码:10.1145/2389241.2389250 [7] 巴勃罗·巴塞尔ó;,Juan L.Reutter和Leonid Libkin,2013年。参数化正则表达式及其语言。理论。计算。科学。474, 21–45. ·Zbl 1259.68104号 [8] 迈克尔·贝内迪克特(Michael Benedikt)、列奥尼德·利布金(Leonid Libkin)、托马斯·施温蒂克(Thomas Schwentick)和吕克·塞古芬(Luc Segoufin)。2003.字符串上的可定义关系和一阶查询语言。美国临床医学杂志50、5、694–751·Zbl 1325.03031号 ·doi:10.1145/876638.876642 [9] 让·伯斯特尔。1979年,转喻和上下文无关语言。Teubner Studienbü;斯图加特谢尔。 ·doi:10.1007/978-3-663-09367-1 [10] 安东尼·邦纳(Anthony J.Bonner)和吉安萨瓦托雷·麦加(Giansalvatore Mecca)。1998年。序列、数据日志和传感器。J.计算。系统。科学。57, 3, 234–259. ·Zbl 0917.68053号 ·doi:10.1006/jcss.1998.1562 [11] 迭戈·卡尔瓦内斯(Diego Calvanee)、朱塞佩·德贾科莫(Giuseppe De Giacomo)、毛里齐奥·伦泽里尼(Maurizio Lenzerini)和莫舍·瓦尔迪(Moshe Y.Vardi)。2000年a。包含带反转的连接正则路径查询。KR 2000会议记录。176–185. ·Zbl 1015.68083号 [12] 迭戈·卡尔瓦内斯(Diego Calvanee)、朱塞佩·德贾科莫(Giuseppe De Giacomo)、毛里齐奥·伦泽里尼(Maurizio Lenzerini)和莫舍·瓦尔迪(Moshe Y.Vardi)。2000年b。基于视图的查询处理和约束满足。在LICS的诉讼中。361–371. ·Zbl 1108.68443号 ·doi:10.1109/LICS.2000.855784 [13] Cezar公司;mpeanu、Kai Salomaa和Sheng Yu。2003.实用正则表达式的正式研究。发现的国际期刊。计算。科学。14, 6, 1007–1018. ·Zbl 1101.68443号 [14] 塞萨尔Câ;mpeanu和Nicolae Santean。2009年,关于正则语言与正则语言的交集。理论。计算。科学。第410页,第24–25页,第2336–2344页·Zbl 1167.68031号 [15] 本杰明·卡尔和巴利亚特·纳伦德兰。2009.关于扩展正则表达式。LATA 2009年会议记录。计算机科学讲义,第5457卷。279–289. ·Zbl 1234.68202号 [16] Laura Chiticariu、Rajasekar Krishnamurthy、Yunyao Li、Sriram Raghavan、Frederick Reiss和Shivakumar Vaithyanathan。2010年,SystemT:声明性信息提取的代数方法。计算机语言学协会(ACL’10)第48届年会/会议记录。128–137. [17] 玛丽亚诺·康森斯(Mariano P.Consens)和阿尔贝托·门德尔松(Alberto O.Mendelzon)。1990年。GraphLog:真实生活递归的可视化形式主义。PODS会议记录。美国医学会,404–416·doi:10.1145/298514.298591 [18] Isabel F.Cruz、Alberto O.Mendelzon和Peter T.Wood。支持递归的图形查询语言。SIGMOD会议记录。美国医学会,323–330·doi:10.1145/38713.38749 [19] 哈米什·坎宁安。2002。GATE,文本工程的通用架构。计算。人类。36, 2, 223–254. ·doi:10.1023/A:1014348124664 [20] Alin Deutsch和Val Tannen。2001.连接规则路径查询类的优化属性。DBPL诉讼中。21–39. ·Zbl 1098.68563号 [21] 卡尔文·埃尔戈特(Calvin C.Elgot)和J.E.梅泽伊(J.E.Mezei)。关于广义有限自动机定义的关系。IBM研究开发杂志。9, 47–68. ·Zbl 0135.00704号 ·数字对象标识代码:10.1147/rd.91.0047 [22] 罗纳德·费金(Ronald Fagin)、本尼·基梅尔菲尔德(Benny Kimelfeld)、弗雷德里克·赖斯(Frederick Reiss)和斯蒂恩·范萨梅伦(Stijn Vansummeren)。2013.扳手:信息提取的正式框架。PODS会议记录。37–48之间·Zbl 1333.68098号 ·doi:10.1145/2463664.2463665 [23] 罗纳德·费金(Ronald Fagin)、本尼·基梅尔菲尔德(Benny Kimelfeld)、弗雷德里克·赖斯(Frederick Reiss)和斯蒂恩·范萨梅伦(Stijn Vansummeren)。2014.通过优先修复清除信息提取中的不一致。第33届ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会会议记录(PODS’14)。美国医学会,164-175·Zbl 1333.68098号 ·doi:10.1145/2594538.2594540 [24] Daniela Florescu、Alon Y.Levy和Dan Suciu。1998.使用正则表达式的连接查询的查询包含。PODS会议记录。139–148. ·doi:10.1145/275487.275503 [25] 达恩·弗雷塔格。1998.面向信息提取的通用学习。COLING-ACL会议记录。404–408. [26] 多米尼克·D·弗雷登伯格。2011.扩展正则表达式:简洁性和可判定性。在STACS(LIPIcs)会议记录中。第9卷,达格斯图尔宫-莱布尼茨-泽特鲁姆富尔信息馆,507–518·Zbl 1230.68129号 [27] 杰弗里·弗里德尔。2006.掌握正则表达式。奥莱利传媒。 [28] 西摩·金斯伯格和肖恩·王晓阳。1998.常规序列操作及其在数据库查询中的使用。J.计算。系统。科学。56, 1, 1–26. ·Zbl 0916.68035号 ·doi:10.1006/jcss.1997.1514 [29] Gö;sta Grahne,Matti Nykä;nen和Esko Ukkonen。1999.数据库中字符串的推理。J.计算。系统。科学。59, 1, 116–162. [30] 拉尔夫·格里什曼(Ralph Grishman)和贝斯·桑德海姆(Beth Sundheim)。1996年,信息理解会议-6:简史。在COLING诉讼程序中。466–471. [31] Orna Grumberg、Orna Kupferman和Sarai Sheinvald。2010.无限字母上的可变自动机。LATA会议记录。561–572. ·Zbl 1284.68352号 ·doi:10.1007/978-3-642-13089-2_47 [32] 唐纳德·科努特(Donald E.Knuth)。1968.无上下文语言的语义。数学。系统。理论2,2,127–145·Zbl 0169.01401号 ·doi:10.1007/BF01692511 [33] 唐纳德·科努特(Donald E.Knuth)。1971.更正:无语境语言的语义。数学。系统。理论5,1,95-96·Zbl 0219.68035号 ·doi:10.1007/BF01702865 [34] 拉贾塞卡·克里希纳穆尔西(Rajasekar Krishnamurthy)、李云耀(Yunyao Li)、斯里拉姆·拉加万(Sriram Raghavan)、弗雷德里克·赖斯(Frederick Reiss)、西瓦库马尔·瓦西亚纳坦(Shivakumar Vaithyanathan)。SystemT:声明性信息提取系统。SIGMOD记录37、4、7–13。 [35] John D.Lafferty、Andrew McCallum和Fernando C.N.Pereira。2001.条件随机场:分割和标记序列数据的概率模型。ICML会议记录。摩根·考夫曼,282-289。 [36] T.R.韭菜。1997年。使用隐马尔可夫模型进行信息提取。加州大学圣地亚哥分校硕士论文。 [37] 彼得·林茨。2001年,《形式语言与自动机导论》,第三版,Jones and Bartlett Publishers,Inc.,萨德伯里,马萨诸塞州·Zbl 1230.68010号 [38] B.Liu、L.Chiticariu、V.Chu、H.V.Jagadish和F.R.Reiss。2010.信息提取的自动规则优化。程序。荷兰VLDB。3、1–2、588–597·数字对象标识代码:10.14778/1920841.1920916 [39] Andrew McCallum、Dayne Freitag和Fernando C.N.Pereira。信息提取和分割的最大熵马尔可夫模型。ICML会议记录。摩根·考夫曼,591-598。 [40] Frank Neven和Thomas Schwentick。2002.有限树上的查询自动机。理论。计算。科学。275, 2, 633–674. ·Zbl 1026.68081号 ·doi:10.1016/S0304-3975(01)00301-2 [41] 弗兰克·内文(Frank Neven)和简·范登·巴斯彻(Jan Van den Bussche)。2002.基于属性语法的结构化文档查询语言的表达性。美国临床医学杂志49,1,56–100·Zbl 1323.68253号 ·doi:10.1145/505241.505245 [42] 莫里斯·尼瓦特。1968.乔姆斯基语言转载。《傅里叶年鉴》18,339–455·Zbl 0313.68065号 ·doi:10.5802/aif.287 [43] Frederick Reiss、Sriram Raghavan、Rajasekar Krishnamurthy、Huaiyu Zhu和Shivakumar Vaithyanathan。2008.基于规则的信息提取的代数方法。ICDE会议记录。IEEE,933–942·doi:10.1109/ICDE.2008.4497502 [44] 埃伦·里洛夫。1993年。为信息提取任务自动构建词典。AAAI会议记录。AAAI出版社/麻省理工学院出版社,811-816。 [45] 斯蒂芬·索德兰(Stephen Soderland)、大卫·费希尔(David Fisher)、乔纳森·阿塞尔廷(Jonathan Aseltine)和温迪·莱纳特(Wendy G.Lehnert)。1995.晶体:产生概念词典。IJCAI会议记录。摩根·考夫曼(Morgan Kaufmann),1314-1321年。 [46] 斯拉威克·斯塔奥维(Slawek Staworke)、扬·乔米奇(Jan Chomicki)和杰里·马尔金科夫斯基(Jerzy Marcinkowski)。2012.在关系数据库中优先修复和一致的查询回答。安。数学。Artif公司。智力。64, 2–3, 209–246. ·Zbl 1250.68099号 ·doi:10.1007/s10472-012-9288-8 [47] 盛宇。1997年,常规语言。在《形式语言手册》中,Grzegorz Rozenberg和Arto Salomaa(编辑),第1卷,Springer,第2章·doi:10.1007/978-3-642-59136-52 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。