跳到主要内容
10.1145/3078081.3078099交流会议文章/章节视图摘要出版物页面日期会议记录会议集合
研究论文

利用语义和地理特征消除历史文献中的地名歧义

出版:2017年6月1日 出版历史
  • 获取引文提醒
  • 摘要

    历史学家通常对数字化馆藏中提到的地点感兴趣。然而,地名是高度模糊的,可能会随着时间的推移而改变,这使得自动将历史文本中提到的地名与现实世界中的地名联系起来变得尤为困难。地名消歧是自然语言处理中的一个具有挑战性的问题,已在两个不同但相关的任务中进行了研究:地名解析和实体链接。在本文中,我们提出了一种弱监督方法,该方法通过利用地理和语义特征结合了这两种方法的优点。我们根据历史地名解析基准测试了我们的方法,并改进了最新技术。我们还创建了五个数据集,测试了两种最先进的现成实体链接方法的性能,并在仅考虑位置时改进了它们的性能。

    工具书类

    [1]
    Razvan Bunescu和Marius Pasca。2006.使用百科全书知识消除命名实体歧义。在EACL中。9--16.
    [2]
    戴维德·布斯卡迪。2011.消除地名歧义的方法。SIGSPATIAL Special特刊3,2(2011),16-19。
    [3]
    大卫·巴斯卡迪和贝尔纳多·马尼尼。2010年,意大利当地新闻语料库中的基础地名。地理信息检索研讨会。1--5.
    [4]
    程志远(Zhiyuan Cheng)、詹姆斯·卡弗利(James Caverley)和李京敏(Kyumin Lee)。2010.你在哪里发推特:一种基于内容的推特用户地理定位方法。在CIKM中。759--768.
    [5]
    西尔维乌·库塞赞。2007.基于维基百科数据的大型命名实体消歧。在EMNLP中--CoNLL。708--716.
    [6]
    Joachim Daiber、Max Jakob、Chris Hokamp和Pablo N.Mendes。2013.提高多语言实体提取的效率和准确性。在I-Semantics中。
    [7]
    Grant DeLozier、Jason Baldridge和Loretta London。2015.使用地理单词配置文件的独立地名解析。在AAAI。2382--2388.
    [8]
    Grant DeLozier、Ben Wing、Jason Baldridge和Scott Nesbit,2016年。从历史文本创建一个新的地理位置语料库。在语言注释研讨会上。188--198.
    [9]
    雅各布·艾森斯坦(Jacob Eisenstein)、布伦丹·奥菲康纳(Brendan OfiConnor)、诺亚·A·史密斯(Noah A.Smith)和埃里克·P·星(Eric P.Xing)。2010年。地理词汇变异的潜在变量模型。在EMNLP中。1277--1287.
    [10]
    詹妮·罗斯·芬克尔(Jenny Rose Finkel)、特隆·格雷纳格(Trond Grenager)和克里斯托弗·曼宁(Christopher Manning)。2005年,通过吉布斯抽样将非局部信息纳入信息提取系统。在ACL中。363--370.
    [11]
    韩宪培、孙乐和赵军。2011.网络文本中的集体实体链接:一种基于图的方法。在SIGIR中。765--774.
    [12]
    萨亚利·库尔卡尼(Sayali Kulkarni)、阿米特·辛格(Amit Singh)、加内什·拉马克里希南(Ganesh Ramakrishnan)和索门·查克拉巴蒂(Soumen Chakrabarti)。2009年,维基百科实体在Web文本中的集体注释。在KDD中。457--466.
    [13]
    Jochen L.Leidner。2008.文本中的地名解析:地名空间基础的注释、评估和应用。博士论文。爱丁堡大学。
    [14]
    Michael D.Lieberman、Hanan Samet和Jagan Sankaranarayanan。2010。使用本地词典进行地理标记,为文本指定的空间数据建立索引。在ICDE中。201--212.
    [15]
    David Milne和Ian H.Witten。2008年。学习与维基百科链接。在CIKM中。509--518.
    [16]
    安德烈亚·莫罗(Andrea Moro)、亚历山德罗·拉加纳托(Alessandro Raganato)和罗伯托·纳维利(Roberto Navigli)。2014.实体链接符合词义消歧:统一方法。TACL 2(2014),231--244。
    [17]
    特德·佩德森(Ted Pedersen)、阿姆鲁塔·普兰达雷(Amruta Purandare)和阿纳加·库尔卡尼(Anagha Kulkarni)。2005年,通过聚类相似上下文进行姓名歧视。在CICLing中。226--237.
    [18]
    埃里克·劳赫(Erik Rauch)、迈克尔·布卡廷(Michael Bukatin)和肯尼斯·贝克(Kenneth Baker)。2003.消除地理术语歧义的基于信任的框架。在HLT-NAACL地理参考分析研讨会上。50--54.
    [19]
    David A.Smith和Gregory Crane。2001年,在历史数字图书馆中消除地名歧义。数字图书馆研究与先进技术。施普林格-柏林-海德堡,127-136。
    [20]
    迈克尔·斯皮里奥苏和杰森·鲍德里奇。2013.使用间接监督的文本驱动地名解析。在ACL中。1466--1476.

    引用人

    查看全部
    • (2024)贝尔格莱德森林项目中的“空间化”旅行叙事:跨学科合作的扎根方法和反思策略地图与地理图书馆杂志10.1080/15420353.2024.232820819:1-2(22-54)在线发布日期:2024年4月10日
    • (2024)地理编码综述:地名解析的算法和数据集语言资源与评估2007年10月10日/10579-024-09730-2在线发布日期:2024年6月10日
    • (2023)投票机制如何提高地名消歧的健壮性和通用性?国际应用地球观测和地理信息杂志2016年10月10日/j.jag.2023.103191117(103191)在线发布日期:2023年3月
    • 显示更多引用者

    索引术语

    1. 利用语义和地理特征消除历史文献中的地名歧义

        建议

        评论

        信息和贡献者

        问询处

        发布于

        封面图片ACM其他会议
        DATeCH2017:第二届文本文化遗产数字访问国际会议记录
        2017年6月
        179页
        国际标准图书编号:9781450352659
        内政部:10.1145/3078081
        如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

        出版商

        计算机协会

        美国纽约州纽约市

        出版历史

        出版:2017年6月1日

        权限

        请求对此文章的权限。

        检查更新

        作者标记

        1. 数字人文学科
        2. 文本挖掘
        3. 地名消歧

        限定符

        • 研究文章
        • 研究
        • 推荐有限公司

        会议

        日期2017年2月

        接受率

        DATeCH2017提交的37份文件中的29份接受率为78%;
        86份提交文件中的60份总体接受率为70%

        贡献者

        其他指标

        文献计量学和引文

        文献计量学

        文章指标

        • 下载次数(过去12个月)41
        • 下载次数(最近6周)4

        其他指标

        引文

        引用人

        查看全部
        • (2024)贝尔格莱德森林项目中的“空间化”旅行叙事:跨学科合作的扎根方法和反思策略地图与地理图书馆杂志10.1080/15420353.2024.232820819:1-2(22-54)在线发布日期:2024年4月10日
        • (2024)地理编码综述:地名解析的算法和数据集语言资源与评价2007年10月10日/10579-024-09730-2在线发布日期:2024年6月10日
        • (2023)投票机制如何提高地名消歧的稳健性和可推广性?国际应用地球观测和地理信息杂志2016年10月10日/j.jag.2023.103191117(103191)在线发布日期:2023年3月
        • (2023)使用积极的众包景观描述和句子变换器识别与景观相关的自然语言KI-Künstliche Intelligenz公司2007年10月17日/13218-022-00793-337:1(55-67)在线发布日期:2023年1月20日
        • (2023)流行病学文章中的地名识别——一种深度学习方法计算语言学与智能文本处理10.1007/978-3-031-24340-0_3(26-37)在线发布日期:2023年2月26日
        • (2020)历史景观的地理丰富:空间整合、地理描述、空间叙事和深度制图历史地理学、地理信息科学和文本分析10.1007/978-3-030-37569-0_16(259-272)在线发布日期:2020年3月1日
        • (2019)解决过去和现在的问题第十三届地理信息检索研讨会论文集10.1145/3371140.3371143(1-6)在线发布日期:2019年11月28日
        • (2019)利用定性关系网络分析消除历史文献中的地名歧义第三届ACM SIGSPATIAL国际地理空间人文研讨会会议记录10.1145/3356991.3365471(1-4)在线发布日期:2019年11月5日
        • (2019)使用递归神经网络进行文本中的地名解析人工智能进展10.1007/978-3-030-30244-3_63(769-780)在线发布日期:2019年8月30日
        • (2018)收集地名的公民科学方法ISPRS国际地理信息杂志10.3390/ijgi70602227:6(222)在线发布日期:2018年6月16日
        • 显示更多引用者

        视图选项

        获取访问权限

        登录选项

        完全访问权限

        查看选项

        PDF格式

        以PDF文件的形式查看或下载。

        PDF格式

        电子阅读器

        使用联机查看电子阅读器.

        电子阅读器

        媒体

        数字

        其他

        桌子

        分享

        分享

        共享此出版物链接

        在社交媒体上分享