跳到主要内容
10.1145/3397536.3422236acm会议文章/章节视图摘要出版物页面地理信息系统会议记录会议集合
海报

基于地名匹配的地理候选人深度学习方法

出版:2020年11月13日 出版历史
  • 获取引文提醒
  • 摘要

    为了提供对文本数据的高级语义访问,需要识别地名并将其解析为现实世界中的引用。地名的高度变异往往阻碍了这一进程。候选词选择的任务是确定可由先前公认的地名引用的潜在实体。虽然传统上很少受到关注,但候选选择对下游任务(即实体分辨率)有重大影响,尤其是在噪声或非标准文本中。本文介绍了一种利用最先进的神经网络体系结构,通过地名匹配进行候选人选择的深度学习方法。我们基于多个数据集进行了固有地名匹配评估,这些数据集涵盖了各种具有挑战性的场景(跨语言和区域差异,以及OCR错误),并评估了其在英语和西班牙语地理候选人选择中的表现。

    工具书类

    [1]
    萨阿德·阿洛蒂比和马克·桑德森。2014.分析地理查询改写:一项探索性研究。《信息科学与技术协会杂志》(2014)。
    [2]
    詹姆斯·巴特勒、克里斯托弗·唐纳森、乔安娜·泰勒和伊恩·格雷戈里。2017.Alts、Abbreviations和AKAs:历史命名变异和自动命名实体识别。《地图与地理图书馆杂志》(2017)。
    [3]
    程志远(Zhiyuan Cheng)、詹姆斯·卡弗利(James Caverley)和李京敏(Kyumin Lee)。2010.你在哪里发推特:一种基于内容的推特用户地理定位方法。程序中。CIKM的。
    [4]
    玛丽奥娜·科尔·阿尔达努伊(Mariona Coll Ardanuy)、卡莎拉·侯赛尼(Kasra Hosseini)、凯瑟琳·麦克多诺(Katherine McDonough)、艾米丽·克劳斯(Amrey Krause)、丹尼尔·范·斯特里恩(Daniel van Strien)和费德里科·南尼(Federico Nanni)。2020年。DeezyMatch:通过地名匹配选择地理候选人的深度学习方法。在arXiv:2009.08114中。
    [5]
    Grant DeLozier、Jason Baldridge和Loretta London。2015.使用地理词配置文件的地名册独立地名解析。在AAAI。
    [6]
    甘庆庆(Qingqing Gan)、乔什·阿滕贝格(Josh Attenberg)、亚历山大·马克维茨(Alexander Markowetz)和托尔斯滕·苏尔(Torsten Suel)。2008.搜索引擎日志中的地理查询分析。程序中。LOCWEB的。
    [7]
    伊恩·格雷戈里(Ian Gregory)、克里斯托弗·唐纳森(Christopher Donaldson)、帕特里夏·穆里埃塔·弗洛雷斯(Patricia Murrieta-Flores)和保罗·雷森(Paul Rayson)。2015年,《地理测绘、地理信息系统和文本分析:空间人文研究的当前发展》。(2015).
    [8]
    Ben Hachey、Will Radford、Joel Nothman、Matthew Honnibal和James R Curran。2013.评估实体与维基百科的链接。人工智能(2013)。
    [9]
    Kasra Hosseini、Federico Nanni和Mariona Coll Ardanuy。2020年。DeezyMatch:模糊字符串匹配的灵活深度学习方法。在EMNLP中:系统演示(已接受)。
    [10]
    杰夫·约翰逊(Jeff Johnson)、马蒂杰斯·杜泽(Matthijs Douze)和埃尔夫·杰古(Herve Jegou)。2019.使用GPU进行数十亿规模的相似性搜索。IEEE大数据汇刊(2019年)。
    [11]
    Phong Le和Ivan Titov。2019.与自动噪声检测相连接的实体远程学习。程序中。ACL的。
    [12]
    安东尼·莫拉纳(Anthony Morana)、托马斯·莫雷尔(Thomas Morel)、比拉尔·贝加维(Bilal Berjawi)和法比安·杜恰图(Fabien Duchateau)。2014.Geobench:用于构建空间实体匹配基准的地理空间集成工具。SIGSPATIAL的。
    [13]
    罗斯·S·珀夫斯(Ross S.Purves)、保罗·克劳夫(Paul Clough)、克里斯托弗·琼斯(Christopher B.Jones)、马克·霍尔(Mark H.Hall)和凡妮莎·默多克(Vanessa Murdock)。【未注明日期】。地理信息检索:文本空间搜索的进展和挑战。第十二章,第二章,第164-318节。https://doi.org/10.1561/1500000034
    [14]
    Gianluca Quercini、Hanan Samet、Jagan Sankaranarayanan和Michael D Lieberman。2010年,使用当地词汇确定新闻来源的空间读者范围。程序中。SIGSPATIAL的。
    [15]
    加布里埃尔·里奇亚(Gabriel Recchia)和马克斯·卢维斯(Max M Louwerse)。2013年,地名匹配字符串相似性度量的比较。在COMP@SIGSPATIAL。54--61.
    [16]
    斯蒂芬·罗勒(Stephen Roller)、迈克尔·斯佩里奥苏(Michael Speriosu)、萨拉特·拉尔帕利(Sarat Rallapalli)、本杰明·温格(Benjamin Wing)和杰森·鲍德里奇(Jason Baldridge)。2012.在自适应网格上使用语言模型监督基于文本的地理定位。EMNLP的。
    [17]
    鲁伊·桑托斯(Rui Santos)、帕特里夏·穆里埃塔·弗洛雷斯(Patricia Murrieta-Flores)、帕维尔·卡拉多(Pável Calado)和布鲁诺·马丁斯(Bruno Martins)。2018年,通过深度神经网络进行地名匹配。《国际地理信息科学杂志》(2018)。
    [18]
    鲁伊·桑托斯(Rui Santos)、帕特里夏·穆里埃塔·弗洛雷斯(Patricia Murrieta-Flores)和布鲁诺·马丁斯(Bruno Martins)。2018.学习组合多个字符串相似性度量,以实现有效的地名匹配。国际数字地球杂志(2018)。
    [19]
    迈克尔·斯皮里奥苏(Michael Speriosu)和杰森·鲍德里奇(Jason Baldridge)。2013.使用间接监督的文本驱动地名解析。程序中。ACL的。1466--1476.
    [20]
    Derek Tam、Nicholas Monath、Ari Kobren、Aaron Traylor、Rajarshi Das和Andrew McCallum。2019.字符串相似性学习字符表示的基于传输的最佳对齐。arXiv预印本arXiv:1907.10165(2019)。

    引用人

    查看全部

    建议

    评论

    信息和贡献者

    问询处

    发布于

    封面图片ACM会议
    SIGSPATIAL’20:第28届地理信息系统进展国际会议记录
    2020年11月
    687页
    国际标准图书编号:9781450380195
    内政部:10.1145/3397536
    如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的部分或全部数字或硬拷贝以供个人或课堂使用。必须尊重本作品第三方组件的版权。对于所有其他用途,请联系所有者/作者。

    赞助商

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    出版:2020年11月13日

    检查更新

    作者标记

    1. 候选人选择
    2. 深度学习
    3. 模糊字符串匹配
    4. 地名匹配

    限定符

    • 海报
    • 研究
    • 参考有限公司

    会议

    SIGSPATIAL’20
    主办单位:
    SIGSPATIAL’20:第28届地理信息系统进步国际会议
    2020年11月3日至6日
    华盛顿州,美国西雅图

    接受率

    1116份提交文件的总体接受率为220,20%

    贡献者

    其他指标

    文献计量学和引文

    文献计量学

    文章指标

    • 下载次数(过去12个月)18
    • 下载次数(最近6周)

    其他指标

    引文

    引用人

    查看全部
    • (2024)拓扑系统中二元对立的民族主义分析塞莫提卡2023-0054年12月10日在线发布日期:2024年4月30日
    • (2024)地理编码综述:地名解析的算法和数据集语言资源与评价2007年10月10日/10579-024-09730-2在线发布日期:2024年6月10日
    • (2024)中国历史报纸地理时空信息的提取与可视化智慧、健康、Win-Win10.1007/978-3-031-57850-2_2(12-19)在线发布日期:2024年4月10日
    • (2023)计算制图识别:使用机器学习从图像中识别地图、地理区域和投影美国地理学家协会年鉴10.1080/24694452.2023.2166010113:5(1243-1267)在线发布日期:2023年3月2日
    • (2022)地图阅读器第六届ACM SIGSPATIAL国际地理空间人文研讨会会议记录10.1145/3557919.3565812(8-19)在线发布日期:2022年11月1日

    视图选项

    获取访问权限

    登录选项

    完全访问权限

    查看选项

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用联机查看电子阅读器.

    电子阅读器

    媒体

    数字

    其他

    桌子

    分享

    分享

    共享此出版物链接

    在社交媒体上分享