跳到主要内容
10.1145/3421515.3421534交流会议文章/章节视图摘要出版物页面ssp(固态电源)会议记录会议集合
研究论文

一种改进的TB-LSTM-CRF中文命名实体识别方法

出版:2020年12月17日出版历史

摘要

由于缺少自然定界符,中文命名实体识别(NER)比英文更具挑战性。虽然中文分词(CWS)通常被视为中文NER的关键和开放问题,但其准确性对下游模型训练至关重要,并且经常受到本地外(OOV)的影响。本文提出了一种改进的中国NER模型TB-LSTM-CRF,它在LSTM-CRF之上引入了一个变压器块。该模型使用Transformer Block,利用自关注机制从相邻字符和句子上下文中捕获信息。使用小型字符嵌入更实用。与使用LSTM-CRF的基线相比,实验结果表明,我们的方法TB-LSTM-CRF在不需要任何外部资源(例如其他字典)的情况下具有竞争力。

工具书类

  1. Chiu,J.P.和Nichols,E.(2016)。使用双向LSTM-CNN进行命名实体识别。计算语言学协会学报,4357-370。谷歌学者谷歌学者交叉引用交叉引用
  2. Liu,L.,Shang,J.,Ren,X.,Xu,F.F.,Gui,H.,Peng,J.和Han,J.(2018年4月)。使用任务软件神经语言模型实现序列标记。在第三十二届AAAI人工智能会议上。谷歌学者谷歌学者
  3. Huang,S.、Sun,X.和Wang,H.(2017年11月)。使用全局递归结构解决中文分词的领域自适应问题。第八届国际自然语言处理联合会议记录(第1卷:长篇论文)(第184-193页)。谷歌学者谷歌学者
  4. Chen,X.,Shi,Z.,Qiu,X.和Huang,X..(2017)。汉语分词的对抗性多准则学习。arXiv预打印arXiv:1704.07556。谷歌学者谷歌学者
  5. Liu,Z.、Zhu,C.和Zhao,T.(2010年8月)。基于序列标记方法的中文命名实体识别:基于字符还是基于单词?。在国际智能计算会议上(第634-640页)。施普林格,柏林,海德堡。谷歌学者谷歌学者
  6. Li,H.、Hagiwara,M.、Li,Q.和Ji,H..(2014年5月)。汉语和日语分词对姓名标注影响的比较。LREC(第2532-2536页)。谷歌学者谷歌学者
  7. Vaswani,A.、Shazeer,N.、Parmar,N.,Uszkoreit,J.、Jones,L.、Gomez,A.N.…&Polosukhin,I.(2017)。注意力是你所需要的。《神经信息处理系统进展》(第5998-6008页)。谷歌学者谷歌学者
  8. Ratinov,L.和Roth,D.(2009年6月)。命名实体识别中的设计挑战和误解。《第十三届计算自然语言学习会议论文集》(CoNLL-2009)(第147-155页)。谷歌学者谷歌学者交叉引用交叉引用
  9. Weischedel,R.、Pradhan,S.、Ramshaw,L.、Palmer,M.、Xue,N.、Marcus,M.…&A.休斯顿(2011)。OntoNotes 4.0版。LDC2011T03,宾夕法尼亚州费城:语言数据联盟。谷歌学者谷歌学者
  10. Peng,N.和Dredze,M.(2015年9月)。中国社交媒体命名实体识别与联合训练嵌入。《2015年自然语言处理实证方法会议论文集》(第548-554页)。谷歌学者谷歌学者交叉引用交叉引用
  11. Zhang,Y.,&Yang,J.(2018)。中国人使用格子lstm。arXiv预打印arXiv:1805.02023。谷歌学者谷歌学者
  12. Yang,J.、Teng,Z.、Zhang,M.和Zhang、Y.(2016年4月)。结合离散和神经特征进行序列标记。在智能文本处理和计算语言学国际会议上(第140-154页)。商会施普林格。谷歌学者谷歌学者
  13. Zhu,Y.,&Wang,G.(2019年6月)。CAN-NER:用于中文命名实体识别的卷积注意网络。计算语言学协会北美分会2019年会议记录:人类语言技术,第1卷(长篇和短篇论文)(第3384-3393页)。谷歌学者谷歌学者
  14. Peng,N.和Dredze,M.(2016)。利用分词表示学习改进中文社交媒体命名实体识别。arXiv预打印arXiv:1603.00786。谷歌学者谷歌学者

建议

评论

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

登录

完全访问权限

  • 发布于

    封面图片ACM其他会议
    SSPS’20:2020年第二届信号处理系统研讨会会议记录
    2020年7月
    125页
    国际标准图书编号:9781450388627
    内政部:10.1145/3421515

    版权所有©2020 ACM

    如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    • 出版:2020年12月17日

    权限

    请求有关此文章的权限。

    请求权限

    检查更新

    限定符

    • 研究论文
    • 研究
    • 推荐有限公司

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

HTML格式

以HTML格式查看本文。

查看HTML格式