×

兹马思-数学第一资源

缩略语:识别、扩展和消歧。(英语) Zbl 1444.68265
摘要:缩略词(由短语的首字母组成的单词)对于各种自然语言处理应用程序非常重要,包括信息检索和机器翻译。虽然存在手工编制的缩略词词典,但它们是有限的,需要经常更新。我们提出了一种新的基于机器学习的方法,从未标注的文本中自动生成缩略语词典。这是第一种专门处理非本地首字母缩略词的技术,也就是说,即使扩展与首字母缩略词不在同一文档中,也可以确定首字母缩略词的扩展。我们的方法使用上下文信息自动增强字典,以帮助解决首字母缩略词消歧任务(为上下文中给定的首字母缩略词选择最合适的扩展),性能优于使用先前技术构建的词典。我们将这一方法应用于现代希伯来语,这是一种有着悠久使用缩略词传统的语言,在这种语言中,生产性的词法和独特的正字法增加了问题的复杂性。
理学硕士:
68T50型 自然语言处理
91层20 语言学
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Ashkenazi,S.,Yarden,D.:缩略语库。耶路撒冷基里亚特塞弗。希伯来语(1994)
[2] Blei,DM,概率主题模型,社区。ACM,55,4,77-84(2012年)
[3] Blei,DM;Ng,AY;乔丹,密苏里州,潜在迪里克莱特分配,J.马赫。学习。第3993-1022号决议(2003年)·Zbl 1112.68379
[4] Chang,抄送;Lin,CJ,LIBSVM:支持向量机库,ACM Trans。因特尔。系统。技术,2,27:1-27:27(2011)
[5] Dannélls,D.,《首字母缩略词识别:识别瑞典语篇中的首字母缩略词》(2006),哥德堡:哥德堡大学语言学系硕士论文
[6] Dannélls,D.:首字母缩略词自动识别。欧洲计算语言学协会第11届会议论文集。意大利特伦托,第167-170页(2006年)
[7] Dannélls,D.:使用特征组合的首字母缩略词分类(2007)
[8] HaCohen Kerner,Y.,Kass,A.,Peretz,A.:犹太法律文件中缩略语自动消歧的基线方法。在:Vicedo,J.L.,Martínez Barco,P.,Munoz,R.,Noeda,M.S.(编辑),《第四届自然语言进步国际会议论文集》,《人工智能课堂讲稿》,第3230卷,第58-69页。斯普林格,柏林(2004)
[9] HaCohen Kerner,Y.,Kass,A.,Peretz,A.:缩略语消歧:用每个语篇假设的一种意义的各种变体进行实验。在:Kapetanios,E.,Sugumaran,V.,Spiliopoulou,M.(编辑),《计算机科学,自然语言和信息系统讲座笔记》,第5039卷。斯普林格,第27-39页。10.1007/978-3-540-69858-6 U 5(2008年)
[10] HaCohen Kerner,Y.,Kass,A.,Peretz,A.:缩略语的组合单义消歧。在:人类语言技术计算语言学协会第46届年会论文集:短论文,HLT short'08。计算语言学协会,美国宾夕法尼亚州斯特劳德斯堡,第61-64页。http://dl.acm.org/citation.cfm?id=1557690.1557707(2008年)
[11] HaCohen Kerner,Y。;卡斯,A。;Peretz,A.,HAADS:希伯来亚拉姆语缩写消歧系统,J.Am。Soc。信息科学。技术,61,9,1923-1932(2010)
[12] HaCohen Kerner,Y。;卡斯,A。;Peretz,A.,《初始值消除歧义:人与机器》,J.Am。Soc。信息科学。技术,64,10,2133-2148(2013年)
[13] 霍尔,M。;弗兰克,E。;福尔摩斯,G。;普法林格,B。;鲁特曼,P。;Witten,IH,《WEKA数据挖掘软件:更新》,SIGKDD Explorations,11,1,10-18(2009)
[14] 以色列国防军:缩略语和缩略语词典。希伯来语(2010)
[15] 伊泰,A。;温特纳,S.,希伯来语语言资源,语言资源。评估,42,1,75-98(2008)
[16] Jain,A.,Cucerzan,S.,Azzam,S.:网络上的缩略词扩展识别和排名。信息重用与集成(IRI 2007)。IEEE,第209-214页(2007年)
[17] Ji,X.,Xu,G.,Bailey,J.,Li,H.:挖掘、排名和使用首字母缩略词模式。在:第十届亚太地区WWW研究与开发进展网络会议论文集,APWeb'08,第371-382页。斯普林格,柏林(2008)。http://dl.acm.org/citation.cfm?id=1791734.1791779
[18] Li,C.,Ji,L.,Yan,J.:基于单词嵌入的首字母缩略词消歧。第29届人工智能大会论文集,第4178-4179页。https://www.aaai.org/ocs/index.php/aaai/AAAI15/paper/view/9404(2015年)
[19] 《二十世纪英语:历史变迁与标准化》。《英语语言研究》(2009),剑桥:剑桥大学出版社,剑桥
[20] Marwick,L.,圣经和犹太教缩略语(1979),布鲁克林:KTAV出版社,布鲁克林
[21] 麦卡伦,A.:MALLET:一个用于语言工具包的机器学习。http://mallet.cs.umass.edu(2002年)
[22] 《当代希伯来语中缩略语的形态音位特征》,希伯来语语言学,54,53-66(2004)
[23] Nadeau,D.,Turney,P.D.:首字母缩略词识别的监督学习方法。在:第18届加拿大学会人工智能进展会议论文集,AI'05,第319-329页。斯普林格,柏林(2005年)。10.1007/11424918_34·Zbl 1121.68386
[24] 冈崎,北。;阿纳尼亚杜。;Tsujii,J.,《为改进的缩写消歧建立一个高质量的意义目录》,生物信息学,26,9,1246-1253(2010)
[25] Park,Y.,Byrd,R.J.:用于查找缩写及其定义的混合文本挖掘。2001年自然语言处理经验方法会议论文集,第126-133页(2001年)
[26] Platt,J.C.:使用序列最小优化快速训练支持向量机。在:Schölkopf,B.,Burges,C.J.C.,Smola,A.J.(eds.)《核方法的进展-支持向量机学习》。麻省理工学院出版社。http://research.microsoft.com/jplatt/smo.html(1998年)
[27] Quinlan,JR.,C4.5:机器学习程序(1993),圣马特奥:摩根考夫曼出版社,圣马特奥
[28] 拉维德,D.,《现代希伯来语中新构词手段的内部结构限制》,叶利亚语言学,24289-348(1990)
[29] Schwartz,A.S.,Hearst,M.A.:识别生物医学文本中缩写定义的简单算法。在:太平洋生物计算研讨会论文集,第451-462页(2003年)·Zbl 1255.68142
[30] 斯皮格尔,Y.S.:使用不常见的缩写和首字母缩略词。叶树润。希伯来语(2002)
[31] Stevenson,M.,Guo,Y.,Al-Amri,A.,Gaizauskas,R.:生物医学缩略语的消歧。生物自然语言处理的当前趋势研讨会。计算语言学协会,美国宾夕法尼亚州斯特劳德斯堡,第71-79页。http://dl.acm.org/citation.cfm?id=1572364.1572374(2009年)
[32] Tadmor,U.,以色列希伯来语的首字母缩略词,Leshoneinu La'Am,39225-257(1988)
[33] 徐杰。;Huang,Y.,使用支持向量机从文本中提取首字母缩略词,软计算-基础、方法和应用的融合,11369-373(2006)
[34] Yi,J.,Sundaresan,N.:利用模式和关系的二重性挖掘网络中的缩略语。在:第二届网络信息和数据管理国际研讨会论文集,1999年,第48-52页。ACM,纽约(1999年)。10.1145/319759.319782
[35] Zahariev,M.:用于自动获取首字母缩略词的高效扩展匹配。信息与知识工程国际会议记录,第32-37页(2003年)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。