×

句子语义表示模型的开发与分析。 (英语。乌克兰原文) Zbl 07514990号

赛博。系统。分析。 58,编号1,16-23(2022); 翻译自Kibern。修女。分析。58,第1期,第21-30页(2022年)。
摘要:在复述识别问题的背景下,作者概述了一个高效且简单的句子语义表示模型。选择依存树作为主要结构来表示句子中单词之间的连接。为了表示单词语义,使用了预先训练的单词表示模型。基于这两个关键部分,设计了几个有助于准确识别复述的特征。所进行的实验证明了该模型的有效性。模型应用结果与最先进的模型非常接近。

MSC公司:

68泰克 人工智能
68页 数据理论
68卢比 离散数学与计算机科学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] T.Mikolov、K.Chen、G.Corrado和J.Dean,“向量空间中单词表示的有效估计”,arXiv:1301.3781v3[cs.CL]2013年9月7日。网址:https://arxiv.org/pdf/1301.3781.pdf。
[2] R.Kiros、Y.Zhu、R.Salakhutdinov、R.S.Zemel、A.Torralba、R.Urtasun和S.Fidler,“跳跃思维向量”,收录于:C.Cortes、N.D.Lawrence、D.D.Lee、M.Sugiyama和R.Garnett(编辑),《神经信息处理系统进展28》(NIPS 2015),神经信息处理体系基金会(2015),第3294-3302页。
[3] B.Dolan、C.Quirk和C.Brockett,“大型释义语料库的无监督构建:利用大规模平行新闻来源”,收录于:COLING’04:Proc。第20名实习生。计算语言学会议(瑞士日内瓦,2004年8月23日至27日),COLING(2004),第350-356页。网址:https://aclantology.org/C04-1051。
[4] Mikolov,T。;Sutskever,I。;Chen,K。;Corrado,GS;迪安·J。;博格斯,CJC;博图,L。;韦林,M。;加赫拉马尼,Z。;温伯格,KQ,单词和短语的分布式表示及其组合,NIPS’13:Proc。第26期实习生。神经信息处理系统会议,3111-3119(2013),公司:Curran Associates,Inc。
[5] K.Papineni、S.Roukos、T.Ward和W.-J.Zhu,“Bleu:机器翻译的自动评估方法”,摘自:ACL'02:Proc。计算语言学协会第40届年会(2002年7月7日至12日,美国宾夕法尼亚州费城),计算语言学协会(2002年),第311-318页。doi:10.3115/1073083.1073135。
[6] 科尔特斯,C。;Vapnik,V.,支持向量网络,马赫。学习。,20, 273-297 (1995) ·Zbl 0831.68098号 ·doi:10.1007/BF00994018
[7] Z.Kozareva和A.Montoyo,“基于监督机器学习技术的短语识别”,载于:T.Salakoski、F.Ginter、S.Pyysalo和T.Pahikkala(编辑),《自然语言处理进展》,FinTAL 2006;计算机科学讲义,第4139卷,施普林格,柏林-海德堡(2006),第524-533页。10.1007/11816508_52.
[8] C.Fellbaum(编辑),WordNet:电子词汇数据库,麻省理工学院出版社(1998年)。10.7551/mit压力/7287.001.0001·Zbl 0913.68054号
[9] R.Mihalcea、C.Corley和C.Strapparava,“基于语料库和基于知识的文本语义相似性度量”,摘自:AAAI'06:Proc。第21届全国人工智能大会(马萨诸塞州波士顿,2006年7月16日至20日),第1卷,AAAI(2006),第775-780页。
[10] T.K.Landauer、P.W.Foltz和D.Laham,“潜在语义分析简介”,《话语过程》,第25卷,第2期。2-3, 259-284 (1998). doi:10.1080/01638539809545028。
[11] A.Finch、Y.S.Hwang和E.Sumita,“使用机器翻译评估技术确定句子级语义对等”,摘自:Proc。第三名实习生。释义研讨会(IWP 2005)(韩国济州岛,2005年10月11-13日),济州岛(2005),第17-24页。网址:https://aclantology.org/I05-5003。
[12] K.Y.Su、M.W.Wu和J.S.Chang,“机器翻译系统的新定量质量度量”,收录于:COLING’92:Proc。第14届计算语言学大会(法国南特,1992年8月23日至28日),第2卷,计算语言学协会(1992年)。第433-439页。10.3115/992133.992137.
[13] S.Nieβen、S.Vogel、H.Ney和C.Tillmann,“基于DP的统计机器翻译搜索算法”,摘自:Proc。第36届计算语言学协会年会和第17届实习生。计算语言学会议(加拿大魁北克省蒙特利尔市,1998年8月10日至14日),第2卷,计算语言学协会(1998年),第960-967页。10.3115/980691.980727.
[14] G.Doddington,“使用n-gram共现统计自动评估机器翻译质量”,摘自:HLT'02:Proc。第二个实习生。人类语言技术研究会议(美国加利福尼亚州圣地亚哥,2002年3月24日至27日),摩根考夫曼出版社,(2002年),第138-145页。
[15] D.Milajevs、D.Kartsaklis、M.Sadrzadeh和M.Purver,“在基于张量的合成环境中评估神经单词表示”,摘自:Proc。2014年自然语言处理经验方法会议(2014年10月25-29日,卡塔尔多哈),计算语言学协会(2014年),第708-719页。10.3115/v1/D14-1079。
[16] S.Wan、M.Dras、R.Dale和C.Paris,“使用基于依赖性的功能将“para-farce”从释义中去掉”,见:Proc。澳大利亚语言技术研讨会(ALTA)(澳大利亚悉尼,2006年11月30日至12月1日),悉尼大学(2006年),第131-138页。
[17] K.Zhang和D.Shasha,“树之间编辑距离的简单快速算法和相关问题”,《计算机SIAM J.》,第18卷,第2期。61245-1262年(1989年)。doi:10.1137/0218082·Zbl 0692.68047号
[18] J.Cheng和D.Kartsaklis,“语义深层组合模型的句法软件多义词嵌入”,摘自:Proc。2015年自然语言处理实证方法会议(葡萄牙里斯本,2015年9月17日至21日),计算语言学协会(2015年),第1531-1542页。10.18653/v1/D15-1177。
[19] Bromley,J。;JW本茨;博图,L。;盖恩,I。;LeCun,Y。;摩尔,C。;Sackinger,E。;Shah,R.,使用“暹罗”时滞神经网络进行签名验证,实习生。模式识别与人工智能杂志,7,4,669-688(1993)·doi:10.1142/S021801493000339
[20] Y.Ji和J.Eisenstein,“分布式句子相似性的歧视性改进”,收录于:EMNLP 2013:Proc。2013年自然语言处理实证方法研讨会(美国华盛顿州西雅图,2013年10月18-21日),计算语言学协会(2013年),第891-896页。
[21] H.W.Kuhn,“分配问题的匈牙利方法”,《海军研究后勤季刊》,第2卷,第2期。1-2, 83-97 (1955). doi:10.1002/nav.3800020109·Zbl 0143.41905号
[22] K.Riesen、M.Neuhaus和H.Bunke,“计算图形编辑距离的二部图匹配”,收录于:F.Escolano和M.Vento(编辑),模式识别中基于图形的表示;计算机科学讲义,第4538卷,施普林格,柏林-海德堡(2007),第1-12页。doi:10.1007/978-3-540-72903-7_1·Zbl 1182.68205号
[23] G.Sidorov、F.Castillo、E.Stamatatos、A.Gelbukh和L.Chanona-Hernández,“语法N-语法作为自然语言处理的机器学习功能”,《应用专家系统》,第41卷,第。3, 853-860 (2014). doi:10.1016/j.eswa.2013.08.015。
[24] Scikit-Learn。Python中的机器学习。网址:https://scikit-learn.org/stable/。
[25] 西班牙。网址:https://spacy.io/。
[26] Weischedel,R。;霍维,E。;马库斯,M。;帕尔默,M。;贝尔文,R。;Pradhan,S。;拉姆肖。;薛,N。;奥利夫,J。;Christianson,C。;McCary,J.,OntoNotes:增强处理的大型训练语料库,《自然语言处理和机器翻译手册:DARPA全球自主语言开发》(2011),纽约:Springer-Verlag,纽约·Zbl 1230.68003号
[27] Z.乌尔卡尤姆。;Altaf,W.,使用语义启发式特征的短语识别,Res.J.Appl。科学。工程技术。,4, 22, 4894-4904 (2012)
[28] W.Blacoe和M.Lapata,“语义合成中基于向量的表示的比较”,摘自:Proc。
[29] 自然语言处理和计算自然语言学习实证方法联合会议(韩国济州岛,2012年7月12-14日),计算语言学协会(2012年),第546-556页。
[30] Paraphrase Identification(最新技术)URL:https://aclweb.org/aclwiki/Paraphrase_Identification网址_(艺术状态)。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。