×

通过语义镜像和谱图划分计算语义聚类。 (英语) Zbl 1343.68257号

摘要:使用语义镜像技术,可以获得表示平行语料库或双语词典中单词及其翻译的图形。图的连通性包含了翻译中出现的单词语义关系的信息。谱图理论用于划分图,从而将单词分组到不同的簇中。我们使用瑞典语和英语形容词词典中的一小部分种子词来说明该方法,并讨论其在计算词汇语义和词典编纂中的应用。

MSC公司:

68T50型 自然语言处理
68平方英寸15 文本处理的计算方法;数学排版
68兰特 计算机科学中的图论(包括图形绘制)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bui T.N.,Jones C.:找到好的近似顶点和边划分是NP-hard。Inf.流程。莱特。42153–159(1992年)·Zbl 0764.68061号 ·doi:10.1016/0020-0190(92)90140-Q
[2] Chugur,I.,Penas,A.,Gonzalo,J.,Verdejo,F.:用形容词丰富西班牙语WordNet的单语和双语词典方法。In:WordNet和其他词汇资源研讨会论文集,NAACL,匹兹堡(2001)
[3] Chung,F.:图的拉普拉斯算子和Cheeger不等式。收录于:Miklós,D.、sós、V.T.、Szonyi,T.(编辑)组合数学,Paul Erdös is Erthy,vol.2。第157-172页。Bolyai Soc.数学。螺柱,第2卷。János Bolyai数学。Soc.,布达佩斯(1996)
[4] Chung,F.:谱图理论。CBMS数学区域会议系列第92期。美国数学学会(1997)·Zbl 0867.05046号
[5] Diab,M.,Resnik,P.:使用平行语料库进行词义标注的无监督方法。摘自:计算语言学协会第40届年会会议记录,第255-262页(2002)
[6] Dyvik,H.:语义学的翻译基础。摘自:Johansson,S.,Oksefjell,S.(编辑)《语料库和跨语言研究:理论、方法和案例研究》,第51-86页。罗多比(1998)
[7] Dyvik,H.:作为语义镜像的翻译:从平行语料库到wordnet。参加:第23届现代和中世纪英语计算机语料库英语语言研究国际会议(ICAME 23)。哥德堡(2002)
[8] Dyvik,H.:作为语义知识来源的翻译。摘自:《第二届波罗的海人类语言技术会议记录》,第27-38页,塔林,塔林理工大学控制论研究所和爱沙尼亚语言研究所(2005年)
[9] Fagerlund,M.,Merkel,M.,Eldén,L.,Ahrenberg,L.:通过语义镜像和谱图划分计算词义。摘自:《文本图形会议记录-5–2010年自然语言处理基于图形的方法研讨会》,第103–107页。计算语言学协会。乌普萨拉,瑞典(2010年)·Zbl 1343.68257号
[10] Fellbaum,C.(编辑):WordNet:电子词汇数据库。麻省理工学院出版社,剑桥(1998)·Zbl 0913.68054号
[11] Foo,J.,Merkel,M.:计算机辅助术语库创建和标准化:通过自动术语提取和高级编辑工具构建标准化术语库。在:日常生活中的术语。约翰·本杰明斯(2010)
[12] Ganter B.,Wille R.:形式概念分析。数学基础。柏林施普林格(1999)·Zbl 0909.06001号
[13] Ide N.:跨语言感觉判断:它能起作用吗?。计算。人性。规格。发行SENSEVAL 34、223–234(2000)·doi:10.1023/A:1002475423737
[14] Kilgarriff,A.:自然语言处理的同义词库。2003年自然语言处理和知识工程国际会议,2003年。会议记录,第5-13页(2003年)
[15] Koehn,P.:Europarl:统计机器翻译的并行语料库。In:第十届机器翻译峰会,泰国普吉岛,2005年9月12-16日
[16] Lilliehök,H.,Merkel,M.:从语义镜像数据中聚类词义。摘自:挪威奥斯陆诺达利达NLP词汇语义资源研讨会论文集,NEALT论文集系列,第19卷(2013)
[17] Lindén,K.:词义发现和消歧。赫尔辛基大学博士论文(2005年)
[18] Miller G.A.:Wordnet:英语词汇数据库。Commun公司。ACM 38、39–41(1995)·doi:10.1145/219717.219748
[19] Pothen A.,Simon H.D.,Liou K.-P.:用图的特征向量划分稀疏矩阵。SIAM J.矩阵分析。申请。11(3),430–452(1990)·Zbl 0711.65034号 ·数字对象标识代码:10.1137/0611030
[20] Priss,U.,Old,L.J.:语义镜像的概念探索。In:形式概念分析:第三届国际会议,ICFCA(2005)·Zbl 1078.68777号
[21] Resnik P.,Yarowsky D.:区分系统和区分意义:词义消歧的新评估方法。Nat.Lang.Eng.5,113–133(1999)·doi:10.1017/S1351324999002211
[22] Simon,H.D.:非结构化问题的并行处理分区。大规模结构分析和物理应用的并行方法。计算。系统。工程2(2–3),135–148(1991)
[23] von Luxburg U.:光谱聚类教程。统计学。计算。17, 395–416 (2007). 数字对象标识代码:10.1007/s11222-007-9033-z·数字对象标识代码:10.1007/s11222-007-9033-z
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。