WordNet(文字网)

什么是WordNet?

本材料中表达的任何意见、发现、结论或建议均为WordNet创建者的意见、发现和结论或建议,并不一定反映任何资助机构或普林斯顿大学的意见。

在撰写论文或制作基于WordNet的软件应用程序、工具或界面时,有必要正确引用消息来源引文数据对WordNet资金至关重要。

关于WordNet

WordNet®是一个大型英语词汇数据库。名词、动词、形容词和副词被归类为一组认知同义词(synsets),每个同义词表达一个不同的概念。句法通过概念-语义和词汇关系相互联系。可以使用浏览器WordNet还可免费公开用于下载WordNet的结构使其成为计算语言学和自然语言处理的有用工具。

WordNet表面上类似于同义词库,它根据词义将单词分组在一起。然而,有一些重要的区别。首先,WordNet不仅链接单词形式——字母串——还链接单词的特定意义。因此,在网络中发现的彼此非常接近的单词会在语义上消除歧义。其次,WordNet标记了单词之间的语义关系,而同义词库中的单词分组除了意义相似之外没有遵循任何明确的模式。

结构

WordNet中单词之间的主要关系是同义词,例如单词shut and close或单词car and automobile。同义词——表示相同概念并在许多上下文中可互换的单词——被归为无序集(synset)。WordNet的117000个同义词集中的每一个都通过少量的“概念关系”与其他同义词集链接。此外,一个同义词集包含一个简短的定义(“光泽”),在大多数情况下,还包含一个或多个说明同义词集成员使用的短句。具有多种不同含义的单词形式被表示为许多不同的合成词集。因此,WordNet中的每个表单含义对都是唯一的。

关系

同义词之间最常见的编码关系是上下级关系(也称为上义关系、下义关系或ISA关系)。它将更通用的合成集(如{furniture、piece_of_furniture})链接到更具体的合成集,如{bed}和{bunkbed}。因此,WordNet指出,家具类别包括床,而床又包括双层床;相反,像床和双层床这样的概念构成了家具类别。所有名词层次结构最终都位于根节点{实体}的上方。上下义关系是及物的:如果扶手椅是椅子的一种,如果椅子是家具的一种的话,那么扶手椅就是家具的一类。WordNet区分类型(常用名词)和实例(特定的人、国家和地理实体)。因此,扶手椅是一种椅子,巴拉克·奥巴马是总统的一个例子。实例始终是其层次结构中的叶(终端)节点。

同义词,部分-整体关系在合成词集之间保持,如{椅子}和{靠背}、{座椅}和}腿}。部件是从上级继承来的:如果椅子有腿,那么扶手椅也有腿。部分并不是“向上”继承的,因为它们可能只是特定种类事物的特征,而不是整个类别的特征:椅子和各种椅子都有腿,但不是所有的家具都有腿。

动词句法集也被安排成层次结构;指向树底的动词(同音异义词)表达了越来越具体的事件特征,如{通信}-{交谈}-{耳语}。具体的表达方式取决于语义场;体积(如上例所示)只是动词可以被详细描述的一个维度。其他因素包括速度(慢跑-跑步)或情绪强度(比如放松-放松)。描述事件的动词必然且单向地相互牵连:{购买}-{支付},{成功}-{尝试},{显示}-{参见}等。

形容词是用反义词来组织的。像wet-dry和young-old这样的“直接”反义词对反映了其成员之间强烈的语义契约。这些极性形容词依次与许多“语义相似”的形容词相联系:干燥与焦干、干燥、干燥、骨干、潮湿与潮湿、积水等相联系。语义相似的形容词是相反极的控制成员的“间接反义词”。关系形容词(“从属词”)指向它们来源的名词(犯罪)。 
WordNet中只有很少的副词(几乎、大部分、真的等等),因为大多数英语副词都是通过词法附加直接从形容词派生而来的(令人惊讶、奇怪等等)

跨POS关系

WordNet的大多数关系将来自同一词类(POS)的单词连接起来。因此,WordNet实际上由四个子网组成,每个子网用于名词、动词、形容词和副词,很少有交叉POS指针。跨词性关系包括语义相似的词之间的“形态语义”联系,这些词共享一个具有相同含义的词干:观察(动词)、观察(形容词)观察、观察(名词)。在许多名词-动词对中,名词相对于动词的语义角色已被指定:{sleeper,sleeping_car}是{sleep}的位置{画家}是{paint}的代理,而{painting,picture}是它的结果。

更多信息

Fellbaum,Christiane(2005年)。WordNet和wordnets。收录:Brown,Keith等人(编辑),《语言和语言学百科全书》,第二版,牛津:Elsevier,665-670。

注释

由于资金和人员问题,我们无法再接受评论和建议。 

我们收到了许多关于我们的常见问题解答第页。如果您对从“相关项目“第页,您必须直接联系开发人员。

请注意,在WordNet的新版本公开发布之前,对数据库所做的任何更改都不会反映出来。由于人员有限,目前没有WordNet未来版本的计划。