什么是ConceptNet?

概念网是一个免费的语义网络,旨在帮助计算机理解人们使用。

ConceptNet起源于众包项目Open Mind《常识》于1999年在麻省理工学院媒体实验室推出自从成长为包括来自其他众包资源的知识,专家创造了有目的的资源和游戏。

语义网络 知识图 是一个 自然语言理解力 人造的智力 单词嵌入 用于 的一部分 的一部分 链接的数据 多语种的 领域总干事 语义网状物 类似 JSON-LD格式 Web API 一种 用于 开放式内容 有一个 具有属性 多糖霜 多言語 同义词 同义词 同义词 常识知识 的一部分 让计算机了解人们已经知道的东西 目标激励 使用的游戏目的 词典编纂 众包知识 概念网

示例

要了解ConceptNet中的内容,请尝试浏览它对这些术语的了解:

单词向量和最近的出版物

ConceptNet用于创建单词嵌入--将词义表示为向量,类似于word2vec、GloVe或fastText,但更好。

这些单词嵌入是免费的、多语言的、跨语言对齐的,旨在避免代表有害的刻板印象。他们在语言内部和跨语言的单词相似性方面的表现在2017年第六季度.

学习这些单词向量的过程在我们的AAAI 2017年纸张,它还显示了解决类比问题的最新结果问题。

支持和讨论

在Gitter上聊天

有关ConceptNet的详细文档显示在GitHub wiki.

您可以在上与ConceptNet开发人员和用户聊天书写器,或加入conceptnet-users邮件列表.

ConceptNet及其支持技术的更新出现在这个ConceptNet博客.

链接的开放数据API

{
  “@id”: "/a/[/r/UsedFor/、/c/en/example/、/c/en/explain/]",
  “数据集”: "/d/conceptnet/4/en",
  “结束”: {
    “@id”: "/c/en/解释",
    “标签”: “解释某事”,
    “语言”: “en”(英语),
    “术语”: "/c/en/解释"
  },
  “许可证”: "抄送:由/4.0",
  “相对”: {
    “@id”: "/r/用于",
    “标签”: “用于”
  },
  “来源”: [
    {
      “活动”: "/s/activity/omcs/omcs1_possible_free_text",
      “贡献者”: "/s/contributor/omcs/pavlos公司"
    }
  ],
  “开始”: {
    “@id”: "/c/en/示例",
    “标签”: “示例”,
    “语言”: “en”(英语),
    “术语”: "/c/en/示例"
  },
  “surfaceText”: “您可以使用[[示例]]来[[解释某事]]”,
  “重量”: 1.0,
  “@context”: [
    "//api.conceptnet.io/ld/conceptnet5.7/context.ld.json",
    "//api.conceptnet.io/ld/conceptnet5.7/pagination.ld.json"
  ]
}

ConceptNet是链接的打开数据.

作为一种现代的链接开放数据资源,ConceptNet中的数据可用在一个JSON-LD格式API,一种旨在链接数据易于理解和使用。如果你不在乎什么JSON-LD是指,它只是一个带有一些额外元数据的JSON REST API。

你可以使用外部URL在ConceptNet中找到相同的链接其他词汇表中的术语,如WordNet、DBPedia和OpenCyc,它们可以为您提供其他形式的信息。

有关如何使用ConceptNet API的信息,请参阅API文档.或者只是开始浏览它你可能会想出来的。

知识来源

以前的ConceptNet版本是一个家庭式众包项目,其中我们运营了一个网站(Open Mind Common Sense),从那些来到现场。数据网现在比这大得多。我们的数据来自来自许多不同的来源,其中一些您可以做出贡献并加以改进不仅是计算知识的状态人类知识。

  • 与以前的版本一样,ConceptNet 5包含有助于Open Mind Common Sense及其其他语言的姊妹项目。
  • 我们连接到DB佩迪亚,其中提取来自维基百科文章信息框的知识。
  • 我们的许多知识来自Wiktionary公司,免费的多语种词典。这给了我们关于同义词、反义词、,将概念翻译成数百种语言和多种标记词义很多单词。
  • 更多的字典式知识来自打开多语言WordNet.
  • 我们从OpenCyc(由Cycorp提供,以前在cyc.com上托管)导入了一个高级本体。
  • 一些关于人们直觉单词联想的知识来自“有目的的游戏”。我们从Verbosity,以前由GWAP项目和Nihon的“nadya.jp”游戏中的日语Unisys和Dentsu。

如果您认为ConceptNet应该理解某个术语将其添加到未来构建中的最简单方法是添加有关该术语的信息Wiktionary公司,遵循他们的指导方针。

归因概念网

为了给ConceptNet的数据赋予适当的属性,我们建议文本:

这项工作包括来自ConceptNet 5的数据,该数据由常识计算倡议。ConceptNet 5可在来自的Creative Commons Attribution-ShareAlike许可证(CC BY SA 4.0)https://conceptnet.io(概念网).包含的数据由Commonsense Computing的贡献者创建项目、Wikimedia项目的贡献者、有目的的游戏、,普林斯顿大学的WordNet、DBPedia、OpenCyc和Umbel。

关于ConceptNet,您可以引用的一篇论文是:

罗宾·斯佩尔(Robyn Speer)、乔舒亚·钦(Joshua Chin)和凯瑟琳·哈瓦西(Catherine Havasi)。2017"ConceptNet 5.5:一个开放的多语言通用知识图."在诉讼中AAAI公司31

开发

ConceptNet的开发是一个开源项目Luminoso技术公司。代码构建和驱动ConceptNet的在GitHub上.

概念网起源于麻省理工学院媒体实验室,成为常识的一部分计算倡议,麻省理工学院与其他实验室和公司的合作全世界。这种全球合作帮助我们收集关系知识在许多语言中。常识计算倡议由凯瑟琳·哈瓦西,现任首席执行官Luminoso的。

ConceptNet 5的开发由Luminoso联合创始人Robyn Speer领导,来自的捐款其他几个人.