针对不同的语言和用例,我们提出了从不同来源提取词汇的方法。GF中的词汇是语法的一部分,它包括单词的屈折变化和句法行为的信息。因此,词汇提取需要提供基本形式、屈折变化范式和单词配价的来源。除了不同的来源外,我们还考虑了不同类型的词典:单语和多语,以及单义(一个引理,一个意义)和多义(每个引理的词条)。这些资源包括WordNet、形态词典、Wiktionary、领域本体和SMT系统的短语表。
找不到反向链接。