PPDB公司

PPDB:释义数据库。我们展示了我们的短语数据库PPDB的1.0版本。它的英语部分,PPDB:Eng,包含超过2.2亿个短语对,包括7300万个短语和800万个词汇释义,以及1.4亿个释义模式,这些模式包含了许多保留意义的句法转换。从双语语料库中提取了超过1亿个英语平行句和超过2亿个单词。我们还发布了PPDB:Spa,一个1.96亿西班牙语释义的集合。PPDB中的每一个释义对都包含一组相关的分数,包括从bitext数据中获得的复述概率,以及从Google n-grams和带注释的Gigaword语料库计算的各种单语分布相似性分数。我们的再租赁包括修剪工具,允许用户决定自己的精确度/召回权衡。