A类非直线加速器V(V)er:语义模型评估数据集T型土耳其语-单词的相似性和相关性

格坎·埃尔坎奥尔卡·塔纳


摘要
本文介绍了AnlamVer,它是土耳其语的语义模型评估数据集,旨在评估单词相似度和单词相关度任务,同时区分这两种关系。我们的数据集由12名受试者注释的500个单词组成,每对都有两个不同的相似性和相关性分数。选择词对是为了通过词的多个属性和词对关系(例如频率、形态、具体性和关系类型(例如同义词、反义词))来评估分布语义模型。我们的目标是通过评估多属性模型,为语义模型研究人员提供见解。我们根据频率平衡数据集的词对,以评估语义模型对外来词和罕见词问题的稳健性,这些问题是由土耳其语丰富的派生词法和屈折词法引起的。
选集ID:
C18-1323号
音量:
第27届国际计算语言学会议论文集
月份:
八月
年份:
2018
地址:
美国新墨西哥州圣达菲
编辑:
艾米丽·本德莱昂·德钦斯基皮埃尔·伊莎贝尔
地点:
冷却
SIG公司:
发布者:
计算语言学协会
注:
页:
3819–3836
语言:
网址:
https://aclantology.org/C18-1323
内政部:
比比键:
引用(ACL):
哥坎·埃尔坎(Gökhan Ercan)和奥尔卡·塔纳(Olcay Taner)。2018AnlamVer:土耳其语单词相似性和相关性的语义模型评估数据集.英寸第27届国际计算语言学会议论文集,第3819–3836页,美国新墨西哥州圣菲。计算语言学协会。
引用(非正式):
AnlamVer:土耳其语单词相似性和相关性的语义模型评估数据集(Ercan&Y'ldóz,COLING 2018)
复制引文:
PDF格式:
https://aclantology.org/C18-1323.pdf
数据
安拉姆维尔