AnlamVer: Semantic Model Evaluation Dataset for Turkish - Word Similarity and Relatedness

Gökhan Ercan; Olcay Taner Yıldız

A类非直线加速器V（V）er：语义模型评估数据集T型土耳其语-单词的相似性和相关性

摘要

本文介绍了AnlamVer，它是土耳其语的语义模型评估数据集，旨在评估单词相似度和单词相关度任务，同时区分这两种关系。我们的数据集由12名受试者注释的500个单词组成，每对都有两个不同的相似性和相关性分数。选择词对是为了通过词的多个属性和词对关系（例如频率、形态、具体性和关系类型（例如同义词、反义词））来评估分布语义模型。我们的目标是通过评估多属性模型，为语义模型研究人员提供见解。我们根据频率平衡数据集的词对，以评估语义模型对外来词和罕见词问题的稳健性，这些问题是由土耳其语丰富的派生词法和屈折词法引起的。

选集ID：: C18-1323号
音量：: 第27届国际计算语言学会议论文集
月份：: 八月
年份：: 2018
地址：: 美国新墨西哥州圣达菲
编辑：: 艾米丽·本德，莱昂·德钦斯基，皮埃尔·伊莎贝尔
地点：: 冷却
SIG公司：
发布者：: 计算语言学协会
注：
页：: 3819–3836
语言：
网址：: https://aclantology.org/C18-1323
内政部：
比比键：
引用（ACL）：: 哥坎·埃尔坎（Gökhan Ercan）和奥尔卡·塔纳（Olcay Taner）。2018AnlamVer：土耳其语单词相似性和相关性的语义模型评估数据集.英寸第27届国际计算语言学会议论文集，第3819–3836页，美国新墨西哥州圣菲。计算语言学协会。
引用（非正式）：: AnlamVer：土耳其语单词相似性和相关性的语义模型评估数据集（Ercan&Y'ldóz，COLING 2018）
复制引文：
PDF格式：: https://aclantology.org/C18-1323.pdf
数据: 安拉姆维尔

PDF格式引用搜索