你可以把什么塞进一个$!#*向量:探索句子嵌入的语言特性

亚历克西斯·康诺,德语Kruszewski,纪尧姆·兰普尔,洛伊克·巴罗,巴罗尼


摘要
尽管最近已经投入了大量精力来训练高质量的句子嵌入,但我们对它们捕获的内容仍然了解不足。通常基于句子分类的“下游”任务通常用于评估句子表征的质量。任务的复杂性使得很难推断出表示中存在什么样的信息。我们在这里介绍了10个探测任务,旨在捕捉句子的简单语言特征,并使用它们研究了三个不同的编码器以八种不同的方式训练生成的嵌入,揭示了编码器和训练方法的有趣特性。
选集ID:
第18-1198页
体积:
计算语言学协会第56届年会论文集(第一卷:长篇论文)
月份:
七月
年份:
2018
地址:
澳大利亚墨尔本
编辑:
艾丽娜·古列维奇,Yusuke Miyao先生
地点:
国际计算语言学协会
SIG公司:
出版商:
计算语言学协会
注:
页:
2126–2136
语言:
网址:
https://aclantology.org/P18-1198
内政部:
10.18653/v1/P18-1198
比比键:
引用(ACL):
亚历克西斯·康诺(Alexis Conneau)、德国人克鲁舍夫斯基(Kruszewski)、纪尧姆·兰普尔(Guillaume Lample)、洛伊克·巴罗(Loíc Barrault)和马可·巴罗尼(Marco Baroni)。2018你可以把什么塞进一个$!#*向量:探索句子嵌入的语言特性.英寸计算语言学协会第56届年会论文集(第一卷:长篇论文),第2126–2136页,澳大利亚墨尔本。计算语言学协会。
引用(非正式):
你能塞进一个$&!#*里的东西向量:探索句子嵌入的语言特性(Conneau等人,ACL 2018)
复制引文:
PDF格式:
https://aclantology.org/P18-1198.pdf
注:
P18-1198.注释.pdf
演示:
P18-1198.演示.pdf
视频:
 https://aclantology.org/P18-1198.mp4
数据
图书语料库SICK公司