计算机科学>计算与语言
标题: 我们描述的是同一个声音吗? 富于表现力的钢琴演奏中的词语嵌入空间分析
摘要: 语义嵌入在基于自然语言的信息检索中起着至关重要的作用。 嵌入模型将单词和上下文表示为向量,向量的空间配置来源于单词在大型文本语料库中的分布。 虽然此类表示通常非常强大,但它们可能无法解释特定于域的细粒度细微差别。 在这篇文章中,我们探讨了表现性钢琴演奏特征领域的这种不确定性。 使用自由文本表现特征的音乐研究数据集和后续研究将注释分类,我们得出了特定领域语义相似性结构的基本事实。 我们测试了五个嵌入模型及其相似结构,以确保它们与基本事实相符。 我们进一步评估了上下文提示、模糊度减少、跨模态相似性和k-means聚类的效果; 更通用的模型比域自适应的模型性能更好,并且最佳的模型配置达到了人与人之间的一致性。