Are we describing the same sound? An analysis of word embedding spaces of expressive piano performance

Peter, Silvan David; Chowdhury, Shreyan; Cancino-Chacón, Carlos Eduardo; Widmer, Gerhard

doi:10.1145/3632754.3632759

计算机科学>计算与语言

arXiv:2401.02979号（cs）

【于2023年12月31日提交】

标题：我们描述的是同一个声音吗？富于表现力的钢琴演奏中的词语嵌入空间分析

作者：席尔文·大卫·彼得,什利安·乔杜里,卡洛斯·爱德华多·坎西诺·查科,格哈德·维德默

查看PDF HTML（实验性）

摘要：语义嵌入在基于自然语言的信息检索中起着至关重要的作用。嵌入模型将单词和上下文表示为向量，向量的空间配置来源于单词在大型文本语料库中的分布。虽然此类表示通常非常强大，但它们可能无法解释特定于域的细粒度细微差别。在这篇文章中，我们探讨了表现性钢琴演奏特征领域的这种不确定性。使用自由文本表现特征的音乐研究数据集和后续研究将注释分类，我们得出了特定领域语义相似性结构的基本事实。我们测试了五个嵌入模型及其相似结构，以确保它们与基本事实相符。我们进一步评估了上下文提示、模糊度减少、跨模态相似性和k-means聚类的效果；更通用的模型比域自适应的模型性能更好，并且最佳的模型配置达到了人与人之间的一致性。

学科：	计算与语言（cs.CL）; 人工智能；信息检索（cs.IR）
引用为：	arXiv:2401.02979号【cs.CL】
	（或 arXiv:2401.02979v1【cs.CL】对于此版本）
	https://doi.org/10.48550/arXiv.2401.02979
日志参考：	信息检索评估论坛会议记录，FIRE，2023年，印度潘吉姆
相关DOI:	https://doi.org/10.1145/3632754.3632759

提交历史记录

发件人：Silvan Peter[查看电子邮件]
[v1]2023年12月31日星期日12:20:03 UTC（1594 KB）

计算机科学>计算与语言

标题：我们描述的是同一个声音吗？富于表现力的钢琴演奏中的词语嵌入空间分析

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>计算与语言

标题：我们描述的是同一个声音吗？富于表现力的钢琴演奏中的词语嵌入空间分析

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目