×

用于揭示音乐解释的Markov开关状态空间模型。 (英文) Zbl 1478.62380号

摘要:对于音乐会观众来说,音乐诠释是决定我们是否喜欢古典音乐表演的最重要因素。每一场演出都有错误——语调问题、音符丢失、令人不快的声音——但当表演者与观众互动时,这些都很容易被忘记(或忽视),除了印刷页上模糊的指示之外,还为作品注入了新颖的情感内容。在这项研究中,我们使用了来自CHARM Mazurka项目的数据——46张肖邦的Mazurca作品68第3号的专业录音,由技艺精湛的艺术家录制——目的是阐明音乐上可解释的表演决定。我们通过检查录音中音符攻击的间隔时间,特别关注每个演奏者对节奏的使用。为了解释这些节奏决定,我们建立了一个切换状态空间模型,并结合从音乐理论和表演实践中获得的先验信息,通过最大似然估计它。我们使用估计参数定量描述个人绩效决策并比较记录。这些比较提出了通知音乐教学、发现听力偏好和分析表演的方法。

MSC公司:

62页99 统计学的应用
62亿02 马尔可夫过程:假设检验
2005年6月2日 马尔可夫过程:估计;隐马尔可夫模型
62M20型 随机过程推断和预测
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Anderson,B.D.O.和Moore,J.B.(1979年)。最佳过滤新泽西州恩格尔伍德克利夫斯市普伦蒂斯·霍尔·Zbl 0688.93058号
[2] Andrieu,C.、Doucet,A.和Holenstein,R.(2010年)。粒子马尔可夫链蒙特卡罗方法。J.R.统计社会服务。B.统计方法。72 269-342. ·兹比尔1411.65020 ·文件编号:10.1111/j.1467-9868.2009.00736.x
[3] Arcos,J.和Mantaras,R.L.(2001)。一种交互式cbr方法,用于生成富有表现力的音乐。J.应用。智力。21 115-129. ·兹比尔0972.68549
[4] Ariza,C.(2005)。浏览计算机辅助算法合成系统:定义、七个描述符、系统和研究词典。国际计算机音乐会议论文集.
[5] Arzt,A.和Widmer,G.(2015)。使用多个表演作为参考进行实时音乐跟踪。国际音乐信息检索学会(ISMIR公司) 357-363.
[6] Bernstein,L.(2005)。青少年音乐会Amadeus出版社,新泽西州蓬普顿平原。
[7] Bisiani,R.(1992年)。光束搜索。人工智能百科全书第二版(S.Shapiro,ed.)Wiley,纽约。
[8] Block,B.A.、Jonsen,I.D.、Jorgensen,S.J.、Winship,A.J.、Shaffer,S.A.、Bograd,S.J、Hazen,E.L.、Foley,D.G.、Breed,G.等人(2011年)。在动态海洋中跟踪顶点海洋捕食者的运动。性质475 86.
[9] Boulanger-Lewandowski,N.、Bengio,Y.和Vincent,P.(2012)。高维序列中的时间依赖建模:应用于复调音乐的生成和转录。会议记录29第十届国际机器学习会议.
[10] Bresin,R.、Friberg,A.和Sundberg,J.(2002)。音乐总监:KTH表演规则体系。SIGMUS会议记录-46
[11] Burkholder,J.P.、Grout,D.J.和Palisca,C.V.(2014)。西方音乐史第9版,纽约诺顿。
[12] CHARM(2009)。录音音乐历史与分析中心。在线;2019年3月12日访问。
[13] Collins,N.(2016)。在通往公式的路上发生了一件有趣的事情:音乐剧的算法合成。计算。音乐J。40 41-57.
[14] Cont,A.(2010)。一种耦合的以持续时间为中心的体系结构,用于实时音乐与乐谱对齐。IEEE传输。模式分析。机器。智力。32 974-987.
[15] Cont,A.、Schwarz,D.、Schnell,N.和Raphael,C.(2007年)。实时音频与分数比对的评估。音乐信息检索国际研讨会(ISMIR公司).
[16] Cook,N.(2013)。超越分数:音乐作为表演牛津大学出版社,牛津。
[17] Craven,P.和Wahba,G.(1978年)。使用样条函数平滑噪声数据。数字。数学。31 377-403. ·Zbl 0377.65007号
[18] Dannenberg,R.(1985)。实时伴奏的在线算法。会议记录1984国际计算机音乐大会193-198. 国际计算机音乐协会。
[19] Dannenberg,R.B.和Raphael,C.(2006年)。配乐和电脑伴奏。Commun公司。ACM公司49 38-43.
[20] Dror,G.、Koenigstein,N.、Koren,Y.和Weimer,M.(2012)。雅虎!音乐数据集和KDD-Cup’11。KDD杯8-18.
[21] Dudoit,S.和Fridlyand,J.(2002)。一种基于预测的重采样方法,用于估计数据集中的簇数。基因组生物学3研究0036.1。
[22] Durbin,J.和Koopman,S.J.(1997年)。非高斯状态空间模型的蒙特卡罗最大似然估计。生物特征84 669-684. ·Zbl 0888.62086号 ·doi:10.1093/biomet/84.3.669
[23] Durbin,J.和Koopman,S.J.(2001)。状态空间方法的时间序列分析.牛津统计科学系列24.牛津大学出版社,牛津·Zbl 0995.62504号
[24] Earis,A.(2007)。从钢琴录音中提取表达时间和动态的算法。音乐。科学。11 155-182.
[25] Earis,A.(2009)。F大调玛祖卡,作品68,第3号。2019年3月12日访问。
[26] Eddelbuettel,D.(2013年)。无缝R和\[C}++\]与Rcpp集成。斯普林格,纽约。·Zbl 1283.62001号
[27] Fearnhead P.和Clifford P.(2003年)。基于粒子滤波的隐马尔可夫模型在线推理。J.R.统计社会服务。B.统计方法。65 887-899. ·Zbl 1059.62098号 ·doi:10.1111/1467-9868.00421
[28] Flossman,S.、Grachten,M.和Widmer,G.(2012年)。概率模型的表现性能渲染。表达性音乐表演计算指南(A.Kirke和E.Miranda编辑)柏林斯普林格。
[29] Flossmann,S.、Grachten,M.和Widmer,G.(2013)。概率模型的表现性能渲染。表达性音乐表演计算指南75-98. 柏林施普林格。
[30] Forsén,S.、Gray,H.B.、Lindgren,L.K.O.和Gray,S.B.(2013)。贝多芬的节拍器有问题吗?通知Amer。数学。Soc公司。60 1146-1153. ·Zbl 1322.00026号 ·doi:10.1090/noti1044
[31] Fox,E.B.、Sudderth,E.B.,Jordan,M.I.和Willsky,A.S.(2011年)。一种粘性HDP-HMM,可应用于说话人日记。附录申请。斯达。5 1020-1056. ·Zbl 1232.62077号 ·doi:10.1214/10-OAS395
[32] Fuh,C.-D.(2006)。状态空间模型中的有效似然估计。安。统计师。34 2026-2068. ·Zbl 1246.62185号 ·doi:10.1214/0090536000000614
[33] Ghahramani,Z.和Hinton,G.E.(2000年)。状态空间模型切换的变分学习。神经计算。12 831-864.
[34] Golub,G.H.、Heath,M.和Wahba,G.(1979年)。广义交叉验证是一种选择良好脊线参数的方法。技术计量学21 215-223. ·Zbl 0461.62059号 ·doi:10.2307/1268518
[35] Grindlay,G.和Helmbold,D.(2006年)。用图形模型对富有表现力的钢琴演奏进行建模、分析和综合。机器。学习。65 361-387.
[36] Gu,Y.和Raphael,C.(2012)。使用切换卡尔曼滤波器对钢琴口译进行建模。国际音乐信息检索学会(ISMIR公司) 145-150.
[37] Hadjeres,G.、Pachet,F.和Nielsen,F.(2017年)。DeepBach:巴赫合唱团一代的可控模式。会议记录34第十届国际机器学习会议(D.Precup和Y.W.Teh编辑)。机器学习研究进展70 1362-1371. PMLR,澳大利亚悉尼。
[38] Hamilton,J.D.(2011)。实时调用衰退。国际期刊预测。27 1006-126.
[39] Harvey,A.C.(1990年)。预测、结构时间序列模型和卡尔曼滤波剑桥大学出版社,剑桥·Zbl 0725.62083号
[40] Kallberg,J.(1996)。肖邦的边界:性、历史和音乐流派哈佛大学出版社,哈佛。
[41] Kalman,R.E.(1960年)。线性滤波和预测问题的新方法。J.基础工程。82 35-45之间。
[42] Kim,C.-J.(1994年)。带有Markov开关的动态线性模型。J.计量经济学60 1-22. ·Zbl 0795.62104号 ·doi:10.1016/0304-4076(94)90036-1
[43] Kim,C.J.和Nelson,C.R.(1998年)。商业周期转折点,一个新的重合指数,以及基于动态因素模型和制度转换的持续时间相关性测试。经济收益率。斯达。80 188-201.
[44] Kim,S.-J、Koh,K.、Boyd,S.和Gorinevsky,D.(2009年)\[{l1}\]趋势过滤。SIAM版本。51 339-360. ·Zbl 1171.37033号 ·doi:10.1137/070690274
[45] 北川(1987)。非平稳时间序列的非高斯状态空间建模。J.Amer。统计师。协会。82 1032-1063·Zbl 0644.62088号
[46] 北川,G.(1996)。非高斯非线性状态空间模型的蒙特卡罗滤波器和平滑器。J.计算。图表。统计师。5 1-25. ·数字对象标识代码:10.2307/1390750
[47] Koyama,S.、Castellanos Pérez-Bolde,L.、Shalizi,C.R.和Kass,R.E.(2010年)。状态空间模型的近似方法。J.Amer。统计师。协会。105 170-180. ·Zbl 1397.62112号 ·doi:10.1198/jasa.2009.tm08326
[48] Lang,M.、Bischl,B.和Surmann,D.(2017年)。批处理工具:用于R在批处理系统上工作的工具。J.开源。柔和。2 135.
[49] Lang,D.和Freitas,N.D.(2005年)。跳动跟踪图形模型的方式。神经信息处理系统研究进展745-752. 麻省理工学院出版社,马萨诸塞州剑桥。
[50] Maezawa,A.(2019年)。表达速度可解释预测的深度线性自回归模型。会议记录16第届声音和音乐计算会议.
[51] McDonald,D.J、McBride,M.、Gu,Y.和Raphael,C.(2021)。《用于揭示音乐解释的Markov-Switching状态空间模型》的补充https://doi.org/10.1214/21-AOAS1457SUPA网站, https://doi.org/10.1214/21-AOAAS1457SUPPB, https://doi.org/10.1214/21-AOAS1457SUPC网站
[52] McFee,B.和Lanckriet,G.(2011年)。学习多模态相似性。J.马赫。学习。物件。12 491-523. ·Zbl 1280.68181号
[53] Mead,A.(2007年)。关于节奏关系。透视。新音乐45 64-108.
[54] Patterson,T.A.、Thomas,L.、Wilcox,C.、Ovaskainen,O.和Matthiopoulos,J.(2008)。个体动物运动的状态空间模型。经济趋势。进化。23 87-94.
[55] R核心团队(2019年)。R: 用于统计计算的语言和环境。R统计计算基金会,奥地利维也纳。
[56] Raphael,C.(2002年)。用于韵律解析的混合图形模型。人工智能137 217-238. ·Zbl 0995.68029号
[57] Raphael,C.(2010年)。音乐加一和机器学习。会议记录27第十届国际机器学习会议(ICML公司-10) (J.Fürnkranz和T.Joachims编辑)21-28。
[58] Rauch,H.E.、Tung,F.和Striebel,C.T.(1965年)。线性动力系统的最大似然估计。美国汽车协会J。3 1445-1450. ·数字对象标识代码:10.2514/3.3166
[59] Ren,L.、Dunson,D.、Lindroth,S.和Carin,L.(2010年)。音乐分析的动态非参数贝叶斯模型。J.Amer。统计师。协会。105 458-472. ·Zbl 1392.62356号 ·doi:10.1198/jasa.2009.ap08497
[60] Roberts,A.、Hawthorne,C.和Simon,I.(2018年)。Magenta.js:通过深度学习增强创造力的JavaScript API。音乐机器学习联合研讨会(ICML公司).
[61] Roberts,A.、Engel,J.、Raffel,C.、Hawthorne,C.和Eck,D.(2018年)。一种用于学习音乐长期结构的分层潜在向量模型。会议记录35第十届国际机器学习会议(J.Dy和A.Krause编辑)。机器学习研究进展80 4364-4373. 瑞典斯德哥尔摩Stockholmsmässan PMLR。
[62] Schedl,M.、Gómez,E.、Urbano,J.等人(2014)。音乐信息检索:最新发展和应用。已找到。趋势信息检索。8 127-261.
[63] Stowell,D.和Chew,E.(2012年)。节拍时间序列中分段弧的Bayesian MAP估计。计算机音乐多学科研究进展.
[64] Sturm,B.L.,Ben-Tal,O.,蒙纳甘,俄勒冈州。,Collins,N.、Herremans,D.、Chew,E.、Hadjeres,G.、Deruty,E.和Pachet,F.(2019年)。对音乐创作至关重要的机器学习研究:案例研究。J.新音乐研究。48 36-55.
[65] Thickstun,J.、Harchaoui,Z.和Kakade,S.M.(2017年)。从头开始学习音乐的特点。学习代表国际会议(ICLR公司).
[66] Tibshirani,R.J.(2014)。通过趋势滤波的自适应分段多项式估计。安。统计师。42 285-323. ·Zbl 1307.62118号 ·doi:10.1214/13-AOS1189
[67] Tibshirani,R.、Walther,G.和Hastie,T.(2001)。通过间隙统计估计数据集中的簇数。J.R.统计社会服务。B.统计方法。63 411-423. ·Zbl 0979.62046号 ·数字对象标识代码:10.1111/1467-9868.00293
[68] van den Oord,A.、Dieleman,S.和Schrauwen,B.(2013)。基于深度内容的音乐推荐。神经信息处理系统研究进展26(C.J.C.Burges、L.Bottou、M.Welling、Z.Ghahramani和K.Q.Weinberger编辑)2643-2651。Curran Associates,Red Hook公司。
[69] Vercoe,B.(1984)。现场表演中的合成表演者。会议记录1984国际计算机音乐会议199-200年。国际计算机音乐协会。
[70] Wahba,G.(1990年)。观测数据的样条模型.CBMS-NSF应用数学区域会议系列59.宾夕法尼亚州费城SIAM·Zbl 0813.62001号 ·doi:10.1137/1.9781611970128
[71] Whiteley,N.、Andrieu,C.和Doucet,A.(2010年)。使用离散粒子马尔可夫链蒙特卡罗方法对切换状态空间模型进行有效的贝叶斯推断,技术报告编号:10:04 Bristol Univ。
[72] Wickham,H.(2016)。Ggplot公司2:用于数据分析的优雅图形第二版,施普林格,柏林·Zbl 1397.62006年
[73] 威克姆,H.(2017)。tidyverse:轻松安装和加载“tidyverse”。R软件包版本1.2.1。
[74] Widmer,G.、Flossmann,S.和Grachten,M.(2009)。YQX扮演肖邦。人工智能杂志。30 35
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。