×

最优语音运动控制和令牌到令牌的可变性:一种贝叶斯建模方法。 (英语) Zbl 1345.92049号

小结:语音马达系统适应各种语音条件的显著能力是由于自由度过大,这使得能够使用不同的控制策略产生类似的声学特性。为了解释中枢神经系统如何选择其中一种可能的策略,根据最优运动控制理论,一种常见的方法是将言语运动规划建模为基于成本函数的最优问题的解决方案。尽管这种方法取得了成功,但它的缺点之一是最优性概念与观测到的实验性说话人内令牌对令牌可变性之间的内在矛盾。本文提出了一种在概率贝叶斯建模框架中建立前馈最优控制的替代方法。通过控制用于语音生成的声道生物力学模型,并将其与现有的最优控制模型(GEPPETO)进行比较,说明了这一点。首先介绍了该最优控制模型的基本要素。从中逐步构建贝叶斯模型。基于计算机仿真评估了贝叶斯模型的性能,并与最优控制模型进行了比较。结果表明,该方法适用于解决语音规划问题,同时原则性地考虑了可变性。

理学硕士:

92C30型 生理学(一般)
62页第10页 统计学在生物学和医学中的应用;元分析
2015年1月62日 贝叶斯推断

软件:

教堂
PDF格式BibTeX公司 XML格式引用
全文: 内政部 哈尔

参考文献:

[1] Attias H(2003)《概率推理规划》。In:主教CM,Frey BJ(编辑)第九届人工智能和统计国际研讨会论文集,基韦斯特
[2] Bessière P、Laugier C、Siegwart R(eds)(2008年),感应电机系统中的概率推理和决策。Springer tracts in advanced robotics,第46卷。柏林施普林格·Zbl 1139.93001号
[3] Bessière P、Mazer E、Ahuactzin JM、Mekhnacha K(2013)贝叶斯编程。博卡拉顿CRC出版社
[4] Boutiler C、Dean T、Hanks S(1999)《决策理论规划:结构假设和计算杠杆》。《艺术情报研究杂志》10:1-94·Zbl 0918.68110号
[5] Bowers JS,Davis CJ(2012)心理学和神经科学中的贝叶斯故事。精神公牛138(3):389-414·doi:10.1037/a0026450
[6] Brown LD(1981)有限样本空间统计问题的一个完整类定理。安统计9(6):1289-1300·Zbl 0476.62006号 ·doi:10.1214/aos/1176345645
[7] 卡利奥佩(1984)《假释与自动培训》。巴黎马森
[8] Colas F,Diard J,Bessière P(2010)常见认知问题的常见贝叶斯模型。生物学报58(2-3):191-216·doi:10.1007/s10441-010-9101-1
[9] Daunizeau J、den Ouden HEM、Pessiglione M、Kiebel SJ、Stephan KE、Friston KJ(2010)《观察者》(I):学习和决策的元贝叶斯模型。公共科学图书馆·综合5(12):e15554·doi:10.1371/journal.pone.0015554
[10] Feldman AG(1986)再次讨论电机控制的平衡点假设(λ模型)。Mot Behav杂志18(1):17-54·doi:10.1080/00222895.1986.10735369
[11] Friston K(2010)自由能原理:统一的大脑理论?《神经科学自然评论》11(2):127-138·doi:10.1038/nrn2787
[12] Friston K(2011)关于电机控制,什么是最佳的?神经元72(3):488-498·doi:10.1016/j.neuron.2011.10.18
[13] Friston KJ,Frith CD(2015)《主动推理、沟通和解释学》。皮质68:129-143·doi:10.1016/j.cortex.2015.03.025
[14] Friston KJ、Daunizeau J、Kiebel SJ(2009)强化学习还是主动推理?公共科学图书馆·综合4(7):e6421·doi:10.1371/journal.pone.0006421
[15] Friston K、Mattout J、Kilner J(2011)《行动理解与主动推理》。生物网络104(1-2):137-160·Zbl 1232.92036号 ·doi:10.1007/s00422-011-0424-z
[16] Friston K、Samothrakis S、Montague R(2012)《主动推理与代理:无成本函数的最优控制》。生物网络106(8-9):523-541·Zbl 1267.90167号 ·doi:10.1007/s00422-012-0512-8
[17] Ganesh G,Haruno M,Kawato M,Burdet E(2010)决定运动行为的是运动记忆和误差和努力的局部最小化,而不是全局优化。神经生理学杂志104(1):382-390·doi:10.1152/jn.01058.2009
[18] Goodman ND、Mansinghka VK、Roy DM、Bonawitz K、Tenenbaum JB(2008)《教堂:生成模型的语言》。摘自:第24届人工智能不确定性会议记录,第22卷,第23页
[19] Gordon AD、Henzinger TA、Nori AV、Rajamani SK(2014)概率编程。摘自:第36届软件工程国际会议论文集(ICSE 2014,软件工程未来方向)。ACM,纽约,第167-181页·Zbl 1243.93133号
[20] Guenther FH(1995)语音生成神经网络模型中的语音采集、协同发音和速率效应。《心理学评论》102(3):594-621·doi:10.1037/0033-295X.102.3.594
[21] Guenther FH,Hampson M,Johnson D(1998)《言语运动规划参考框架的理论研究》。《心理学评论》105(4):611-633·doi:10.1037/0033-295X.105.4.611-633
[22] Hahn U(2014)贝叶斯繁荣:好事还是坏事?前心理医生5。艺术品ID 765
[23] Honda K(1996)元音发音组织。J电话24:39-52·doi:10.1006/jpho.1996.004
[24] Jones M,Love B(2011)贝叶斯原教旨主义还是启蒙?贝叶斯认知模型的解释地位和理论贡献。行为脑科学34:169-231·文件编号:10.1017/S0140525X10003134
[25] 密歇根州约旦;Gazzaniga,MS(编辑),计算电机控制,597-609(1996),剑桥
[26] Kaelbling L,Littman M,Cassandra A(1998),部分可观测随机域中的规划和行动。艺术智能101(1-2):99-134·Zbl 0908.68165号 ·doi:10.1016/S0004-3702(98)00023-X
[27] Kappen HJ,Gómez V,Opper M(2012)作为图形模型推理问题的最优控制。马赫学习87(2):159-182·Zbl 1243.93133号 ·doi:10.1007/s10994-012-5278-7
[28] Kawato M(1999)电机控制和轨迹规划的内部模型。Curr Opin神经生理学9(6):718-727·doi:10.1016/S0959-4388(99)00028-8
[29] Laboissière R、Ostry DJ、Feldman AG(1996)《多肌肉系统的控制:人类下颌和舌骨运动》。生物Cybern 74(4):373-384·doi:10.1007/BF00194930
[30] Lebeltel O、Bessière P、Diard J、Mazer E(2004)贝叶斯机器人编程。自动机器人16(1):49-79·doi:10.1023/B:AURO.0000008671.38949.43
[31] 马维杰(2010)《信号检测理论、不确定性和类泊松种群编码》。视觉研究50:2308-2319·doi:10.1016/j.visres.2010.8.035
[32] 马文杰(2012)组织感知的概率模型。趋势认知科学16(10):511-518·doi:10.1016/j.tics.2012.08.010
[33] Ma L,Perrier P,Dang J(2006)《元音-声调序列中的预期协同发音:法语和汉语使用者的跨语言研究》。摘自:第七届演讲制作国际研讨会论文集。乌巴图巴,第151-158页
[34] Marr D,Vision(1982)人类视觉信息表征和处理的计算研究。W.H.Freeman,纽约
[35] Ménard L(2002)《管道人声的羊角面包制作与感知:变异性、不变性与规范化》。格勒诺布尔斯坦达尔大学未发表博士论文
[36] Murphy K(2002)动态贝叶斯网络:表示、推理和学习。加州大学伯克利分校未发表博士论文·Zbl 0476.62006号
[37] Nelson W(1983)《熟练运动经济的物理原理》。生物网络46:135-147·Zbl 0499.92025号 ·doi:10.1007/BF00339982
[38] Payan Y,Perrier P(1997)利用平衡点假设控制的2D生物力学舌模型合成VV序列。演讲通讯22(2):185-205·doi:10.1016/S0167-6393(97)00019-8
[39] Perkell SJ,Nelson LW(1985),元音/i/和/a/产生的可变性。《美国科学院学报》77:1889-1895·数字对象标识代码:10.1121/1.391940
[40] Perkell J、Matthies M、Lane H、Guenther F、Wilhelms-Tricarico R、Wozniak J、Guiod P(1997)《言语运动控制:声学目标、饱和度效果、听觉反馈和内部模型》。演讲通讯22(2):227-250·doi:10.1016/S0167-6393(97)00026-5
[41] Perrier P,BoöLJ,Sock R(1992)利用ct扫描和声道铸型两组系数从中矢状面估计声道面积功能。语言听力研究杂志35(1):53-67·doi:10.1044/jshr.3501.53
[42] Perrier P,Payan Y,Zandipour M,Perkell J(2003),舌生物力学对腭部止辅音产生过程中言语运动的影响:一项建模研究。《Acoust Soc Am杂志》114(3):1582-1599·数字对象标识代码:10.1121/11587737
[43] Perrier P,Ma L,Payan Y(2005)通过舌的生物力学模型倒置对VCV序列的产生进行建模。摘自:葡萄牙里斯本《2005年跨周会议记录》,第1041-1044页
[44] Poggio T,Girosi F(1989)近似和学习网络理论。美国马萨诸塞州剑桥市麻省理工学院人工智能实验室和生物信息处理中心技术代表·Zbl 1226.92005号
[45] Pouget A,Beck JM,Ma WJ,Latham PE(2013)概率大脑:已知和未知。《自然神经科学》16(9):1170-1178·doi:10.1038/nn.3495
[46] Robert C(2007)贝叶斯选择:从决策理论基础到计算实现。纽约州施普林格·Zbl 1129.62003号
[47] Robert-Ribes J(1995)《视听语言的整合模式:人类感知与自动呼喊的侦察》(Modèles d’integration audiovisuelle de signaux languages:de la perception humaine a la sensition automatique des voyeles)。格勒诺布尔国立理工学院未发表博士论文
[48] Schmolesky MT、Wang Y、Hanes DP、Thompson KG、Leutgeb S、Schall JD、Leventhal AG(1998)猕猴视觉系统的信号计时。神经生理学杂志79(6):3272-3278
[49] Shim JK、Latash ML、Zatsiorsky VM(2003)《Prehension协同效应:稳定绩效的试验间变异性和层级组织》。实验脑研究152(2):173-184·doi:10.1007/s00221-003-1527-0
[50] Todorov E(2004)《传感器运动控制中的优化原则》。《自然神经科学》7(9):907-915·doi:10.1038/nn1309
[51] Todorov E,Jordan MI(2002),作为运动协调理论的最优反馈控制。《国家神经科学》5(11):1226-1235·doi:10.1038/nn963
[52] Tourville JA、Reilly KJ、Guenther FH(2008),语音听觉反馈控制的神经机制。神经影像学39(3):1429-1443·doi:10.1016/j.neuroimage.2007.09.054
[53] Toussant M(2009)概率推理作为计划行为的模型。昆士底情报3(9):23-29
[54] Uno Y,Kawato M,Suzuki R(1989),人类多关节手臂运动最优轨迹的编队控制:最小扭矩变化模型。生物网络61:89-101·doi:10.1007/BF00204593
[55] Wolpert DM(2007)人类感觉运动控制的概率模型。Hum Mov科学26:511-524·doi:10.1016/j.humov.2007.05.005
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。