{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2024,3,2],“日期-时间”:“2024-03-02T07:04:54Z”,“时间戳”:1709363094103},“参考-计数”:59,“出版商”:“Springer Science and Business Media LLC”,“问题”:“1”,“许可证”:[{“开始”:}“日期-零件”:[2022,1,7]],“日期时间”:“2022-01-07T00:00:00Z”,“timestamp”:1641513600000},“content-version”:“tdm”,“delay-in-days”:0,“URL”:“https:\/\/www.springer.com/tdm”},{“start”:{“date-parts”:[[2022,1,7]],“date-time”:“2022-01-07T00:00:00Z”,“timetamp”:64151360000},/tdm“}],“出资人”:[{“DOI”:“10.13039\/501100003074”,“名称”:“agencia nacional de promoci\u00f3n ient\u00edfica y tecnol\u00f 3gica”,“doi-asserted-by”:“publisher”,“adward”:[“PICT 2018-01802”]},{“doi”:“10.13039\/100009573”,“name”:“universidad nacionary de rosario”,“doi-asserted-by”:”crossref“,”adward“:[”ING610“]}],“content-domain”:{“domain”(域):[“link.springer.com”“],”交叉标记重限制“:false},“short-container-title”:[“Int J Speech Technol”],“published-print”:{“date-parts”:[2022,3]]},“DOI”:“10.1007\/s10772-021-0944-7”,“type”:“journal-article”,“created”:{“date-ports”:[2022,1,7]],“date-time”:“2022-01-07T00:03:47Z”,“timestamp”:1641513827000},”page:“231-249”,“update-policy”:”http://\/dx.DOI.org\/10.1007\/springer_crossmark_policy“,“source”:“Crossref”,“is-referenced-by-count”:2,“title”:[“视听语音分类的补充模型”],“prefix”:“10.1007”,”volume“:“25”,“author”:[{“given”:”Gonzalo D.“,”family“:”Sad“,”sequence“:”first“,”affiliation“:[]},{“给定”:“Lucas D.”,“family”:“Terissi”,“sequence”:“additional”,“afliation”:[]]},“givent”:“Juan C.”,“家庭“”:“G\u00f3mez”,“sequence”:“additional”,“affiliation”:[]}],“member”:“297”,“published-online”:{“date-parts”:[2022,1,7]]},“reference”:[{“issue”:“2”,“key”:“9944_CR1”,“doi-asserted-by”:“crossref”,”first page“:”165“,”doi“10.1007\/s10772-012-9131-y”,“volume”:”15“author”:“RK Agg”arwal”,“年份”:“2012年”,“非结构化”:“Aggarwal,R.K.,&Dave,M.(2012)集成多个声学和语言模型以改进印地语语音识别系统。国际语音技术杂志,15(2),165\u2013180.“,“Journal-title”:“国际语音技术期刊”},{“key”:“9944_CR2”,“unstructured”:“Ahlberg,J.(2001).Candide-3\u2014更新的参数化脸.技术报告,瑞典Linkping大学电气工程系”}“,{”issue“:”1“,”key“:”9944_CR3“,”doi-asserted-by“:”crossref“,”first page“:”36“,”doi“:”10.1186\/s13636-014-0036-3“,”volume“:“2014”,”author“:”S Ahmadi“,”year“:”2014“,”unstructured“:”Ahmadi,S.,Ahadi,S.M.,Cranen,B.,&Boves,L.(2014)。用于抗噪自动语音识别的调制谱稀疏编码。EURASIP Journal on Audio,Speech,and Music Processing,2014(1),36.“,”Journal-title“:”EURASIP-Journal on-Adio,Speech,and Music Processing“},{“key”:“9944_CR4”,“doi-asserted-by”:“crossref”,“unstructured”:“Amer,M.R.,Siddiquie,B.,Khan,S.,Divakaran,A.,Sawhney,H.(2014)”使用动态混合模型的多模态融合。摘自:IEEE计算机视觉应用冬季会议论文集,pp 556\u2013563“,“DOI”:“10.1109\/WACV.2014.6836053”},{“key”:“9944_CR5”,“DOI-asserted-by”:“crossref”,“unstructured”:“Benhaim,E.,Sahbi,H.,&Vitte,G.(2014).用于多模式融合的连续视觉语音识别。在:《IEEE声学、语音和信号处理国际会议论文集》,第4618\u20134622页,“DOI”:“10.1109\/ICSP.2014.6854477”},{“issue”:“3”,“key”:“9944_CR6”,“DOI asserted by”:“crossref”,“first page”:“201”,“DOI”:“10.1007\/s1044-002-0188-0”,“volume”:“6”,“author”:“JA Bilmes”,“year”:“2003”,“nonstructured”:“Bilmes,J。A.和Kirchhoff,K.(2003年)。分类器组合和联合训练的一般规则。模式分析与应用,6(3),201\u2013211.“,”journal-title“:”Pattern Analysis and Applications“},{”issue“:”1“,”key“:”9944_CR7“,”doi-asserted-by“:”crossref“,”first page“:“159”,“doi”:“10.1007\/s10772-016-9332-x”,“volume”:“19”,“author”:“A Biswas”,“year”:“2016”,“unstructured”:“Biswas,A.,Sahu,P.K.,&Chandra,M.(2016).在汽车环境中使用主动外观模型视觉特征的多摄像头视听语音识别。国际语音技术杂志,19(1),159\u2013171.“,”Journal-title“:”International Journal of Speech Technology“},{”issue“:”6“,”key“:”9944_CR8“,”doi-asserted-by“:”crossref“,”first-page:“1273”,“doi”:“10.1109\/TSMCA.2008.2003486”,“volume”:“38”,“author”:“B Borgstr\u00f6m”,“year”:“2008”,“unstructured”:“”Borgstr\u00f6m,B.,&Alwan,A.(2008)。一种具有说话人归一化的低复杂度抛物线嘴唇轮廓模型,用于噪声鲁棒性视听语音识别中的高级特征提取。IEEE系统、人与控制论汇刊,38(6),1273\u20131280.“,”journal-title“:”IEEE系统,人与控制学汇刊“},{“issue”:“1”,“key”:“9944_CR9”,“doi-asserted-by”:“crossref”,“first-pages”:“5”,“doi”:“10.1023\/A:1010933404324”,“volume”:”45“author”:“L Breiman”,“year”:“2001”,“unstructured”:“Breiman,L。(2001年).随机森林。机器学习,45(1),5\u201332.”,“期刊标题”:“机器学习”},{“键”:“9944_CR10”,“非结构化”:“Breslin,C.(2008)。自动语音识别互补系统的生成和组合。剑桥大学博士论文”},{“问题”:“3”,“键”:“9944_CR11”,“doi断言”:“crossref”,“首页”:“284”,“doi”:“10.1016\/j.specom.2008.09.004“,”volume“:”51“,”author“:”C Breslin“,”year“:”2009“,”unstructured“:”Breslin.,C.,&Gales,M.(2009)。生成互补系统的有向决策树。语音通信,51(3),284\u2013295.“,“新闻标题”:“语音通信”},{“问题”:“3”,“关键”:“9944_CR12”,“首页”:“273”,”卷“:“20”,“作者”:“C Cortes”,“年份”:“1995”,“非结构化”:“Cortes,C.,&Vapnik,V.(1995)。支持向量网络。机器学习,20:“5”,“key“:”9944_CR13“,”doi-asserted-by“:”crossref“,”first-pages“:”1060“,”doi“:”10.1109\/TASL.2013.2244083“,”volume“:“21”,”author“:”L Deng“,”year“:”2013“,”unstructured“:”Deng,L.,&Li,X.(2013)。语音识别的机器学习范式:综述。IEEE音频、语音和语言处理学报,21(5),1060\u20131089。”,“journal-title”:“IEEE语音、语言处理学报”},{“key”:“9944_CR14”,“doi-asserted-by”:“crossref”,“unstructured”:“Dieterich,T.G.(2000)机器学习中的集成方法。In:多分类器系统。计算机科学课堂讲稿(第1857卷,第1\u201315页)。柏林:Springer“,”DOI“:”10.1007\/3-540-45014-9_1“},{”issue“:”5“,”key“:”9944_CR15“,“DOI-asserted-by”:“crossref”,“first page”:“693”,“DOI”:“10.1109\/TCSVT.2004.826773”,”volume“:“14”,“author”:“SW Foo”,“year”:“2004”,“unstructured”:“Foo,S.W.,Lian,Y.,&Dong,L.(2004).使用自适应增强隐马尔可夫模型识别视觉语音元素。IEEE视频技术电路和系统学报,14(5),693\u2013705.“,”journal-title“:”IEEE视频科技电路和系统杂志“},{”issue“:”5“,”key“:”9944_CR16“,”doi-asserted-by“:”crossref“,”first page“:“1513”,”doi“:”10.1109\/TASL.2006.878264“,”volume“::”14“,”author“:”MJF Gales“,”year“:”2006“,”unstructured“:”Gales,M.J.F.、Kim,D.Y.、Woodland,P.C.、Chan,H.Y.、Mrva,D.、Sinha,R.和Tranter,S.E.(2006年)。CU-HTK广播新闻转录系统的进展。IEEE音频、语音和语言处理学报,14(5),1513\u20131525。”,“期刊标题”:“IEEE音频和语言处理杂志”},{“key”:“9944_CR17”,“doi-asserted-by”:“publisher”,“doi”:“10.1007\/s10772-020-09717-8”,“author”:“J Guglani”,“year”:“2020”,“unstructured”:“Guglani,J.,&Mishra,A.N.(2020)基于DNN的Kaldi工具箱上的旁遮普语连续语音识别系统。国际语音技术杂志。https:\/\/doi.org\/10.1007\/s10772-020-09717-8“,”journal-title“:”International journal of Speech Technology“},{“key”:“9944_CR18”,“首页”:“357”,“卷”:“4”,“作者”:“T Hain”,“年份”:“2007”,“非结构化”:“Hain,T.,Burget,L.,Dines,J.,Garau,G.,Wan,V.,Karafi,M.,Vepa,J.和Lincoln,M.(2007)会议演讲转录的AMI系统。IEEE声学、语音和信号处理国际会议论文集,4,357\u2013360视听语音识别中的时间多模式学习。收录于:IEEE计算机视觉和模式识别会议论文集,第3574\u20133582页“,”DOI“:”10.1109\/CVPR.2016.389“},{”key“:”9944_CR20“,”first page“:“661”,”volume“:4”,”author“:”R Hu“,”year“:”2007“,”unstructured“:”Hu,R.,&Zhao,Y.(2007)会话语音识别中语音决策树状态关联的贝叶斯方法。IEEE声学、语音和信号处理国际会议论文集,4661\u2013664先进的多媒体处理实验室。康奈尔大学。2020年6月检索自http://\/chenlab.ece.connell.edu\/projects\/AudioVisualSpeechProcessing。“},{”key“:”9944_CR22“,”doi asserted by“:”crossref“,”nonstructured“:”Hwang,M.,Wang,W.,Lei,X.,Zheng,J.,Cetin,O.,&Peng,G.(2007)。普通话广播语音识别的进展。在:国际语音通信协会第八届年会论文集,pp.2613\u20132616“,”doi“:”10.21437\/Interspeech.2007-589“},{“issue”:“1\u20132”,“key”:“9944_CR23”,“doi-asserted-by”:“crossref”,“first page”:”116“,“doi”:“10.1016\/j.cviu.2006.10.019”,“volume”::“108”,“author”:“A Jaimes”,“year”:“2007”,“unstructured”:“Jaimes,A.,&Sebe,N.(2007)。多模态人机交互:一项调查。计算机视觉与图像理解,108(1\u2013),116\u2013134。”,“journal-title”:“计算机视觉和图像理解”},{“issue”:“9”,“key”:“9944_CR24”,“doi-asserted-by”:“crossref”,“first-pages”:“1635”,“doi”:“10.1109\/JPROC.2015.2459017”,“volume”:《103》,“author”:“AK Katsaggelos”,“year”:“2015”,“unstructured”:“Katsagelos,A.K.,Bahaadini,S.,&Molina,R.(2015)视听融合:挑战和新方法。《IEEE学报》,103(9),1635\u20131653。“,“期刊标题”:“IEEE学报”},{“期”:“3”,“键”:“9944_CR25”,“doi-asserted-by”:“crossref”,“首页”:“226”,“doi”:“10.1109\/34.667881”,“卷”:“20”,“作者”:“J Kittler”,“年份”:“1998”,“非结构化”:“Kittler,J.,Hatef,M.,Duin,R.P.W.,&Matas,J.(1998年).关于组合分类器。IEEE Transactions on Pattern Analysis and Machine Intelligence,20(3),226\u2013239.“,”journal-title“:”IEEE Translations on Patterm Analysis and Machine Inteligence“},{“issue”:“4”,“key”:“9944_CR26”,“doi-asserted-by”:“crossref”,“first-page”:“981”,“doi”:“10.1007\/s10044-017-0655-2”,“volume”:”20“author”:“M Koziarski”,“year”:“2017”,“unstructured”:“”Koziarski,M.、Krawczyk,B.和Wozniak,M.(2017年)。构造分类器集合的确定性子空间方法。模式分析与应用,20(4),981\u2013990.”,“日志标题”:“模式分析与运用”},{“问题”:“2”,“关键”:“9944_CR27”,“doi-asserted-by”:“交叉引用”,“首页”:“427”,“doi”:“10.1007\/s10044-015-055-z”,“卷”:“20”,“作者”:“B Krawczyk”,“年份”:“2017”,“非结构化”:“Krawc zyk,B.,&Cyganek,B.(2017).为一类分类集合选择本地专用分类器。模式分析与应用,20(2),427\u2013439.“,”日记标题“:”模式分析与运用“},{“问题”:“7”,“关键”:“9944_CR28”,“doi-asserted-by”:“crossref”,“首页”:“1394”,“doi”:“10.1109\/TASL.2009.2015084”,“卷”:“17”,“作者”:“N Krishnamurthy”,“年份”:“2009”,“非结构化”:“Krishnavurthy,N.,&Hansen,J.(2009)杂音:建模、分析和应用。IEEE音频、语音和语言处理学报,17(7),1394\u20131407。“,”journal-title“:”IEEE语音、语言处理学报“},{”issue“:”1“,”key“:”9944_CR29“,”doi-asserted-by“:”crossref“,”first-pages“:”2“,”doi“:”10.1007\/s10044-003-0199-5“,”volume“:“7”,”author“:”CL Liu“,”year“:”2004“,”unstructured“:”Liu,C。L.,Hao,H.和Sako,H.(2004)。用于组合分类器的置信度转换。模式分析与应用,7(1),2\u201317.“,”journal-title“:”Pattern Analysis and Applications“},{“issue”:“2”,“key”:“9944_CR30”,“doi-asserted-by”:“crossref”,“first page”:”198“,“doi”:“10.1109\/34.982900”,“volume”:《24》,“author”:“I Matthews”,“year”:“2002”,“unstructured”:“Matthews,I.,Cootes,T.,Bangham,J.A.,Cox,S.,&Harvey,R.(2002)提取唇读视觉特征。《IEEE模式分析和机器智能学报》,24(2),198\u2013213.“,”journal-title“:”IEEE Transactions on Pattern Analysis and Machine Intelligence“},{”issue“:”5588“,”key“:”9944_CR31“,”doi-asserted-by“:”crossref“,”first-page:“746”,“doi”:“10.1038\/2647446a0”,“volume”:“264”,“author”:“H McGurk”,“year”:“1976”,“unstructured”:“”McGurk,H.和MacDonald,J.(1976年)。听到嘴唇,看到声音。《自然》,264(5588),746\u2013748.“,”期刊标题:“自然”},{“期刊”:“2”,“密钥”:“9944_CR32”,“doi断言”:“交叉引用”,“第一页”:“327”,“doi”:“10.1007\\s10044-012-0313-7”,“卷”:“17”,“作者”:“N Najkar”,“年份”:“2014”,“非结构化”:“Najkar,N.,Razzazi,F.,&Sameti,H.(2014)一种基于HMM的连续语音识别系统的进化解码方法。模式分析与应用,17(2),327\u2013339。”,“期刊标题”:“模式分析与应用”,{“key”:“9944_CR33”,“非结构化”:“Ngiam,J.,Khosla,A.,Kim,M.,Nam,J.,Lee,H.,Ng,A.(2011)。多模式深度学习。在:第28届机器学习国际会议论文集,pp.689\u2013696”,{“issue”:“4”,“key”:“9944_CR34“,”doi-asserted-by“:”crossref“,”first page“:”722“,”doi“:”10.1007\/s10489-014-0629-7“,“volume”:“42”,“author”:“K Noda”,“year”:“2015”,“unstructured”:“野田佳彦,山口,Y.,Nakadai,K.,Okuno,H.G.,&Ogata,T.(2015)。使用深度学习的视听语音识别。应用情报,42(4),722\u2013737.“,“新闻标题”:“应用情报”},{“key”:“9944_CR35”,“doi-asserted-by”:“crossref”,“unstructured”:“Pao,T.,Liao,W.,Wu,T.和Lin,C.(2009)用于汉语视听语音识别的自动视觉特征提取。摘自:IEEE系统、人与控制论国际会议论文集,第2936\u20132940页,“DOI”:“10.1109\/ICSMC.2009.5346011”},{“问题”:“3”,“关键”:“9944_CR36”,“DOI-asserted-by”:“crossref”,“第一页”:“423”,”DOI“:”10.1109\/TASL.2008.2011515“,”卷:“17”,“作者”:“G Papandreou”,“年份”:“2009”,“非结构化”:“Papandreou,G.、Katsamanis,A.、Pitsikalis,V.和Maragos,P.(2009年)。基于不确定性补偿的自适应多模态融合及其在视听语音识别中的应用。《音频、语音和语言处理学报》,17(3),423\u2013435.“,”journal-title“:”Transactions on Audio,Speech,and Language Processing“},{”issue“:”9“,”key“:”9944_CR37“,”doi-asserted-by“:”crossref“,”first-page:“1306”,“doi”:“10.1109\/JPROC.2003.817150”,“volume”:“91”,“author”:“G Potamianos”,“year”:“2003”,“unstructured”:“”Potamianos,G.、Neti,C.、Gravier,G.,Garg,A.和Senior,A.W.(2003)。视听语音自动识别的最新进展。《IEEE学报》,91(9),1306\u20131326.“,”journal-title“:”Proceedings of the IEEE“},{”issue“:”3“,”key“:”9944_CR38“,”doi-asserted-by“:”crossref“,”first page“:“193”,“doi”:“10.1023\/A:1011352422845”,“volume”:“4”,“author”:“G Potamianos”,“year”:“2001”,“unstructured”:“Potamian,G.,Neti,C.,Iyengar,G.Senior,A.W.和Verma,A.(2001)。级联可视前端,用于独立于扬声器的自动语音读取。国际语音技术杂志,4(3),193\u2013208.“,“Journal-title”:“International Journal of Speech Technology”},{“issue”:“2”,“key”:“9944_CR39”,“doi-asserted-by”:“crossref”,“first-page”:“297”,“doi”:“10.1007\/s10044-013-0351-9”,卷:“18”,“author”:“OJ Prieto”,“year”:“2015”,“unstructured”:“Prieto,O.J.,Alonso-Gonz\u00e1莱兹,C。J.,&Rodr\u00edguez,J.J.(2015)。多变量时间序列分类的叠加。模式分析与应用,18(2),297\u2013312.“,”journal-title“:”Pattern Analysis and Applications“},{”issue“:”4“,”key“:”9944_CR40“,”doi-asserted-by“:”crossref“,”first page“:“219”,“doi”:“10.1007\/s10772-010-9080-2”,“volume”:“13”,“author”:“A Puurula”,“year”:“2010”,“unstructured”:“Puurola,A.,&Van Compernolle,D.(2010).使用发音音节模型的双流语音识别。国际语音技术杂志,13(4),219\u2013230.“,“Journal-title”:“International Journal of Speech Technology”},{“issue”:“2”,“key”:“9944_CR41”,“doi-asserted-by”:“crossref”,“first-page”:“257”,“doi”:“10.1109\/5.18626”,“volume”:“77”,“author”:“L Rabiner”,“year”:“1989”,“unstructured”:“Rabiner,L.(1989)。关于语音识别中的隐马尔可夫模型和选定应用程序的教程。IEEE Proceedings of the IEEE,77(2),257\u2013286.“,“journal-title”:“IEEE Processions of the IEEE.”},{“key”:“9944_CR59”,“doi-asserted-by”:“publisher”,“unstructured”:“Sad G.D.,Terissi L.D.,G\u00f3mez J.C.(2017).噪声条件下视听语音识别的决策级融合.in C.Beltr\u00e1n-Casta\u00f1\u00f 3n,I.Nystr\u00 f6m,F。Famili(编辑),模式识别、图像分析、计算机视觉和应用进展。CIARP 2016。计算机科学课堂讲稿(第10125卷)。查姆:斯普林格。https:\/\/doi.org\/10.1007\/978-3-319-52277-7_44.“,”doi“:”10.1007\/9783-319-52277-7_44“},{“问题”:“1”,“密钥”:“9944_CR42”,“doi-asserted-by”:“crossref”,“首页”:“34”,“doi”:“10.3103\/S1060992X14010068”,“卷”:“23”,“作者”:“AV Savchenko”,“年份”:“2014”,“非结构化”:“Savchenko”、A.V.和YaI,K.(2014)关于神经网络算法在视听语音识别系统中人脸视频视位分类问题中的应用。光学存储器和神经网络(信息光学),23(1),34\u201342.“,”journal-title“:”Optical Memory and Neural Networks(信息光学。E.和Singer,Y.(1999年)。使用可信度预测改进了提升算法。机器学习,37(3),297\u2013336.“,”杂志标题“:”机器学习“},{“问题”:“1”,“关键”:“9944_CR44”,“doi-asserted-by”:“crossref”,“首页”:“17”,“doi”:“10.1250\/ast.35.17”,“卷”:“35”,“作者”:“P Shen”,“年份”:“2014”,“非结构化”:“Shen,P.,Tamura,S.,&Hayamizu,S.(2014).多流稀疏表示特征,用于抗噪视听语音识别。声学科学与技术,35(1),17\u201327.“,“新闻标题”:“声学科学与科技”},{“问题”:“3”,“关键”:“9944_CR45”,“doi-asserted-by”:“crossref”,“首页”:“559”,“doi”:“10.1016\/j.patcog.2010.09.011”,“卷”:“44”,“作者”:“j Shin”,“年份”:“2011”,“非结构化”:“Shin,j.,Lee,j.和Kim,D.(2011年).用于孤立韩语单词识别的实时唇读系统。模式识别,44(3),559\u2013571.”,“新闻标题”:“模式识别”},{“问题”:“10”,“关键”:“9944_CR46”,“doi-asserted-by”:“交叉引用”,“首页”:“1692”,“doi”:“10.1109\/JPROC.2010.2057231”,“卷”:“98”,“作者”:“S Shivappa”,“年份”:“2010”,“非结构化”:“Shivappa-S.,Trivedi,M.,&Rao,B.(2010).人机界面和智能环境中的视听信息融合:一项调查。《IEEE学报》,98(10),1692\u20131715.“,”journal-title“:”Proceedings of the IEEE“},{”issue“:”2“,”key“:”9944_CR47“,”doi-asserted-by“:”crossref“,”first page“:“175”,“doi”:“10.1109\/TCYB.2013.2250954”,“volume”:“44”,“author”:“D Stewart”,“year”:“2014”,“unstructured”:“Stewart,D.,Seymour,R.,Pass,A.,&Ming,J.(2014).在噪声视听条件下的鲁棒视听语音识别。IEEE控制论汇刊,44(2),175\u2013184.“,“journal-title”:“IEEE控制学汇刊”},{“key”:“9944_CR48”,“doi-asserted-by”:“crossref”,“unstructured”:“St\u00fcker,S.,F\u00fcgen,C.,Burger,S.和W\u00f6lfel,M.(2006).用于连续语音识别的跨系统自适应和组合:音素集和声学前端的影响。摘自:第九届国际口语处理会议论文集(INTERSPEECH 2006-ICSLP),第521页,“DOI”:“10.21437”INTERSPEECH.2006-199“},{“key”:“9944_CR49”,“DOI-asserted-by”:“publisher”,“DOI:”10.1109\/TMM.2020.2975922“,“author”:“F Tao”,“year”:“2020”,“unstructured”:“Tao,F.,&Busso,C.(2020).具有多任务学习的端到端视听语音识别系统。IEEE多媒体汇刊。https:\/\/doi.org\/10.109\/TMM.2020.2975922“,”journal-title“:”IEEE多媒体事务“},{“issue”:“6”,“key”:“9944_CR50”,“first page”:”903“,”volume“:”16“,”author“:”LD Terissi“,”year“:”2010“unstructured”:“Terissi,L.D.,&G\u00f3mez,J.C.(2010)使用单个摄像头进行3D头部姿势和面部表情跟踪。《通用计算机科学杂志》,16(6),903\u2013920.“,”Journal-title“:”Journal of Universal Computer Science“},{“issue”:“2”,“key”:“9944_CR52”,“doi-asserted-by”:“crossref”,“first-page”:“293”,“doi”:“10.1007\/s10772-018-9504-y”,“volument”:“21”,“author”:“LD Terissi”,“year”:“2018”,“unstructured”:“Terissi,L.D.,Sad,G.D.,&G \u00f3mez,J。C.(2018)。用于音频、视频和视听语音分类的强大前端。国际语音技术杂志,21(2),293\u2013307.“,“新闻标题”:“国际语音技术期刊”},{“key”:“9944_CR51”,“doi-asserted-by”:“crossref”,“unstructured”:“Terissi,L.D.,Sad,G.D.,G\u00f3mez,J.C.,&Parodi,M.(2015a)基于小波和随机森林分类的视听语音识别方案。发表于:Pardo,A.和Kittler,J.(编辑),《模式识别、图像分析、计算机视觉和应用的进展》。CIARP 2015。计算机科学课堂讲稿(第9423卷,第567\u2013574页)。Cham:Springer”,“DOI”:“10.1007\/978-3-319-25751-8_68”},{“key”:“9944_CR58”,“DOI-asserted-by”:“publisher”,“unstructured”:“Terissi L.D.,Sad G.D.,G\u00f3mez J.C.,&Parodi M.(2015b)。基于组合视听分类器的噪声语音识别。In F.Schwenker,S.Scherer,L.P.Morency(Eds.),人机交互中社会信号的多模式模式识别。2014年MPRSS。计算机科学课堂讲稿(第8869卷)。查姆:斯普林格。https:\/\/doi.org\/10.1007\/978-3-319-14899-1_5.“,”doi“:”10.1007\/9783-319-14899-1_5“},{“问题”:“3”,“密钥”:“9944_CR53”,“doi-serted-by”:“crossref”,“首页”:“509”,“doi”:“10.1109\/TMM.2012.2233724”,“卷”:“15”,“作者”:“F Vallet”,“年份”:“2013”,“非结构化”:“Vallet、F.、Essid,S.和Carrive,J.(2013)电视谈话节目中说话人日记的多模式方法。IEEE多媒体汇刊,15(3),509\u2013520.“,“期刊标题”:“IEEE多媒体交易”},{“问题”:“3”,“密钥”:“9944_CR54”,“doi-asserted-by”:“crossref”,“首页”:“247”,“doi”:“10.1016\/0167-6393(93)90095-3”,“卷”:“12”,“作者”:“A Varga”,“年份”:“1993”,“非结构化”:“Varga,A.,&Steeneken,H.J.M.(1993)).自动语音识别评估II:NOISEX-92:研究加性噪声对语音识别系统影响的数据库和实验。语音通信,12(3),247\u2013251.“,“新闻标题”:“语音通信”},{“key”:“9944_CR55”,“doi-asserted-by”:“crossref”,“首页”:“209”,“doi”:“10.1016\/j.specom.2013.09.008”,“卷”:“57”,“作者”:“P Wagner”,“年份”:“2014”,“非结构化”:“Wagner,P.,Malisz,Z.,&Kopp,S.(2014)互动中的手势和言语:概述。语音通信,57,209\u2013232。“,“journal-title”:“语音通信”},{“key”:“9944_CR56”,“doi-asserted-by”:“crossref”,“unstructured”:“Zeiler,S.,Nicheli,R.,Ma,N.,Brown,G.J.,&Kolossa,D.(2016)使用噪声自适应线性判别分析的鲁棒视听语音识别。摘自:IEEE声学、语音和信号处理国际会议论文集,第2797\u20132801页,“DOI”:“10.1109\/ICASSP.2016.7472187”},{“问题”:“7”,“关键”:“9944_CR57”,“DOI-asserted-by”:“crossref”,“首页”:“1254”,“DOI:”10.1109\/TMM.2009.2030637“,“卷”:“11”,“作者”:“G Zhao”,“年份”:“2009”,“非结构化”:“Zhao,G.、Barnard,M.和Pietik\u00e4inen,M.(2009)。使用局部时空描述符进行唇读。IEEE多媒体汇刊,11(7),1254\u20131265.“,”日记标题“:”IEEE多媒体交易“}],”容器标题“:[”国际语音技术杂志“],”原文标题“:[],”语言“:”en“,”链接“:[{”URL“:”https:\/\/link.springer.com/content\/pdf\/10.10072\/s10772-021-09944-7.pdf“,”内容类型“:”应用程序\/pdf“content-version“:”vor“,”intended-application“:”text-mining“},{“URL”:“https:\/\/link.springer.com/article\/10.1007\/s10772-021-09944-7\/fulltext.html”,“content-type”:“text\/html”,“content-version”:“vor”,“intended-application”:“text-mining”},}“URL“https:\\/link.stringer.com/content\/pdf\/10.10007\/s10772-021-0944-7.pdf,“内容类型”:application \/pdf“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[[2022,3,15]],”date-time“:”2022-03-15T18:39:22Z“,”timestamp“:1647369562000},”score“:1,”resource“:{“primary”:{“URL”:“https:\\/link.springer.com/10.1007\/s10772-021-09944-7”}},“subtittle”:[],“short”标题“:[],”发布“:{”date-parts“:[2022,1,7]]},“references-count”:59,“journal-issue”:{“issue”:“1”,“published-print”:{“date-part”:[2022,3]]}},”alternative-id“:[”9944“],”URL“:”http://\/dx.doi.org\/10.10007\/s10772-021-099444-7“,”relation“:{}”,“ISSN”:[“1381-2416”,“1572-8110”],“ISSN-type”:[{“数值”:“1381-2416”,“类型”:“打印”},{“值”:“1572-8110”,“型号”:“电子”}],“subject“:[],”published“:{”date-parts“:[[2022,1,7]]},”assertion“:[{”value“:“2020年6月10日”,”order“:1,”name“:”received“,”label“:”received“,“group”:{“name”:“Article History”,“label”:“文章历史”}},{“value”:“2021年11月13日”}},{“值”:2022年1月7日“,”order“:3,”name“:”first_online“,”label“:”first online“,“group”:{“name”:“Article History”,“label”:“文章历史”}},{“order”:1,”name”:”Ethics“,”group“:利益冲突“}}]}}