国际标准协会 档案文件 2018年国际演讲
国际标准协会 档案文件 2018年国际演讲

融合声学数据、面部、手和手臂手势信息的法语-西班牙语多模态语音通信语料库

卢卡斯·特瑞西(Lucas D.Terissi)、冈萨洛·萨德(Gonzalo Sad)、毛里西奥·塞尔达(Mauricio Cerda)、斯利姆·乌尼(Slim Ouni)、罗德里戈·加尔维斯(Rodrigo Galvez)、胡安·哥梅斯(Juan C.Gómez)、伯纳德·

本文提出了一个双语多模态语音通信语料库,该语料库包含语音过程中与面部、手部和手臂手势相关的声学数据和视觉数据。该语料库包括不同的说话方式,包括脚本文本演讲、自然对话和自由演讲。语料库是用两种不同的语言编译的,即法语和西班牙语。描述了语料库记录的实验装置、采集协议和所使用的设备。还提供了关于发言者人数和性别、单词数、句子数和录音时间的统计数据。本文还对自发言语中言语、头部和手部动作之间的相关性进行了初步分析,结果表明,声音韵律特征与头部和手的手势有关。


doi:10.21437/Interspeech.2018-2212

引用:Terissi,L.D.、Sad,G.、Cerda,M.、Ouni,S.、Galvez,R.、Gómez,J.C.、Girau,B.、Hitschfeld-Kahler,N.(2018)《融合声学数据、面部、手部和手臂手势信息的法语-西班牙语多模态语音通信语料库》。程序。Interspeech 2018年,2778-2782年,doi:10.21437/Interspeech.2018-2212

@正在处理{terissi18_interspeech,author={卢卡斯·德瑞西(Lucas D.Terissi)、冈萨洛·萨德(Gonzalo Sad)、莫里西奥·塞尔达(Mauricio Cerda)、斯利姆·乌尼(Slim Ouni)、罗德里戈·加尔维斯(Rodrigo Galvez)、胡安·戈梅斯(Juan C.Gómez)、伯纳德·吉,title={{一个融合声学数据、面部、手和手臂手势信息的法语-西班牙语多模态语音通信语料库}},年份=2018年,booktitle={Proc.Interspeech 2018},页数={2778--2782},doi={10.21437/Interspeech.2018-2212},issn={2958-1796}}