IberSPEECH 2018:西班牙巴塞罗那
乔迪·卢克 , 安东尼奥·博纳方特 , 弗朗西斯科·阿利亚斯·普约尔 , 安托尼奥·J·S·特谢拉 :
第四届国际会议,2018年IberSPEECH,西班牙巴塞罗那,2018年11月21日至23日,会议记录。 国际标准协会 2018
说话人识别
维多利亚·明戈特 , 安东尼奥·米格尔 , 阿方索·奥尔特加 , 爱德华多·莱伊达 :
文本相关说话人验证中编码说话人和短语信息的可差分监督抽取。 1-5 伊格纳西奥·维纳尔斯 , 阿方索·奥尔特加 , 安东尼奥·米格尔 , 爱德华多·莱伊达 :
语音变异对说话人验证中短句的影响。 6-9 乌迈尔·汗 , Pooyan野生动物园 , 哈维尔·埃尔南多 :
用于说话人聚类的受限Boltzmann机器向量。 10-14 埃丝特·里图埃托·冈萨雷斯 , 阿森西翁·加拉多·安托林 , 卡门·佩莱兹·莫雷诺 :
压力条件下的说话人识别。 15-19
主题演讲1
坦尼娅·舒尔茨 :
基于生物信号的口语交流。
语音技术专题
阿尔卑斯山 , 米雷亚·法鲁斯 , 安东尼奥·博纳方特 :
用于口语翻译的双语韵律数据集编译。 20-24 库勒比湾 , 阿尔卑斯山 :
为加泰罗尼亚语构建开放源代码自动语音识别系统。 25-29岁 Oriol烧烤 , 安东尼奥·博纳方特 , 圣地亚哥·帕斯科尔 :
多扬声器神经声码器。 30至34 安德烈斯·皮涅罗·马汀 , 卡门·加西亚·马特奥 , 劳拉·多西奥·费尔南德斯 :
通过改进Laguage模型来改进自动语音识别。 35-39 莫尼卡·多明格斯 , 艾丽西亚·布尔加 , 米雷亚·法鲁斯 , 利奥·万纳 :
面向TTS中用于朗读应用程序的表达性韵律生成。 40-44 亚历杭德罗·戈梅斯·阿兰尼斯 , 安东尼奥·佩纳多 , 何塞·安德烈斯·冈萨雷斯·洛佩斯 , 安吉尔·M·戈麦斯 :
基于深层特征的ASV欺骗检测系统前端和后端技术的性能评估。 45-49 伊戈尔·奥德里奥佐拉 , 英玛·埃尔纳兹 , 伊娃·纳瓦斯 , 路易斯塞拉诺 , 乔恩·桑切斯 :
沉默的观察可能性:VAD应用的分析和展望。 50-54 克里斯蒂安·萨拉米亚 , 里卡多·德·科尔多瓦 , 路易斯·费尔南多·德哈罗 , 鲁宾·圣塞贡多 , 哈维尔·费雷罗斯 :
关于使用基于语音的嵌入进行语言识别。 55-59 劳拉·克罗斯·维拉 , 卡洛斯·埃斯科拉诺 , 何塞·A·R·福诺洛萨 , Marta R.Costa-jussá :
使用Transformer进行端到端语音翻译。 60-63 哈维尔·达尔纳·塞奎罗斯 , 多罗托·托莱达诺 :
谷歌音频集数据库上的音频事件检测:使用不同类型DNN的初步结果。 64至67 米凯尔·德贝拉斯科 , 拉奎尔·朱斯托 , Josu Antón先生 , 米凯尔·卡里略 , M.Inés Torres先生 :
语音和文本的情感检测。 68-71 达里奥·蒂尔夫斯·圣地亚哥 , 伊恩·本德利特 , 卡门·加西亚·马特奥 :
手语自动识别实验框架设计。 72-76 凯西奥·巴蒂斯塔 , 安娜·拉里萨·迪亚斯 , 尼尔森·C·桑帕约·内托 :
使用Kaldi工具的巴西葡萄牙语基线声学模型。 77-81
ASR和语音应用程序
保拉·洛佩斯·奥特罗 , 劳拉·多西奥·费尔南德斯 :
查询示例口语文档检索中用于减少性别差异的转换梅尔-卡斯特拉尔系数。 82-86 巴勃罗·吉梅诺 , 伊格纳西奥·维纳尔斯 , 阿方索·奥尔特加 , 安东尼奥·米格尔 , 爱德华多·莱伊达 :
广播域数据音频分割的递归神经网络方法。 87-91 埃米利奥·格拉内尔 , 卡洛斯·大卫·马丁内斯·希纳雷霍斯 , 维罗尼卡·罗梅罗 :
以多模式和互动的方式改进手稿的转录。 92-96 克里斯蒂安·特杰多·加西亚 , 瓦伦蒂恩·卡德尼索·帕约 , 玛丽亚·马库卡 , 大卫·埃斯库德罗·曼塞博 , 安东尼奥·雷奥斯 , 木村拓哉 :
使用Japañol CAPT工具改善日语母语者的西班牙语发音。 康拉德·贝纳特 , 艾托·阿尔瓦雷斯 , 哈里兹·阿泽卢斯 , 卡洛斯·大卫·马丁内斯 :
探索新语言的E2E语音识别系统。 102-106
语音和语言技术在健康领域的应用
斯内哈·拉曼 , 英玛·埃尔纳兹 , 伊娃·纳瓦斯 , 路易斯塞拉诺 :
听喉切除术:一项关于西班牙语食管语音清晰度和自我报告听力努力的研究。 107-111 马里奥·科拉莱斯·阿斯托加诺 , 帕斯托拉·马丁内斯·卡斯蒂利亚 , 大卫·埃斯库德罗·曼塞博 , 劳德斯·阿吉拉尔 , 塞萨尔·冈萨雷斯·费雷拉斯 , 瓦伦蒂恩·卡德尼索·帕约 :
唐氏综合征患者韵律的自动评估。 112-116 圣地亚哥·帕斯科尔 , 安东尼奥·博纳方特 , 琼·塞拉 , 何塞·安德烈斯·冈萨雷斯·洛佩斯 :
用生成对抗网络实现口哨到清音的口咽语音转换。 117-121 路易斯塞拉诺 , 大卫·塔瓦雷斯 , Xabier Sarasola公司 , 斯内哈·拉曼 , 伊本·萨拉特萨加 , 伊娃·纳瓦斯 , 英玛·埃尔纳兹 :
基于LSTM的喉切除术语音转换。 第122页至第126页 祖扎纳·帕切塔 , 卡洛斯·大卫·马丁内斯·希纳雷霍斯 :
基于神经网络的手语手势分类。 127-131
合成、生产和分析
马克·弗雷克斯 , 马克·阿内拉 , 琼·克劳迪·索科尔 , 弗朗西斯科·阿利亚斯·普约尔 , Oriol Guasch公司 :
时态、模态和松发音对元音三维有限元合成的影响[A]。 132-136 康西奥库尼亚 , 塞缪尔·席尔瓦 , 安托尼奥·J·S·特谢拉 , 卡塔琳娜·奥利维拉 , 保拉·马丁斯 , 阿伦·约瑟夫 , 延斯·弗拉姆 :
探索欧洲葡萄牙语语音生成研究的实时MRI进展。 137-141 胡安·马丁·多纳斯 , 伊万·洛佩斯·埃斯佩霍 , 安吉尔·M·戈麦斯 , 安东尼奥·佩纳多 :
双麦克风智能手机的后过滤方法。 142-146年 Xabier Sarasola公司 , 伊娃·纳瓦斯 , 大卫·塔瓦雷斯 , 路易斯塞拉诺 , 伊本·萨拉特萨加 :
使用音高参数进行语音和单声道歌唱分割。 147-151 圣地亚哥·帕斯科尔 , 安东尼奥·博纳方特 , 琼·塞拉 :
自主语言声学解码器。 152-156
主题演讲2
罗布·克拉克 :
合成语音合成的韵律变化。
特别会议: 显示并告知
克里斯蒂安·特杰多·加西亚 , 瓦伦蒂恩·卡德尼索·帕约 , 大卫·埃斯库德罗·曼塞博 :
Japañol:一款帮助以日语为母语的人改善西班牙语发音的移动应用程序。 157-158
特别会议: 正在进行的研究项目
胡安·曼努埃尔·埃斯宾 , Roberto字体 , 胡安·弗朗西斯科·英格尔(Juan Francisco Ingles-Romero) , 克里斯蒂娜·维森特·奇科特 :
面向生物识别系统中全球服务质量指标的应用。 159-160 大卫·埃斯库德罗·曼塞博 , Valentín Cardeñoso Payo女士 :
在学习视频游戏中加入口语制作质量自动预测模块。 161-162 何塞·安德烈斯·冈萨雷斯·洛佩斯 , 菲尔·D·格林 , 达米安·墨菲 , 阿米莉亚·简·格利 , 詹姆斯·吉尔伯特 :
无声演讲:为喉咙被切除的人恢复演讲能力。 163-165 因玛·埃尔南德斯 , 伊娃·纳瓦斯 , 何塞·安东尼奥·穆尼西奥·马汀 , 哈维尔·戈麦斯·苏亚雷斯 :
恢复项目:重新配对、储存和恢复语言能力。 166-169年 亚松森·莫雷诺 , 安东尼奥·博纳方特 , 伊戈尔·尤克 , 莱亚·塔雷斯 , 维克托·佩雷拉 :
网络欺凌预防语料库。 170-171 M.Inés Torres先生 , 杰拉德胆汁 , 塞萨尔黑山 , 乔夫雷·特诺里奥·拉兰加 , 奥尔加·戈迪瓦 , 安娜·埃斯波西托 , 科尼利厄斯·格拉金 , 斯蒂芬·施洛格尔(Stephan Schlögl) , 奥利维尔·德鲁 , 贝戈尼亚·费尔南德斯·鲁安诺娃 , 罗伯托·桑塔纳 , 玛丽亚·斯泰利亚努·科尔斯内斯 , 弗雷德·林德纳 , 达丽亚·基斯利斯卡 , 米里亚姆·雷纳 , Gennaro Cordasco公司 , 玛丽·阿克斯内斯 , 拉奎尔·朱斯托 :
富有同情心、善于表达、先进的虚拟教练,提高老年人的独立健康寿命。 172-173
特别会议: 博士论文
埃米利奥·格拉内尔 , 卡洛斯·大卫·马丁内斯·希纳雷霍斯 , 维罗尼卡·罗梅罗 :
基于多模态、互动和众包的历史手稿转录研究进展。 174-178 艾丽西娅·洛扎诺·迪兹 , 华金·冈萨雷斯-罗德里格斯 , 哈维尔·冈萨雷斯·多明格斯 :
基于DNN的语言和说话人识别中的语音瓶颈和嵌入表示。 179-183 奥米德·加哈比 :
i-Vector演讲者和语言识别的深度学习:博士论文综述。 184-188 伊戈尔·雅克 :
表达性语音合成的无监督学习。 189-193
Albayzin面临的挑战: 多模态分解
本杰明·莫里斯 , 埃尔维·布雷丁 , 殷瑞清 , 何塞·帕蒂诺 , 赫克特·德尔加多 , 克劳德·巴拉斯 , 尼古拉斯·W·D·埃文斯 , 卡米尔·吉尼奥多 :
ODESSA/PLUMCOT参加2018年Albayzin多式联检挑战赛。 194-198 Miquel Angel印度马萨纳 , 伊齐亚尔·萨加斯蒂贝里 , 蓬巴劳 , 伊丽莎·赛罗尔 , 约塞普·拉蒙·莫罗斯 , 哈维尔·埃尔南多 :
UPC 2018 Albayzin Challenge的多模扬声器识别系统。 199-203 爱德华多·拉莫斯·穆盖尔扎 , 劳拉·多西奥·费尔南德斯 , 何塞·路易斯·阿尔巴·卡斯特罗 :
GTM-UVIGO系统用于音像设备的分光。 204-207
Albayzin面临的挑战: 扬声器分辨率
迭戈·卡斯坦 , 米切尔·迈凯轮 , 马赫什·库马尔·南瓦纳 :
2018年IberSPEECH-RTVE扬声器日记挑战赛的SRI国际STAR-LAB系统说明。 208-210 何塞·帕蒂诺 , 赫克特·德尔加多 , 尹瑞清(Ruiqing Yin) , 埃尔维·布雷丁 , 克劳德·巴拉斯 , 尼古拉斯·W·D·埃文斯 :
ODESSA参加2018年Albayzin演讲者日记挑战赛。 211-215 奥米德·加哈比 , 沃尔克·菲舍尔 :
EML提交给2018年Albayzin演讲者日记挑战赛。 216-219 伊格纳西奥·维纳尔斯 , 巴勃罗·吉梅诺 , 阿方索·奥尔特加 , 安东尼奥·米格尔 , 爱德华多·莱伊达 :
RTVE 2018 Dialization Challenge的域内适应解决方案。 220-223 艾丽西娅·洛扎诺·迪兹 , 贝尔特兰·拉布拉多 , 迭戈·德贝尼托 , 巴勃罗·拉米雷斯 , 多罗托·托莱达诺 :
2018年Albayzin IberSPEECH-RTVE评估AuDIaS-UAM系统中基于DNN的说话人区分嵌入。 224-226 爱德华·坎贝尔 , 加布里埃尔·埃尔南德斯 , 何塞·拉蒙·卡尔沃·德拉拉 :
CENATAV 2018年Albayzin发言人日记化评估活动语音组系统。 227-230 阿巴斯·科斯拉瓦尼 , 科尼利厄斯·格拉金 , 纳齐姆·杜根 , 杰拉德胆汁 , 奈杰尔罐头 :
IberSPEECH-RTVE 2018扬声器日记挑战智能语音系统。 231-235 黄子立 , L.保拉·加西亚-佩雷拉 , 杰苏斯·维拉尔巴 , 丹尼尔·波维 , 纳吉姆·德哈克 :
JHU隔离系统说明。 236-239
Albayzin面临的挑战: 语音搜索
保拉·洛佩斯·奥特罗 , 劳拉·多西奥·费尔南德斯 :
GTM-IRLab Systems for Albayzin 2018语音评估搜索。 240-244 玛丽亚·卡贝洛 , Doroteo T.托莱达诺 , 哈维尔·特杰多尔 :
AUDIAS-CEU:一种独立于语言的方法,用于2018年ALBAYZIN语音搜索评估的示例查询口语术语检测任务。 245-248 路易斯·哈维尔·罗德里格斯-富恩特斯 , 米凯尔·佩尼亚加里卡诺 , 安帕罗·瓦罗纳 , Germanán Bordel公司 :
2018年Albayzin语音评估搜索的GTTS-EHU系统。 249-253 安娜·R·蒙塔尔沃 , 何塞·M·拉米雷斯 , 亚历杭德罗·罗伯 , 何塞·卡尔沃 :
Cenatav语音组系统,用于2018年Albayzin语音评估搜索。 254-256
Albayzin面临的挑战: 语音到文本
哈维尔·豪尔赫 , 阿德里亚·A·马丁内斯·维拉隆加 , 帕维尔·戈利克 , 阿德里亚·吉梅内斯 , 琼·阿尔伯特·西尔维斯特·塞尔达 , 帕特里克·多奇 , 维森特·安德烈·西斯卡 , 赫尔曼·奈伊 , 阿尔芬斯·胡安 , 阿尔伯特·桑希斯 :
2018年IberSpeech-RTVE演讲-文本转录挑战赛MLLP-UPV和RWTH亚琛西班牙ASR系统。 257-261 胡安·佩雷罗·科多塞罗 , 哈维尔·安托恩·马汀 , 丹尼尔·塔皮亚斯·梅里诺 , 爱德华多·洛佩斯·冈萨洛 , 路易斯·埃尔南德斯·戈麦斯 :
探索开放源代码深度学习ASR用于演讲到文本电视节目转录。 262-266 哈里兹·阿泽卢斯 , 艾托·阿尔瓦雷斯 , 康拉德·伯纳斯 , Eneritz García公司 , 埃米利奥·格拉内尔 , 卡洛斯·大卫·马丁内斯·希纳雷霍斯 :
2018年IberSPEECH-RTVE语音到文本转录挑战赛的Vicomtech-PRHLT语音转录系统。 267-271 纳齐姆·杜根 , 科尼利厄斯·格拉金 , 杰拉德胆汁 , 奈杰尔罐头 :
2018年Iberspeech语音到文本转录挑战智能语音ASR系统。 272-276 劳拉·多西奥·费尔南德斯 , 卡门·加西亚·马特奥 :
2018年Albayzin的GTM-UVIGO系统演讲-文本评估。 277-280
文本和NLP应用程序
安娜·蓬皮利 , 阿尔贝托·阿巴德 , 大卫·马丁斯·德·马托斯 , 伊莎贝尔·帕夫·马丁斯 :
阿尔茨海默病分类的主题连贯性分析。 281-285 埃斯兹特·伊克洛迪 , 加博尔·雷茨基 , 加博尔·博贝里 , 玛丽亚·何塞·卡斯特罗·布莱达 :
构建语义技术的全球词典。 286-290 胡安·玛丽亚·加里多 , 玛尔塔·科迪纳 , 金伯·福吉 :
TransDic是一个公共领域工具,用于生成标准方言西班牙语和加泰罗尼亚语的语音词典。 291-295 豪尔赫·伦巴特 , 安东尼奥·米格尔 , 阿方索·奥尔特加 , 爱德华多·莱伊达 :
用于自动文本标点的宽残差网络1D。 296-300 尤金尼奥·里贝罗 , 里卡多·里贝罗 , 大卫·马丁斯·德·马托斯 :
端到端多级对话动作识别。 301-305
主题演讲3
路易斯·马奎兹 :
自动问答:问题解决了吗?
圆桌会议
玛尔塔·R·科斯塔 :
关于语音技术的小组讨论:工业和学院。