19.2017年SPECOM:英国哈特菲尔德
阿列克谢·卡尔波夫 , Rodmonga Potapova公司 , Iosif Mporas公司 :
演讲与计算机——第19届国际会议,2017年SPECOM,英国哈特菲尔德,2017年9月12-16日,会议记录。 计算机科学课堂讲稿 10458, 施普林格 2017 ,国际标准图书编号 978-3-319-66428-6
受邀会谈
马克·J·F·盖尔斯 , 凯特·尼克尔 , 安东·拉格尼 :
低资源语音识别和关键字定位。 3-19 比约恩·舒勒 :
大数据,深度学习-在X射线扬声器分析的边缘。 20-34
会议文件
Niksa Jakovljevic , 伊万·D·约基奇 , 斯洛博丹·约西奇 , 弗拉多·德里克 :
基于协方差矩阵和i向量的说话人识别的比较。 37-45 奥利弗·约基什 , 霍斯特·乌多·海恩 :
一种可训练的德语专有名词语音相似性搜索方法。 46-55 迈克拉·斯特林泽尔 , 瓦西里萨·维尔霍达诺娃 , 费多·贾林格 , 罗尔·琼克斯 , 马特·科尔 :
帕金森病伴或不伴轻度认知障碍患者元音发音的声学和知觉相关性:初步研究。 56-64 英戈·西格特 , 奥利弗·约基什 , 艾丽西娅·弗洛雷斯-洛茨 , 弗兰齐斯卡·特罗扬 , 马丁·梅萨罗斯 , 迈克尔·马鲁什克 :
环绕声感知评估的声学线索。 65-75 伊万·梅登尼科夫 , 阿列克塞·罗曼年科 , 阿列克谢·普鲁德尼科夫 , 瓦伦丁·门捷列夫 , 尤里·霍克洛夫 , 马克西姆·科尔内夫斯基 , 娜塔莉亚·托马申科 , 亚历山大·扎特沃尼茨基 :
OpenKWS 2016评估STC关键字搜索系统中的声学建模。 76-86 费德里科·兰迪尼 , 露西亚娜·费雷尔 , 霍拉西奥·佛朗哥 :
稀疏训练数据语音评分的自适应方法。 87-97 Sri Harsha Dumpala先生 , K.N.R.K.拉朱·阿鲁里 :
一种检测自然语音中呼吸音的算法及其在说话人识别中的应用。 98-108 法希姆·A·萨利姆 , 法西赫·海德尔 , 欧文·康兰 , 萨图尼诺·卢兹 :
探索视频的另一种方法。 109-118 Jan Svec公司 , 卢博斯·斯米德尔 , 约瑟夫·普苏特卡 :
基于RNN的口语词汇检测训练分析。 119-129 Anastasiia Spirina公司 , Olesia Vaskovskia公司 , 塔蒂亚娜·卡拉塞瓦 , 阿里娜·斯科罗霍德 , 伊娜·波伦斯卡亚 , 马克西姆·西多罗夫 :
人机对话交互质量建模中交互参数水平分析。 130-140 金德里奇·马图塞克 , 丹尼尔·蒂埃尔卡 :
注释错误检测:异常检测与分类。 141-151 奥列格·阿赫蒂亚莫夫 , 德米特里·乌布斯基 , 叶甫盖尼娅·费迪纳 , 阿列克塞·普加切夫 , 阿列克谢·卡尔波夫 , 沃尔夫冈·明克 :
你在对我说话吗? 人机对话中的多模式收件人检测。 152-161 Otilia Kocsis公司 , 巴兹利斯·克拉迪斯 , Anastasios Tsopanoglou公司 , 尼科斯·法科塔基斯 :
从最终用户的角度评估口语对话服务:可用性和经验。 162-170 加琳娜·拉夫伦提娃 , 谢尔盖·诺沃塞洛夫 , 埃戈尔·马利赫 , 亚历山大·科兹洛夫 , 奥列格·库达舍夫 , 瓦迪姆·施切梅林 :
音频重放攻击检测对策。 171-181 阿布苏德·哈纳尼 , 穆罕默德·阿姆莱 , 瓦西姆·巴兹布斯 , 萨利姆·萨拉梅 :
使用演讲、幻灯片和手势自动评估演讲技巧。 182-191 维拉·埃夫多基莫娃 , 帕维尔·A·斯克雷林 , 塔蒂亚娜·丘卡耶娃 :
俄语自动语音转录:语音变异建模。 192-199 埃米尔·侯赛因·普尔杰姆 , 苏海拉·赫萨拉基 , 萨伊德·萨法维 , 雨果·范·哈姆 , 穆罕默德·哈桑·巴哈里 :
从电话语音信号中自动检测吸烟者。 200-210 尤金·勒基亚内特 , 亚历山大·梅尔尼科夫 , 奥列格·库达舍夫 , 谢尔盖·诺沃塞洛夫 , 加琳娜·拉夫伦提娃 :
用于移动安全的双模反欺骗系统。 211-220 塔蒂亚娜·舍甫琴科 , 达里娅·波兹迪耶娃 :
加拿大英语单词重音:基于语料库的多语言社区民族认同研究。 221-232 伊斯特万·塞克雷内斯 , 吉尔吉斯·科瓦奇 :
使用深度神经网络对基于轮流和语调的正式和非正式对话进行分类。 233-243 安德烈·舒利帕 , 阿列克西·肖洛霍夫 , 尤里·马特维耶夫 :
在一组电话对话中聚集目标说话人。 244-252 Rodmonga Potapova公司 , Vsevolod Potapov公司 :
认知熵在外语交际伙伴情感模态状态感知-听觉评价中的应用。 253-261 尤根尼·U·克斯特尤琴科 , 罗曼·梅什切里亚科夫 , 达里娅·伊格纳蒂耶娃 , 亚历山大·皮亚特科夫 , 叶夫根尼·乔恩佐诺夫 , 利迪亚·N·巴拉茨卡亚 :
语音康复中音节的相关归一化与发音质量的比较评价。 262-271 马克·塔·尤佐娃 :
基于CRF的大规模TTS语音语料库短语边界检测。 272-281 穆罕默德·萨拉赫·阿勒迪 , 塔马斯·加博尔·萨波 , 盖萨·内梅特 :
连续声码器语音合成中的深度递归神经网络。 282-291 安德烈·巴拉巴诺夫 , 叶夫根尼·维库洛夫 :
双工模式在线回声抵消器的设计。 292-301 玛丽亚·斯凯普斯特特 , 瓦西里基·西马基 , 卡丽塔天堂 , 安德烈亚斯·凯伦 :
政治博客中立场和情绪修饰语的检测。 302-311 约瑟夫·查洛普卡 :
自动语音识别系统中斯拉夫语的数字到单词转换器。 312-321 哈利姆·萨尤德 , 西汉·瓦莫尔 , 佐拉·哈马达奇 :
基于声音的说话人识别——一种基于融合的方法。 322-331 艾兹尔·阿斯蒂加拉加 , 何塞·玛丽亚·马丁内斯·奥泽塔 , 伊戈尔·罗德里格斯 , 巴西利奥·塞拉 , 埃琳娜·拉兹卡诺 :
情感诗歌生成。 332-342 布拉尼斯拉夫·波波维奇 , 埃德文·帕科西 , 达科·佩卡尔 :
塞尔维亚语的端到端大词汇语音识别。 343-352 尼古拉斯痉挛 , 迈克尔·帕拉斯基瓦斯 , 伊西多洛斯·佩里科斯 , Iosif Mporas公司 :
考察特征选择对希腊语情感分析的影响。 353-361 伊琳娜·基皮亚特科娃 :
俄罗斯语音识别的TDNN/HMM混合声学模型实验。 362-369 埃默·吉尔马丁 , 本杰明·科恩 , 卡尔·沃格尔 , 尼克·坎贝尔 :
探索社交人机对话的多方闲聊。 370-378 塞德里克·法耶特 , 阿诺德·德海 , 达米安·洛维 , 皮埃尔·弗兰索瓦·马尔图 :
首次使用人格特征与韵律特征检测异常的实验。 379-388 普维·阿格拉瓦尔 , 赫曼特·帕蒂尔 :
基于非线性剩余相位和MFCC的新型Volterra Wiener滤波器的融合用于说话人验证。 389-397 瓦西里萨·维尔霍达诺娃 , 弗拉基米尔·沙普拉诺夫 , 伊琳娜·基皮亚特科娃 :
自发性言语中的迟疑:声学分析和检测。 398-406 Rodmonga Potapova公司 , Vsevolod Potapov公司 :
社会网络话语中的人作为非理性实体(多维方法)。 407-416 泰国儿子阮 , 凯文·基尔古尔 , 马蒂亚斯·斯珀伯 , 亚历克斯·魏贝尔 :
通过将I-vector和fMLLR与深度瓶颈网络相结合改进了说话人自适应。 417-426 彼得·米泽拉 , 彼得·波拉克 :
使用公开可用的语言资源改进因果捷克语的LVCSR。 427-437 萨伊德·萨法维 , Iosif Mporas公司 :
使用两种操作模式的分数级融合提高说话人识别系统的性能。 438-444 英戈·西格特 , 艾丽西娅·弗洛雷斯-洛茨 , 奥尔加·埃戈罗 , 安德烈亚斯·温德穆斯 :
利用心理声学建模和综合分析改进基于语音的情绪识别。 445-455 纳塔利娅·博格丹诺娃 :
在自发性言语中寻找句子边界。 456-463 加博尔·品特 , 奥利弗·约基什 , 水口信步 :
日本英语学习者宽焦点知觉和窄焦点知觉的声学相关性研究。 464-472 马库斯·米勒 , 塞巴斯蒂安·施蒂克 , 亚历克斯·魏贝尔 :
语言自适应多语言CTC语音识别。 473-482 埃德文·帕科西 , 布拉尼斯拉夫·波波维奇 , 达科·佩卡尔 :
塞尔维亚语基于深度神经网络语音识别系统的语言模型优化。 483-492 Rodmonga Potapova公司 , 莉莉娅·科马洛娃 :
社交网络语篇中“剥夺-攻击”情态关联的词汇语义指标。 493-502 Natalia Bogdanova-Beglarian公司 , 塔蒂亚娜·谢尔斯蒂诺娃 , 奥尔加·布利诺娃 , 格雷戈里·马丁尼科 :
日常俄语口语的语言特征和社会语言变异。 503-511 埃里克·爱德华兹 , 瓦尔沙龙 , 格雷戈·芬利 , 詹姆斯·冯 , 格雷格·卡迪夫 , 马克·米勒 , David Suendermann-左图 :
医学语音识别:与人类平等。 512-524 谢尔盖·萨利舍夫 , 伊利亚·克洛奇科夫 , 安德烈·巴拉巴诺夫 :
使用短时对数谱幅度估计器和频谱谐波/噪声分类器进行语音识别的频域麦克风阵列后滤波器。 525-534 阿比曼纽·波普利 , 阿伦·库马尔 :
多语言和混合语言语音语料库的多模式关键词搜索。 535-545 纳塔莉亚·马斯洛娃 , Vsevolod Potapov公司 :
神经网络Doc2vec在简短非正式文本自动情感分析中的应用。 546-554 兹比内克·扎伊奇 , 简·泽林卡 , 卢德克·米勒 :
电话语音说话人识别中的神经网络说话人描述符。 555-563 阿米·甘地 , 赫曼特·帕蒂尔 :
一种新的基于线性预测时间相位特征的说话人识别方法。 564-571 阿佩克莎·J·奈克 , Rishabh Tak公司 , 赫曼特·帕蒂尔 :
用于说话人验证的新型相位编码梅尔倒谱特征。 572-581 鲍里斯·洛巴诺夫 , 叶琳娜·卡内夫斯卡娅 , 弗拉基米尔·日特科 :
计算机辅助语音语调训练之路。 582-592 埃戈尔·马利赫 , 谢尔盖·诺沃塞洛夫 , 奥列格·库达舍夫 :
关于文本相关说话人验证任务中的剩余CNN。 593-601 埃琳娜·莱克索 , 奥尔加·V·弗洛洛娃 , 阿列克西·格里戈列夫 :
自闭症谱系障碍儿童的言语感知和声学特征。 602-612 马雷克·胡斯 , 彼得·萨拉伊卡 :
基于CNN的说话人变化检测系统中的相位分析和标记策略。 613-622 塔蒂亚娜·谢尔斯蒂诺娃 :
为韵律研究准备日常语音录音:ORD语料库案例。 623-631 Kohei Mukaihara公司 , Sakriani Sakti公司 , 中村佐治 :
使用经演讲者改编的DNN-CNN瓶颈功能识别情感色彩对话演讲。 632-641 Ryohei Ohno公司 , 马萨诺里·莫里斯 , 北原太郎 :
女性声音中的可爱感与持续时间的关系。 642-650 李蒙 , 阿鲁纳·谢诺伊 :
保留未识别面上的表达式。 651-661 米罗斯拉夫·拉瓦奇 , 伊凡·格鲁伯 , 米洛斯·泽勒锌 , 阿列克谢·卡尔波夫 :
半自动面部关键点数据集创建。 662-668 阿萨纳西奥斯·库特拉斯 :
基于音乐流派信息的歌曲情感识别。 669-679 马克西姆·特卡琴科 , 亚历山大·亚姆希宁 , 尼古拉·吕比莫夫 , 米哈伊尔·科托夫 , 玛丽娜·纳斯塔森科 :
基于深度递归神经网络的说话人识别语音增强。 690-699 瓦西里基·西马基 , 卡里塔·帕拉迪斯 , 安德烈亚斯·凯伦 :
2016年英国公民投票博客文本中的立场分类。 700-709 阿尔托·穆斯塔霍基 , 塔蒂亚娜·谢尔斯蒂诺娃 :
日常语音纵向记录的“回顾性评论”方法。 710-718 帕维尔·戈利克 , 佐尔坦·图斯克 , Kazuki Irie公司 , 尤根·贝克 , 拉尔夫·施吕特 , 赫尔曼·奈伊 :
2016年低资源语言RWTH关键字搜索系统。 719-730 安东·斯特皮霍夫 , 路易斯安那州Anastasia Loukina :
形态因素对俄语自发言语中句子边界的影响。 731-740 阿尔曼·卡利耶夫 , 谢尔盖·雷宾 , 尤里·马特维耶夫 :
基于布朗聚类和单词嵌入的暂停方法。 741-747 杰罗米尔·诺沃顿(Jaromír Novotn) , Pavel Ircing公司 :
无监督文档分类和主题检测。 748-756 丹尼斯·伊万科 , 阿列克谢·卡尔波夫 , 德米特里·鲁明 , 伊琳娜·基皮亚特科娃 , 安东·I·萨韦利夫 , 维克托·布德科夫 , 德米特里·伊万科 , 米洛斯·泽勒锌 :
使用高速摄像机在噪声条件下实现稳健的视听语音识别。 757-766 卡雷尔·帕莱切克 :
在大词汇连续语音识别中使用唇读。 767-776 苏斯米塔·威科特 , Shikha Tripathi公司 :
基于WSOLA和线性预测的声乐情感转换。 777-787 瓦迪姆·扎哈里耶夫 , 埃利亚斯·阿扎罗夫 , 亚历山大·彼得罗夫斯基 :
基于GMM的目标扬声器调谐TTS系统的语音转换。 788-798 拉丹·巴海-拉瓦里 , 史蒂夫·比特 :
VoiScan:用于健康和生物识别应用的电话语音分析。 799-808 阿拉·穆罕默德 , 穆罕默德·巴德埃尔·登 , 安德烈亚斯·卡纳沃斯 , 米哈拉·科西亚 :
基于搜索类型语法模式的Web查询分类。 809-819 杨超 , 玛丽·卢斯·布尔盖 :
视频脚本成为有用的搜索界面需要什么样的语音识别准确度? 820-828