第12届ISCSLP 2021:中国香港特别行政区
-
第十二届汉语口语处理国际研讨会,ISCSLP 2021,香港,2021年1月24日至27日。 电气与电子工程师协会 2021 ,国际标准图书编号 978-1-7281-6994-1 李杰(音译) , 范志云 , 王晓瑞 , 李燕 :
汉语语音识别中基于音节的无格MMI声学建模。 1-5 周静艳 , 张晓颖 , 冯晓翰 , Keung Wu国王 , 蒙美玲 :
使用凸多主题模型自动提取对话中的语义模式。 1-5 郭太阳 , 党建武 , 张高燕 , Bin Zhao(赵斌) , Masashi Unoki先生 :
感知真实单词和伪单词时特定频率的脑网络动力学。 1-5 王庆(音) , 魏饶 , 郭鹏程 , 谢磊(音) :
多域说话人识别的对抗训练。 1-5 王成龙 , 姜堰易 , 陶建华 , 叶白 , 田正坤 :
分层关注的时间频率和信道特性,用于改进说话人验证。 1-5 Junyi敖 , 汤姆·科 :
通过合并N-gram神经网络改进基于注意的端到端ASR。 1-5 慕容马 , 吴海伟(Haiwei Wu) , 王旭阳 , 林阳(Lin Yang) , 王俊杰 , 李明(音) :
用于代码切换查询的声学单词嵌入系统-例如口语词检测。 1-5 范扬 , 李俊峰 , 颜永红 :
语音增强中改进生成对抗网络的一种新方法。 1-5 熊才 , 吴志勇 , 郭忠 , 苏斌(Bin Su) , 东阳戴 , 蒙美玲 :
基于领域对抗神经网络的无监督跨语言语音情感识别。 1-5 存航风扇 , 刘斌(Bin Liu) , 陶建华 , 姜堰易 , 郑琪文 , 宋雷超 :
基于全数据学习的深度时延神经网络语音增强。 1-5 王维哲 , 杨洪武 :
通过深度学习实现手语到情感语言的转换。 1-5 甘黄 , 李爱君 , 张思晨 , 梁张 :
韵律与对话行为:汉语疑问句的感性研究。 1-5 毛廷芝 , 耶尔博拉特·卡萨诺夫 , 范东芬 , 徐海华 , 黄浩 , Eng Siong Chng先生 :
改进混合ASR系统中未充分表示的命名实体识别的方法。 1-5 林凯鹏 , 王岱 , 登封客 , 张劲松 :
普通话声调识别的多尺度模型。 1-5 拓兆 , 赵云欣 , 王少军 , 梅翰(Mei Han) :
基于UNet++的多通道语音去抖动和远程语音识别。 1-5 李兆琪 , 龙武 , Ta Li公司 , 颜永红 :
通过Wav2vec预训练和Circle Loss的示例口语术语检测改进了神经声学单词嵌入查询。 1-5 杨璐嘉 , 丁宏伟 :
比较中英文器乐和声乐的节奏。 1-5 王宜萱 , 徐家浩 , 吴忠宪 , 杨宗宪 :
基于对话情境和移情高级定义的基于转换者的移情反应生成。 1-5 王迪松 , 余建伟 , 吴西新 , 孙丽发 , 刘勋英 , 蒙美玲 :
通过基于元学习的模型重新初始化改进的端到端不规则语音识别。 1-5 陶莉 , 单阳 , 刘梦雪 , 谢磊(音) :
用于端到端语音合成的可控情绪传输。 1-5 陈树文 , Peggy Pik Ki Mok公司 :
普通话发音和声学特征的初步研究。 1-5 云峰 , 闫峰 , 谢晨伟 , 王世元 :
西南官话中与年龄相关的量词使用下降。 1-5 余涛畅 , 袁洪阳 , 于怀鹏 , Syu-Siang Wang(王兆祥) , 太极拳 , 于曹 , 王信民 :
MoEVC:一种具有稀疏选通机制的混合专家语音转换系统,用于在线计算加速。 1-5 亚鲁·吴 , 洛里·拉梅尔 , 马丁·阿达·德克尔(Martine Adda-Decker) :
汉语语音中的声调实现:基于大型语料库的双音节词研究。 1-5 张晓燕 , 李爱君 , 李志强 :
泰丰汉语声调实现的复杂模式。 1-5 张帅(Shuai Zhang) , 姜堰易 , 田正坤 , 陶建华 , 叶白 :
端到端曼语-英语代码转换语音识别中带有语言偏见的Rnn转换器。 1-5 张玉清(Yuqing Zhang) , 朱莉 , 张劲松 :
英语第一语言和第二语言自发性言语中韵律和语义单位对齐及其对F0移位影响的比较研究。 1-5 曹月文 , 刘松香 , 石寅康 , 那胡 , 刘鹏(音) , 刘勋英 , 丹苏 , 董瑜(Dong Yu) , 蒙美玲 :
探索使用语音数据进行跨语言歌唱语音合成。 1-5 孟戈 , 张瑞雄 , Wei Zou(魏邹) , 李向刚 , 成功 , 王龙彪 , 党建武 :
有序软件成对中毒检测。 1-5 桓磊 , 党建武 , 于晨 :
汉语使用者英语单词识别中转音字母效应的追踪研究。 1-5 黄哲英 , 彭丽 , 季旭 , 张鹏远 , 颜永红 :
基于注意的端到端编码切换语音识别的上下文相关标签平滑正则化。 1-5 李廷乐 , 陈嘉伟 , 侯浩文 , 李明(音) :
Sams-Net:用于音乐源分离的基于分段注意的神经网络。 1-5 关一涵 , 李斌(Bin Li) :
语音分析用手机语音记录的可用性和实用性。 1-5 徐文伟(Wenwei Xu) , 佩吉·莫克 :
昆山吴语非模态语音的声学相关性和时间跨度。 1-5 许申生(Sean Shensheng Xu) , Man-Wai Mak公司 , 王家浩(Ka Ho Wong) , 蒙美玲 , 蒂莫西·C·Y·郭 :
为认知评估的日记化嵌入非老年人演讲者。 1-5 Keiichi Funaki先生 :
基于LASSO的自适应稀疏时变复AR语音分析。 1-5 曾志平 , 范东芬 , 徐海华 , 耶尔博拉特·卡萨诺夫 , Eng Siong Chng先生 , 倪崇嘉 , 马斌(Bin Ma) :
在转移学习中使用基于混合变换器-LSTM的端到端ASR来利用文本数据。 1-5 李思霞 , 党建武 , 王龙标 :
以语义知识为领域知识的口语理解。 1-5 潘长杰 , 陈飞(音译) :
模拟电声听力中不匹配谱振幅水平对元音识别的影响。 1-5 朱进如 , 长春宝 :
多通道语音编码中基于GAN的通道间幅度比解码。 1-5 荀功 , 陈正阳(音) , 杨叶欣 , 王帅 , 王岚(Lan Wang) , 钱延敏 :
基于噪声分布匹配的扬声器嵌入增强。 1-5 余振雄 , 林姿慧 :
人工耳蜗植入儿童的快速词汇学习:语音结构和互斥性。 1-4 李善鹏 , 顾文涛 :
汉语中表达讽刺赞美的韵律剖面。 1-5 岳凤鹏 , 汤姆·科 :
基于变换的端到端语音识别中位置编码的研究。 1-5 辛莉(Xin Li) , 尹晃(音) , 徐云恒 , 林心怡(Linxin Yi) , 袁玉铭(Yuming Yuan) , 闵翔(音) :
高级韩国语学习者制作三声连读变调。 1-5 张颖(音) , 郝车 , 王晓瑞 :
任意扬声器的非并行序列到序列语音转换。 1-5 冯宝 , 李月鹏 , 尚世东 :
语音增强的低复杂度后处理方法。 1-5 王帅 , 杨业新 , 钱延敏 , Kai Yu公司 :
重温深度说话人嵌入学习中的统计汇集层。 1-5 张广燕 , 邱世荣 , 应钦 , Tan Lee先生 :
语音合成中情感韵律传递的韵律表征中的互信息估计。 1-5 春雨强 , 陶建华 , 傅瑞波 , 郑琪文 , 姜堰易 , 王涛(音译) , 王世明 :
端到端代码切换TTS中段落处理的文本增强。 1-5 安娜·古特尼克 , 奥利弗·尼布尔 , 顾文涛 :
从文化角度分析演讲者的魅力。 1-5 李秋元 , 袁佳 :
维吾尔族学习者普通话单音节声调错误的实验研究。 1-5 应钦 , 姚倩 , 路易斯安那州Anastasia Loukina , 帕特里克·L·兰格 , 阿比纳夫·米斯拉 , 基兰·埃文尼 , Tan Lee先生 :
基于ASR输出的非母语英语语音中单词级阅读错误的自动检测。 1-5 吴梦飞 , 王龙标 , 于克思 , 党建武 :
使用分支结构和注意机制识别不平衡数据的对话行为。 1-5 于古 , 向音 , 饶永辉 , 袁婉 , 本来堂 , 杨章 , 陈吉通 , 王宇轩 , 马泽君 :
ByteSing:一个使用时长分配编解码声学模型和WaveRNN声码器的中文歌唱语音合成系统。 1-5 张伟(音译) , 梅根粘土 , 张劲松 :
普通话声调对突出度声学线索加权模式的影响。 1-5 任信然 , 佩吉·莫克 :
吸气对粤语F0起始的辅音效应。 1-5 彭文杰 , 高英明 , 林炳怀 , 张劲松 :
一种提高自动语音分割性能的实用方法。 1-5 赵玲君 , Man-Wai Mak公司 :
用于远场扬声器验证的信道相关性增强扬声器嵌入。 1-5 Kun Wei(昆威) , 郭鹏程 , 杭吕 , 甄途 , 谢磊(音) :
用于会话语音识别的上下文感知RNNLM重新搜索。 1-5 郑连(音) , 钟荣秀 , 郑琪文 , 刘斌(Bin Liu) , 陶建华 :
语音转换的精细韵律控制。 1-5 梅丹·欧阳 , 罗汉·库马尔·达斯 , 杨继晨 , 李海洲 :
基于胶囊网络的端到端重放攻击检测系统。 1-5 刘畅(Chang Liu) , 杨艾 , 振华岭 :
用于增强激光麦克风捕获的低质量语音的相位谱恢复。 1-5 认识H.Soni , 灰白的熊猫 :
使用期望向量法在多注册场景中基于LDA的说话人验证。 1-5 徐泽正 , Ting Jiang(丁江) , 李超(音) , 余嘉诚 :
一种用于单耳语音增强的注意增强型全卷积神经网络。 1-5 长风高 , 高峰城 , 周军(音) , 张鹏远 , 颜永红 :
非自回归审议——基于关注的端到端ASR。 1-5 王庆(音) , 吴华新 , 靖子君 , 马峰(Feng Ma) , 易芳 , 王宇轩 , 陈泰然 , 贾攀 , 杜军 , 李金辉 :
一种用于声音事件定位和检测的模型集成方法。 1-5 徐雪楠 , 海因里希·丁克尔 , 吴梦月 , Kai Yu公司 :
有句子级损失的汽车设置中的音频字幕。 1-5 Wai-Sum Lee公司 , 艾琳·清寅(Irene Ching-Yin Tsoi) :
听力受损者粤语元音和声调的声学特征。 1-5 郑思源(Siyuan Zheng) , 杜军 , 周恒顺 , 薛白 , 李金辉 , 李世鹏 :
基于声学分段模型的语音情感识别。 1-5 王志超 , 文硕阁 , 熊王(Xiong Wang) , 单阳 , 甘文东 , 陈海涛 , 海丽 , 谢磊(音) , 李秀林 :
多对多语音转换中的重音和说话人分离。 1-5 姜国磊 , 廖春红 , 李坤 , 刘鹏飞 , 姜林英(Linying Jiang) , 蒙美玲 :
使用来自多个发音的后验概率的二语语音的说话人级发音自动评估。 1-5