田晓海
人员信息
优化列表
2020年–今天
2024 [i13] 湘湖月 , 田晓海 , 马卢·张 , 吴志正 , 李海洲 :
CoAVT:一种用于多模态处理的认知激发的统一视听文本预训练模型。 CoRR公司 abs/2401.12264 ( 2024 ) 2023 [j8] 一周 , 吴志正 , 张明扬(Mingyang Zhang) , 田晓海 , 李海洲 :
TTS引导的无并行数据重音转换培训。 IEEE信号处理。 莱特。 30 : 533-537 ( 2023 ) [j7] 一周 , 吴志正 , 田晓海 , 李海洲 :
优化跨语言语音转换,减少语言损失,减少外国口音。 IEEE ACM传输。 音频语音语言处理。 31 : 1916-1926 ( 2023 ) [公元38年] 刘伟 , 凯奇福 , 田晓海 , 舒居石 , 魏丽 , 马泽君 , Tan Lee先生 :
利用语音水平的语言声学相似性进行语音水平的发音评分。 ICASSP公司 2023 : 1-5 [公元37年] 刘伟 , 凯奇福 , 田晓海 , 舒居石 , 魏丽 , 马泽君 , Tan Lee先生 :
一种具有自我监督学习的无ASR流利度评分方法。 ICASSP公司 2023 : 1-5 [i12] 刘伟 , 凯奇福 , 田晓海 , 舒居石 , 魏丽 , 马泽军 , Tan Lee先生 :
利用语音级语言-声学相似性进行语音级发音评分。 CoRR公司 abs/2302.10444 ( 2023 ) [i11] 凯奇福 , 高少君 , 舒居石 , 田晓海 , 魏丽 , 马泽君 :
非母语流利性评分的语音和韵律软件自我监督学习方法。 CoRR公司 abs/2305.11438 ( 2023 ) 2022 [公元36年] 凯奇福 , 高少君 , 田晓海 , 魏丽 , 马泽君 :
使用从序列原始特征中学习的流利表达来提高非主动流利性评分。 INTERSPEECH公司 2022 : 4337-4341 [公元35年] 田晓海 , 凯奇福 , 高少君 , 顾一伟 , 王凯(Kai Wang) , 魏丽 , 马泽君 :
一种基于转移和多任务学习的MOS预测方法。 INTERSPEECH公司 2022 : 5438-5442 [i10] 凯奇福 , 高少君 , 王凯(Kai Wang) , 魏丽 , 田晓海 , 马泽君 :
利用语音级混合数据增强和多源信息提高非母语单词级发音评分。 CoRR公司 abs/2203.01826 ( 2022 ) 2021 [j6] 杜洪强 , 田晓海 , 谢磊(音) , 李海洲 :
用于有限数据的语音转换的因子化WaveNet。 语音通信。 130 : 45-54 ( 2021 ) [j5] 比迪莎·夏尔马 , 高晓雪 , 卡提卡·维贾扬 , 田晓海 , 李海洲 :
NHSS:一个语音和歌唱并行数据库。 语音通信。 133 : 9-22 ( 2021 ) 【j4】 一周 , 田晓海 , 李海洲 :
用于跨语言个性化语音生成的语言不可知论说话人嵌入。 IEEE ACM传输。 音频语音语言处理。 29 : 3427-3439 ( 2021 ) [公元34年] 齐聪谢 , 田晓海 , 刘广厚 , Kun Song(昆松) , 谢磊(音) , 吴志勇 , 海丽 , 宋石 , 李海洲 , Fen Hong公司 , 慧步 , 徐欣 :
2021年多扬声器多风格语音克隆挑战赛。 ICASSP公司 2021 : 8613-8617 [公元33年] 一周 , 田晓海 , 吴志正 , 李海洲 :
在语言表示上具有循环一致性损失的跨语言语音转换。 Interspeech公司 2021 : 1374-1378 [公元32年] 杜洪强 , 田晓海 , 谢磊(音) , 李海洲 :
利用说话人身份的周期一致性损失优化语音转换网络。 SLT公司 2021 : 507-513 2020 [j3] 一周 , 田晓海 , 李海洲 :
具有跨语言语音转换集成架构的多任务WaveRNN。 IEEE信号处理。 莱特。 27 : 1310-1314 ( 2020 ) [公元31年] 周学浩 , 田晓海 , 格兰迪·李 , 罗汉·库马尔·达斯 , 李海洲 :
使用跨语言模型的端到端代码切换TTS。 ICASSP公司 2020 : 7614-7618 [公元30年] 杜洪强 , 田晓海 , 谢磊(音) , 李海洲 :
针对有限数据的语音转换的有效Wavenet适配。 ICASSP公司 2020 : 7779-7783 [公元29年] 罗汉·库马尔·达斯 , 田晓海 , 托米·金努恩 , 李海洲 :
攻击者对自动说话人验证的观点:概述。 INTERSPEECH公司 2020 : 4213-4217 [公元28年] 田晓海 , 罗汉·库马尔·达斯 , 李海洲 :
使用反馈控制语音转换对自动说话人验证进行黑盒攻击。 奥德赛 2020 : 159-164 [公元27年] 高晓雪 , 田晓海 , 一周 , 罗汉·库马尔·达斯 , 李海洲 :
使用WaveRNN的个性化唱歌声音生成。 奥德赛 2020 : 252-258 [第九章] 罗汉·库马尔·达斯 , 田晓海 , 托米·金努恩 , 李海洲 :
攻击者对自动说话人验证的观点:概述。 CoRR公司 abs/2004.08849 ( 2020 ) [i8] 易昭 , 黄文钦 , 田晓海 , 山崎骏一 , 罗汉·库马尔·达斯 , 托米·金努恩 , 振华灵 , 户田朋木 :
2020年语音转换挑战:语际半平行和跨语言语音转换。 CoRR公司 abs/2008.12527 ( 2020 ) [i7] 罗汉·库马尔·达斯 , 托米·金努恩 , 黄文钦 , 振华灵 , 山崎骏一 , 易昭 , 田晓海 , Tomoki Toda先生 :
2020年语音转换挑战赛的主观评分和欺骗评估预测。 CoRR公司 abs/2009.03554 ( 2020 ) [i6] 杜洪强 , 田晓海 , 谢磊(音) , 李海洲 :
利用说话人身份的周期一致性损失优化语音转换网络。 CoRR公司 abs/2011.08548 ( 2020 ) [i5] 比迪莎·夏尔马 , 高晓雪 , 卡提卡·维贾扬 , 田小海 , 李海洲 :
NHSS:一个语音和歌唱并行数据库。 CoRR公司 abs/2012.00337 ( 2020 )
2010 – 2019
2019 【b1】 田晓海 :
具有并行/非并行数据和合成语音检测的语音转换。 新加坡南洋理工大学, 2019 [公元26年] 高晓雪 , 田晓海 , 罗汉·库马尔·达斯 , 一周 , 李海洲 :
用于语音到歌唱转换的非扬声器频谱映射。 阿普西帕 2019 : 159-164 [公元25年] 一周 , 田晓海 , 罗汉·库马尔·达斯 , 李海洲 :
通过联合训练的说话人嵌入网络实现多对多跨语言语音转换。 阿普西帕 2019 : 1282年-1287年 [公元24年] 杜洪强 , 田晓海 , 谢磊(音) , 李海洲 :
用于语音转换的具有奇异值分解的WaveNet分解。 ASRU公司 2019 : 152-159 【c23】 一周 , 田晓海 , 埃姆雷·伊尔马兹 , 罗汉·库马尔·达斯 , 李海洲 :
一种具有特定语言输出层的模块化神经网络,用于跨语言语音转换。 ASRU公司 2019 : 160-167 [公元22年] 一周 , 田晓海 , 徐海华 , 罗汉·库马尔·达斯 , 李海洲 :
利用双语语音后验图和平均模型进行跨语言语音转换。 ICASSP公司 2019 : 6790-6794 【c21】 田晓海 , Eng Siong Chng先生 , 李海洲 :
用于非并行数据语音转换的扬声器相关WaveNet。 INTERSPEECH公司 2019 : 201-205 [i4] 田晓海 , Eng Siong Chng先生 , 李海洲 :
使用非并行数据的无声码器WaveNet语音转换。 CoRR公司 abs/1902.03705 ( 2019 ) 2018 [公元20年] 余新佳 , 雷蒙 , 田晓海 , 西蒙·福维尔 , 黄波(Bo Huang) , 关云清 , 沈志琦 , 苗春燕 , 西里尔·梁 :
新功能的可用性分析,以帮助高级客户进行网上购物。 氯化氢(13) 2018 : 173-185 [第19条] 田晓海 , 王俊朝 , 徐海华 , Eng Siong Chng先生 , 李海洲 :
非平行数据语音转换的平均建模方法。 奥德赛 2018 : 227-232 2017 [注2] 田晓海 , 小华·李 , 吴志正 , Eng Siong Chng先生 , 李海洲 :
一种基于示例的语音转换频率扭曲方法。 IEEE ACM传输。 音频语音语言处理。 25 ( 10 ) : 1863-1876 ( 2017 ) [第18条] 林志浩 , 田晓海 , 魏饶 , Eng Siong Chng先生 :
用于重放攻击检测的谱特征划分研究。 阿普西帕 2017 : 1570-1573 [第17条] 田晓海 , 雷蒙 , 刘思源(Siyuan Liu) , 沈志琦 , Eng Siong Chng先生 , 西里尔·梁 , 弗兰克·关 , 苗春艳 :
适合老年人的电子商务的新型功能技术。 氯化氢(28) 2017 : 150-158 [第16条] 侯娜娜(Nana Hou) , 田晓海 , Eng Siong Chng公司 , 马斌(Bin Ma) , 李海洲 :
通过有效降低说话速度提高空中交通管制语音清晰度。 IALP公司 2017 : 197-200 [第15条] 雷蒙 , 阮奎熙(Nguyen Quy Hy) , 田晓海 , 沈志琦 , Eng Siong Chng先生 , 关云清(Frank Yunqing Guan) , 苗春燕 , 西里尔·梁 :
通过人群改进语音识别、多模式搜索和个性化语音反馈实现老年电子商务。 国际协调委员会 2017 : 127-135 2016 [j1] 阮桂惠 , 小华·李 , 田晓海 , 董明辉 , Eng Siong Chng先生 :
使用韵律和高分辨率谱特征进行高质量语音转换。 Multim公司。 工具应用程序。 75 ( 9 ) : 5265-5285 ( 2016 ) [第14条] 田晓海 , 熊啸 , Eng Siong Chng先生 , 李海洲 :
基于时间卷积神经网络的欺骗语音检测。 阿普西帕 2016 : 1-6 [第13条] 田晓海 , 吴志正 , 熊啸 , Eng Siong Chng先生 , 李海洲 :
从特征表示的角度进行欺骗检测。 ICASSP公司 2016 : 2119-2123 [第12条] 田晓海 , 吴志正 , 熊啸 , Eng Siong Chng先生 , 李海洲 :
加性噪声和混响条件下欺骗语音检测的研究。 INTERSPEECH公司 2016 : 1715-1719 [第11条] 黄东燕 , 谢磊(音) , Yvonne Siu Wa Lee(李兆华) , 吴杰 , 明怀平 , 田晓海 , 张少飞 , 创定 , 梅丽 , 阮桂惠 , 董明辉 , 李海洲 :
一种基于感知背景噪声失真和说话人相似度的自动语音转换评估策略。 SSW公司 2016 : 44-51 [i3] 田晓海 , 吴志正 , 熊啸 , Eng Siong Chng先生 , 李海洲 :
噪声条件下的欺骗检测:初步调查和初始数据库。 CoRR公司 腹肌/1602.02950 ( 2016 ) 2015 [第10条] 薄凡 , 小华·李 , 田晓海 , 谢磊(音) , 董明辉 :
用于高质量统计参数语音合成的波形表示框架。 阿普西帕 2015 : 530-536 【c9】 田晓海 , 史蒂文·杜 , 熊啸 , 徐海华 , 工程变更 , 李海洲 :
使用长期幅度和相位信息检测合成语音。 中国SIP 2015 : 611-615 【c8】 田晓海 , 吴志正 , 小华·李 , 阮奎熙(Nguyen Quy Hy) , 工程变更 , 董明辉 :
基于频率扭曲的语音转换的稀疏表示。 ICASSP公司 2015 : 4235-4239 【c7】 丹尼尔·埃罗 , 因玛·埃尔南德斯 , 阿古斯汀·阿隆索 , D.加西亚·洛伦佐 , 伊娃·纳瓦斯 , 叶建培 , 哈里兹·阿泽卢斯 , 伊戈尔·雅克 , 阮奎熙(Nguyen Quy Hy) , 卡门·马加里尼奥斯 , R.Pérez-Ramón , M.苏里尔 , 田晓海 , X.王 :
针对说话障碍的个性化合成语音:网站和应用程序。 INTERSPEECH公司 2015 : 1251-1254 【c6】 熊啸 , 田晓海 , 史蒂文·杜 , 徐海华 , 工程变更 , 李海洲 :
使用高维幅度和相位特征的欺骗语音检测:针对ASVspoof 2015挑战的NTU方法。 INTERSPEECH公司 2015 : 2052-2056 【c5】 田小海 , 吴志正 , 小华李 , 阮奎熙(Nguyen Quy Hy) , 董明辉 , 工程变更 :
用于高性能语音转换的系统融合。 INTERSPEECH公司 2015 : 2759-2763 [i2] 薄凡 , 小华·李 , 田晓海 , 谢磊(音) , 董明辉 :
用于高质量统计参数语音合成的波形表示框架。 CoRR公司 abs/1510.01443 ( 2015 ) [i1] 阮奎熙(Nguyen Quy Hy) , 小华·李 , 田晓海 , 董明辉 , 工程变更 :
使用韵律和高分辨率谱特征进行高质量语音转换。 CoRR公司 abs/1512.01809 ( 2015 ) 2014 【c4】 小华·李 , 吴志正 , 董明辉 , 田晓海 , 李海洲 :
歌唱声音合成中频谱变换技术的比较研究。 INTERSPEECH公司 2014 : 2499年至2503年 【c3】 田晓海 , 吴志正 , 小华·李 , 工程变更 :
用于语音转换的基于相关性的频率扭曲。 ISCSLP公司 2014 : 211-215 2013 【c2】 田晓海 , 吴志正 , 工程变更 :
语音转换中频谱映射的局部偏最小二乘回归。 阿普西帕 2013 : 1-6 2010 【c1】 谢磊(音) , 赵文怀 , 周向增 , 田小海 , 李炳峰 , 孙乃才 , 赵雅丽 , 张燕宁(Yanning Zhang) :
适用于无处不在、沉浸式和个性化应用的语音和听觉接口。 UIC/ATC研讨会 2010 : 503-505