张永茂
人员信息
优化列表
2020年–今天
2024 [注2] Shuhao Shi公司 , 陈健(Jian Chen) , 王正燕 , 张玉欣(Yuxin Zhang) , 张永茂 , 傅成琦 , 凯乔 , Bin Yan先生 :
SStackGNN:用于推特机器人检测的图形数据增强简化堆叠图形神经网络。 国际期刊计算。 智力。 系统。 17 ( 1 ) : 106 ( 2024 ) [j1] 朱新发 , 易磊 , 陶莉 , 张永茂 , 周洪斌 , 恒路 , 谢磊(音) :
METTS:多语言情感文本到语音的跨说话人和跨语言情感传递。 IEEE ACM传输。 音频语音语言处理。 32 : 1506-1518 ( 2024 ) 2023 [第12条] 张永茂 , 刘广厚 , 易磊 , 陈云林 , 郝茵 , 谢磊(音) , 李志飞 :
Promptspeaker:基于文本描述的说话人生成。 ASRU公司 2023 : 1-7 [第11条] 宋坤 , 张永茂 , 易磊 , 健聪 , 李汉照 , 谢磊(音) , 黑帮(Gang He) , 白金凤 :
DSPGAN:一种基于Gan的通用声码器,用于高清晰度TTS,由DSP提供时频域监控。 ICASSP公司 2023 : 1-5 [c10] 朱新发 , 易磊 , 宋坤 , 张永茂 , 陶莉 , 谢磊(音) :
基于多因素解耦的多扬声器表达语音合成。 ICASSP公司 2023 : 1-5 【c9】 张永茂 , 合阳雪 , 李汉照 , 谢磊(音) , 郭廷伟 , 张瑞雄 , 彩霞宫 :
VISinger2:数字信号处理合成器增强的高清晰度端到端歌唱语音合成。 INTERSPEECH公司 2023 : 4444-4448 【c8】 刘广厚 , 张永茂 , 易磊 , 陈云林 , 王瑞(Rui Wang) , 谢磊(音) , 李志飞 :
提示风格:具有自然语言描述的文本到语音的可控风格转换。 INTERSPEECH公司 2023 : 4888-4892 【c7】 宋坤 , 易磊 , 陈培坤 , 曹一清 , Kun Wei(昆威) , 张永茂 , 谢磊(音) , 宁江 , 赵国庆 :
用于IWSLT 2023语音转换任务的NPU-MSXF语音转换系统。 ACL处的IWSLT 2023 : 311-320 [i13] 刘广厚 , 张永茂 , 易磊 , 陈云林 , 王瑞(Rui Wang) , 李志飞 , 谢磊(音) :
提示风格:具有自然语言描述的文本到语音的可控风格转换。 CoRR公司 abs/2305.19522 ( 2023 ) [i12] 宋坤 , 易磊 , 陈培坤 , 曹一清 , Kun Wei(昆威) , 张永茂 , 谢磊(音) , 宁江 , 赵国庆 :
用于IWSLT 2023语音转换任务的NPU-MSXF语音转换系统。 CoRR公司 abs/2307.04630 ( 2023 ) [i11] 张永茂 , 刘广厚 , 易磊 , 陈云林 , 郝茵 , 谢磊(音) , 李志飞 :
提示扬声器:基于文本描述的扬声器生成。 CoRR公司 abs/2310.05001 ( 2023 ) [i10] 马林汉(Linhan Ma) , 张永茂 , 朱新发 , 易磊 , 紫谦宁 , 彭成柱 , 谢磊(音) :
口音-VITS:端到端TTS的口音传输。 CoRR公司 abs/2312.16850 ( 2023 ) 2022 【c6】 张永茂 , 健聪 , 合阳雪 , 谢磊(音) , 彭成柱 , 蒙晓碧 :
维辛格:针对端到端歌唱语音合成的变分推理与对抗学习。 ICASSP公司 2022 : 7237-7241 【c5】 Yu Wang(王宇) , 王新生 , 彭成柱 , 吴杰 , 李汉照 , 合阳雪 , 张永茂 , 谢磊(音) , 蒙晓碧 :
Opencpop:一个高质量的开放源码中文流行歌曲合成语料库。 INTERSPEECH公司 2022 : 4242-4246 【c4】 合阳雪 , 王新生 , 张永茂 , 谢磊(音) , 彭成柱 , 蒙晓碧 :
学习歌唱2.0:通过向歌唱老师学习,基于扩散和相互信息的目标说话人SVS。 INTERSPEECH公司 2022 : 4267-4271 【c3】 宋坤 , 健聪 , 王新生 , 张永茂 , 谢磊(音) , 宁江 , 吴海英 :
健壮MelGAN:用于高保真TTS的健壮通用神经声码器。 ISCSLP公司 2022 : 71-75 【c2】 张永茂 , 王志超 , 杨培吉 , 孙洪深 , 王志胜 , 谢磊(音) :
口音语音:针对带有口音的目标说话人TTS,从众包数据中学习口音。 ISCSLP公司 2022 : 76-80 【c1】 宋坤 , 合阳雪 , 王新生 , 健聪 , 张永茂 , 谢磊(音) , 杨冰(Bing Yang) , 熊章 , 丹·苏 :
AdaVITS:用于低计算资源演讲者自适应的微型VITS。 ISCSLP公司 2022 : 319-323 [第九章] Yu Wang(王宇) , 王新生 , 彭成柱 , 吴杰 , 李汉照 , 合阳雪 , 张永茂 , 谢磊(音) , 蒙晓碧 :
Opencpop:一个高质量的开放源码中文流行歌曲合成语料库。 CoRR公司 abs/2201.07429 ( 2022 ) [i8] 合阳雪 , 王新生 , 张永茂 , 谢磊(音) , 彭成柱 , 蒙晓碧 :
学习歌唱2.0:通过向歌唱老师学习,实现基于扩散和互信息的目标说话人SVS。 CoRR公司 abs/2203.16408 ( 2022 ) [i7] 宋坤 , 合阳雪 , 王新生 , 健聪 , 张永茂 , 谢磊(音) , 杨冰(Bing Yang) , 熊章 , 丹·苏 :
AdaVITS:用于低计算资源演讲者自适应的微型VITS。 CoRR公司 abs/2206.00208 ( 2022 ) [i6] 张永茂 , 王志超 , 杨培吉 , 孙洪深 , 王志胜 , 谢磊(音) :
口音语音:针对带有口音的目标说话人TTS,从众包数据中学习口音。 CoRR公司 abs/2210.17305 ( 2022 ) [i5] 宋坤 , 健聪 , 王新生 , 张永茂 , 谢磊(音) , 宁江 , 吴海英 :
健壮MelGAN:用于高保真TTS的健壮通用神经声码器。 CoRR公司 abs/2210.17349 ( 2022 ) [i4] 宋坤 , 张永茂 , 易磊 , 健聪 , 李汉照 , 谢磊(音) , 黑帮(Gang He) , 白金凤 :
DSPGAN:基于GAN的通用声码器,通过DSP的时频域监控实现高保真TTS。 CoRR公司 abs/2211.01087 ( 2022 ) [i3] 张永茂 , 合阳雪 , 李汉照 , 谢磊(音) , 郭廷伟 , 张瑞雄 , 彩霞宫 :
VISinger 2:数字信号处理合成器增强的高清晰度端到端歌唱语音合成。 CoRR公司 abs/2211.02903 ( 2022 ) [i2] 朱新发 , 易磊 , 宋坤 , 张永茂 , 陶莉 , 谢磊(音) :
基于多因素解耦的多扬声器表达语音合成。 CoRR公司 abs/2211.10568 ( 2022 ) 2021 [i1] 张永茂 , 健聪 , 合阳雪 , 谢磊(音) , 彭成柱 , 蒙晓碧 :
维辛格:针对端到端歌唱语音合成的变分推理与对抗学习。 CoRR公司 腹肌/2110.08813 ( 2021 )