{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部分”:[[2023,10,23]],“日期-时间”:“2023-10-23T23:02:02:08Z”,“时间戳”:1698102128023},“出版商位置”:“美国纽约州纽约市”,“参考计数”:28,“出版者”:“ACM”,“资助者”:[{“名称”:“中国国家重点研发计划”,“奖项”:[“No.2020AAA0140003”]},{“name”:“国家自然科学基金”,“award”:[“No 62101553 No.61901473 No.61831022”]}.,{”name“:”重点研究项目“,”award“:[”No.2019KD0AD01“]}],”content-domain“:{“domain”:[”dl.acm.org“],”crossmark-restriction“:true},”short-container-title“:[],”published-print“:{”date-parts“:[2022,10],14]]},“DOI”:“10.1145\/3552466.3556534”,“type”:“proceedings-article”,“created”:{“date-parts”:[2022,10,1]],“date-time”:“2022-10-01T12:27:26Z”,“timestamp”:1664627246000},“update-policy”:”http://\/dx.doi.org\/10.1145\/crossmark-policy“,”source“Crossref”,“is-referenced-by-count”:2,“title”:[“Singing-Tacotron”],“prefix”:“10.1145”,“author”:[{“given”:“Tao”,“family”:“Wang”,“sequence”:“first”,“affiliation”:[{“name”:“中国科学院北京自动化研究所”}]},{“given”:“Ruibo”,“family”:“Fu”,“serquence”:“additional”,“fessiliation”:[{(名称):“中国北京自动化研究院”}]neneneep,{(给定):“Jiangyan”:[{“name”:“中国科学院自动化研究所”}]},{“given”:“Zhengqi”,“family”:“Wen”,“sequence”:“additional”,“affiliation”:“[{名称”:“中科院自动化研究院,中国北京”}]{:“中国科学院自动化研究所”}]}],“成员”:“320”,“在线发布”:{“日期-部分”:[2022,10,10]]},“引用”:[{“key”:“e_1_3_2_2_1_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1109\/TASLP.2020.2970241“},”key“:”e_3_2_2 _2_1“,”doi-assert-by“:”crossref“,“非结构化”:“Orazio Angelini Alexis Moinet Kayoko Yanagisawa和Thomas Drugman。2020。歌唱合成:在我的关注下。arxiv:eess。AS\/1912.05881 Orazio Angelini Alexis Moinet Kayoko Yanagisawa和Thomas Drugman。2020年。歌唱合成:在我的关注下。arxiv:eess。AS\/1912.05881“,”DOI“:”10.21437\/Interspeech.2020-1399“},{”key“:”e_1_3_2_3_1“,”DOI-asserted-by“:”crossref“,“unstructured”:“Merlijn Blaauw and Jordi Bonada.2020。使用前馈变换器的序列到序列歌唱合成。arxiv:cs公司。Merlijn Blaauw和Jordi Bonada,1910.09989年。2020年。使用前馈变压器的序列对序列歌唱合成。arxiv:cs公司。SD\/1910.09989“,”DOI“:”10.1109\/ICASSP40776.200.9053944“},{”key“:”e_1_3_2_4_1“,”DOI-asserted-by“:”publisher“,“DOI”:“10.1109\/ICASSP.2007.367298”},“key”:“e_1_ 3_2_5_1”,“volume-title”:“August”,“卷”:“15”,“作者”:“Blunsom Phil”,“年份”:“2004”,“非结构化”:“菲尔·布隆森。2004 . 隐马尔可夫模型。课堂讲稿,8月,第15卷,18-19(2004),48。菲尔·布隆森。2004.隐马尔可夫模型。课堂讲稿,8月,第15卷,第18-19卷(2004),第48页。“},{“key”:“e_1_3_2_6_1”,“volume-title”:“HiFiSinger:走向高保真神经歌唱声音合成。arXiv预印本arXiv:2009.01776”,“author”:“Chen Jiawei”,《年份》:“2020”,“unstructured”:“Jiawei-Chen,Xu Tan,Jian Luan,Tao Qin,and Tie-Yan Liu.2020。HiFiSinger:走向高保真神经歌唱声音合成。arXiv预印本arXiv:2009.01776(2020)。陈嘉伟、谭旭、栾健、秦涛和刘铁燕。2020年。HiFiSinger:走向高保真神经歌唱声音合成。arXiv预印arXiv:2009.01776(2020)。“},{”key“:”e_1_3_2_2_7_1“,”unstructured“:”Jan K Chorowski Dzmitry Bahdanau Dmitriy Serdyuk Kyunghyun Cho和Yoshua Bengio,2015。基于注意的语音识别模型。神经信息处理系统进展。577--585. Jan K Chorowski Dzmitry Bahdanau Dmitriy Serdyuk Kyunghyun Cho和Yoshua Bengio。2015.基于注意力的语音识别模型。神经信息处理系统进展。577-585.“},{”key“:”e_1_3_2_2_8_1“,”unstructured“:”data baker。中国女声歌曲1。https:\/\/test.data-baker.com//data\/index\/compose。数据烘焙器。中国女声歌曲1。https:\/\/test.data-baker.com//data\/index\/compose。“},{”key“:”e_1_3_2_2_9_1“,”unstructured“:”Michael Good.2006。商业应用程序中的MusicXML。Michael很好。2006.商业应用中的MusicXML。“},{”key“:”e_1_3_2_2_10_1“,”volume-title“:”深度学习“,”author“:”Goodfellow Ian“,”unstructured“:”Ian Goodfelow,Yoshua Bengio,Aaron Courville,and Yoshua-Bengio。2016。深度学习。第1卷。麻省理工学院出版社剑桥。Ian Goodfellow、Yoshua Bengio、Aaron Courville和Yoshua Bengio。2016年,深度学习。第1卷。麻省理工学院出版社剑桥。“},{”key“:”e_1_3_2_2_11_1“,”doi-asserted-by“:”publisher“,”doi“:”10.1109\/ISSLP49672.201.9362104“}”,{“key”:“e_1_ 3_2_12_1”,“doi-assert-by”:“publisher”,“doi”:“10.5120\/17740-8271”},”{“key”:“e_1_3_2_13_1”,”volume-title“:”基于DNN的歌唱语音合成系统-Sinsy的最新发展。2018年亚太信号与信息处理协会年会(APSIPA ASC)。1003--1009“,“作者”:“荣誉Y”,“非结构化”:“Y.荣誉、S.村田、K.中村村、K.桥本、K.乌拉、Y.南卡库和K.德田。2018 . 基于DNN的歌唱语音合成系统-Sinsy的最新发展。2018年亚太信号与信息处理协会年会(APSIPA ASC)。1003--1009 . Y.Hono、S.Murata、K.Nakamura、K.Hashimoto、K.Oura、Y.Nankaku和K.Tokuda。2018年,基于DNN的歌唱语音合成系统的最新开发-Sinsy。2018年亚太信号与信息处理协会年会(APSIPA ASC)。1003--1009.“},{”key“:”e_1_3_2_2_14_1“,”doi-asserted-by“:”publisher“,“doi”:“10.23919\/APSIPA.2018.8659797”},“key”:“e_1_ 3_2_15_1”,“volume-title”:“Adam:一种随机优化方法。arXiv预印本arXiv:1412.6980”,“author”:“Kingma Diederik P”,“年份”:“2014”,“非结构化”:“Diederik P Kingma和Jimmy Ba。2014 . 亚当:一种随机优化方法。arXiv预印arXiv:1412.6980(2014)。Diederik P Kingma和Jimmy Ba.2014年。亚当:一种随机优化方法。arXiv预印arXiv:1412.6980(2014)。“},{”key“:”e_1_3_2_2_16_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/PACRIM.1993.407206”},},“key”:“e_1_3_2_17_1”,“unstructured”:“Juheon Lee Hyeong-Seok Choi Chang-Bin Jeon Junghyun Koo and Kyogu Lee.2019。对手训练的端到端韩国歌唱语音合成系统。arxiv:cs公司。SD\/1908.01919 Juheon Lee Hyeong-Seok Choi Chang-Bin Jeon Junghyun Koo和Kyogu Lee。2019.经过对手训练的端到端韩国歌唱语音合成系统。arxiv:cs公司。SD\/1908.01919“},{”key“:”e_1_3_2_2_18_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/MSP.2014.2359987”},“key”:“e_1_ 3_2_19_1”,“volume-title”:“小冰声:一个高质量的综合歌唱声音合成系统。arXiv预印本arXiv:2006.06261”,“author”:“Lu Peiling”,“year”:“2020”,“unstructured”:“”陆培玲、吴杰、栾健、谭旭和李周。2020 . 小冰星:一个高质量的集成歌唱语音合成系统。arXiv预印本arXiv:2006.06261(2020)。卢培玲、吴杰、栾健、谭旭和周莉。2020年。小冰星:一个高质量的集成歌唱语音合成系统。arXiv预印本arXiv:2006.06261(2020)。“},{”key“:”e_1_3_2_20_1“,”doi-asserted-by“:”publisher“,“doi”:“10.5555\/1324818”},“key”:“e_1_ 3_2_21_1”,“volume-title”:“基于卷积神经网络的歌唱语音合成。arXiv预印本arXiv:1904.06868”,“author”:“Nakamura Kazuhiro”,“年份”:“2019”,“非结构化”:”中村和弘(Kazuhiro Nakamura)、桥本庆一(Kei Hashimoto)、欧拉庆一郎(Keiichiro Oura)、南川义彦(Yoshihiko Nankaku)和德田敬一(Keiiichi Tokuda)。2019.基于卷积神经网络的歌唱声音合成。arXiv预印本arXiv:1904.06868(2019)。Nakamura Kazuhiro、桥本惠、Oura Keiichiro、Nankaku Yoshihiko和Tokuda Keiichi。2019.基于卷积神经网络的歌唱声音合成。arXiv预印本arXiv:1904.06868(2019)。“},{”key“:”e_1_3_2_22_1“,”doi-asserted-by“:”crossref“,”unstructured“:”Masanari Nishimura Kei Hashimoto Keiichiro Oura Yoshihiko Nankaku和Keiici Tokuda.2016。基于深度神经网络的歌唱声音合成。。在Interspeech中。2478--2482. Masanari Nishimura Kei Hashimoto Keiichiro Oura Yoshihiko Nankaku和Keiici Tokuda。2016.基于深度神经网络的歌唱声音合成。。在Interspeech中。2478--2482.“,”DOI“:”10.21437\/Interspeech.2016-1027“},{“key”:“e_1_3_2_23_1”,“volume-title”:“第七届ISCA语音合成研讨会”,“author”:“Oura Keichiro”,“year”:“2010”,“unstructured”:“Oura Keiichiro、Mase Ayami、Yamada Tomohiko、Muto Satoru、Nankaku Yoshihiko和Tokuda Keiich。2010 . 基于HMM的歌唱语音合成系统的最新发展-Sinsy。在第七届ISCA语音合成研讨会上。Oura Keiichiro、Mase Ayami、Yamada Tomohiko、Muto Satoru、Nankaku Yoshihiko和Tokuda Keiich。2010年,基于HMM的歌唱语音合成系统的最新开发——Sensy。在第七届ISCA语音合成研讨会上。“},{”key“:”e_1_3_2_24_1“,”doi-asserted-by“:”publisher“,“doi”:“10.21437\/Intespeech.2006-584”},“key”:“e_1_ 3_2_2_25_1”,“doi-assert-by”:“publisher”,”doi“:”10.1109\/ICASSP.2018.8461368“}”,{C.2013.2251852“},{”key“:”e_1_3_2_27_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/ICASSP.2019.8682804“},{“key”:“e_1_3_2_28_1”,“volume-title”:“语音合成中序列到序列声学建模的前向注意。2018 IEEE声学、语音和信号处理国际会议(ICASSP).4789--4793”,“作者”:“张杰”,“非结构化”:“J.Zhang,Z.Ling,and L。戴。2018 . 语音合成中序列到序列声学建模中的前向注意。2018年IEEE声学、语音和信号处理国际会议(ICASSP)。4789--4793 . J.Zhang、Z.Ling和L.Dai。2018年,语音合成序列到序列声学建模的前沿关注。2018年IEEE声学、语音和信号处理国际会议(ICASSP)。4789--4793.“}],”event“:{”name“:”MM'22:第30届ACM国际多媒体会议“,”location“:”Lisboa Portugal“,”缩写词“:”MM'22“,”赞助商“:[”SIGMM ACM多媒体特别兴趣小组“]},”container-title“:[“第一届音频多媒体深度伪造检测国际研讨会论文集”],“原文标题”:[],”链接“:[{”URL“:”https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3552466.3556534“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[[2023,1,11]],”date-time“:“2023-01-11T03:46:56Z”,”timestamp“:1673408816000},”score“:1,”resource“:”{“primary”:{“URL”:“https:\/\/dl.acm.org\/doi\/10.1145\/3552466.3556534“}},”副标题“:[”用于端到端歌唱语音合成的全局持续时间控制注意和动态过滤器“],”短标题“:[],”已发布“:{”日期部分“:[2022,10,10]]},“references-count”:28,“alternative-id”:[“10.1145\/35526.35565344”,“10.1145\/3552466”],“URL”:“http:\/\/dx.doi.org\/10.1145\/3552466.3556534“,”关系“:{},”主题“:[],”发布“:{”日期部分“:[2022,10,10]]},“断言”:[{”值“:”2022-10-10“,”顺序“:2,”名称“:”发布“,”标签“:”已发布“,“组”:{“名称”:“publication_history”,“标签”:“发布历史”}}}}