王长汉(Changhan Wang)
人员信息
其他同名人员
SPARQL查询
优化列表
2020年–今天
2024 [c45] 韩孝忠 , 穆罕默德·安瓦尔 , 胡安·皮诺 , 徐伟宁 , 海洋木瓜 , 博文石 , 王长汉(Changhan Wang) :
XLAVS-R:针对噪声抑制语音感知的跨语言视听语音表示学习。 ACL(1) 2024 : 12896-12911 [i42] 彭一凡 , 伊利亚·库利科夫 , 杨依林 , 斯拉维亚·波普里 , 慧露 , 王长汉(Changhan Wang) , 洪玉宫 :
针对即时条件语音合成的语音语言模型的实证研究。 CoRR公司 abs/2403.12402 ( 2024 ) [i41] 彭一凡 , 伊利亚·库利科夫 , 杨依林 , 斯拉维亚·波普里 , 慧露 , 王长汉(Changhan Wang) , 洪玉宫 :
MSLM-S2ST:一种多任务语音语言模型,用于无文本语音转换,并保留说话人风格。 CoRR公司 abs/2403.12408 ( 2024 ) [i40] 韩孝忠 , 穆罕默德·安瓦尔 , 胡安·皮诺 , 徐伟宁 , 海洋木瓜 , 博文石 , 王长汉(Changhan Wang) :
XLAVS-R:用于噪声鲁棒语音感知的跨语言视听语音表示学习。 CoRR公司 abs/2403.14402 ( 2024 ) 2023 [公元44年] 陈鹏仁 , 陈凯文(Kevin Tran) , 杨依林 , 杜景飞 , 贾斯汀·高 , 余安中 , 帕登·托马塞洛 , 保尔·安布罗斯·杜昆 , 霍尔格·施文克 , 洪玉宫 , 稻谷博文 , 斯拉维亚·波普里 , 王长汉(Changhan Wang) , 胡安·皮诺 , 徐伟宁 , 安·李 :
面向现实世界非书面语言的语音翻译。 ACL(调查结果) 2023 : 4969-4983 [公元43年] 王长汉(Changhan Wang) , 稻谷博文 , 陈鹏仁 , 伊利亚·库利科夫 , 云堂(Yun Tang) , 徐伟宁 , 迈克尔·奥利 , 胡安·皮诺 :
简单有效的无监督语音翻译。 ACL(1) 2023 : 10771-10784 [公元42年] 德里克·徐(Derek Xu) , 舒延东(Shuyan Dong) , 王长汉(Changhan Wang) , 苏宇金(Suyoun Kim) , 林兆江 , 刘冰(Bing Liu) , 阿克沙特·施里瓦斯塔瓦 , 尚文丽 , 梁焕曾 , 关廷林 , 阿列克谢·巴耶夫斯基 , 李鸿业(Hung-yi Lee) , 孙益洲 , 王伟(音译) :
将语义引入语音编码器。 ACL(1) 2023 : 11413-11429 [公元41年] 稻谷博文 , 斯拉维亚·波普里 , 伊利亚·库利科夫 , 陈鹏仁 , 王长汉(Changhan Wang) , 余安中 , 云堂(Yun Tang) , 安·李 , 渡边信治 , 胡安·皮诺 :
UnitY:使用离散单元进行两遍直接语音转换。 ACL(1) 2023 : 15655-15680 [公元40年] 保尔·安布罗斯·杜昆 , 洪玉宫 , 宁东 , 杜景飞 , 安·李 , 韦达努伊·戈斯瓦米 , 王长汉(Changhan Wang) , 胡安·皮诺 , 贝诺西翁 , 霍尔格·施文克 :
SpeechMatrix:多语言语音转换的大规模挖掘语料库。 ACL(1) 2023 : 16251-16269 [公元39年] 黄文钦 , 本杰明·佩洛金 , 贾斯汀·高 , 王长汉(Changhan Wang) , 洪玉宫 , 伊丽莎白·塞尔斯基 , 约西·阿迪 , 安·李 , 陈鹏仁 :
表达性语音转换的整体级联系统、基准和人类评估协议。 ICASSP公司 2023 : 1-5 [公元38年] 玄丕阮 , 斯拉维亚·波普里 , 王长汉(Changhan Wang) , 云堂(Yun Tang) , 伊利亚·库利科夫 , 洪玉宫 :
通过无标签文本改进语音转换。 ICASSP公司 2023 : 1-5 [公元37年] 加通石 , 云堂(Yun Tang) , 安·李 , 稻谷博文 , 王长汉(Changhan Wang) , 胡安·皮诺 , 渡边信治 :
使用多个TTS目标增强语音转换。 ICASSP公司 2023 : 1-5 [公元36年] Phuong-Hang Le公司 , 洪玉宫 , 王长汉(Changhan Wang) , 胡安·皮诺 , 本杰明·莱库图 , 迪迪埃·施瓦布 :
语音翻译预训练:CTC达到最佳传输。 ICML公司 2023 : 18667-18685 [公元35年] 穆罕默德·安瓦尔 , 博文石 , 韦达努伊·戈斯瓦米 , 徐伟宁 , 胡安·皮诺 , 王长汉(Changhan Wang) :
MuAViC:一个用于鲁棒语音识别和鲁棒语音到文本翻译的多语言视听语料库。 INTERSPEECH公司 2023 : 4064-4068 [i39] 黄文钦 , 本杰明·佩洛金 , 贾斯汀·高 , 王长汉(Changhan Wang) , 洪玉宫 , 伊丽莎白·塞尔斯基 , 约西·阿迪 , 安·李 , 陈鹏仁 :
表达性语音转换的整体级联系统、基准和人类评估协议。 CoRR公司 abs/2301.10606 ( 2023 ) [i38] Phuong-Hang Le公司 , 洪玉宫 , 王长汉(Changhan Wang) , 胡安·皮诺 , 本杰明·勒库托 , 迪迪埃·施瓦布 :
语音翻译预训练:CTC达到最佳传输。 CoRR公司 abs/2301.11716 ( 2023 ) [i37] 穆罕默德·安瓦尔 , 博文石 , 韦达努伊·戈斯瓦米 , 徐伟宁 , 胡安·皮诺 , 王长汉(Changhan Wang) :
MuAViC:一个用于鲁棒语音识别和鲁棒语音到文本翻译的多语言视听语料库。 CoRR公司 abs/2303.00628 ( 2023 ) [公元36年] 加通石 , 云堂(Yun Tang) , 安·李 , 稻谷博文 , 王长汉(Changhan Wang) , 胡安·皮诺 , 渡边信治 :
使用多个TTS目标增强语音转换。 CoRR公司 abs/2304.04618 ( 2023 ) [i35] 无缝通信 , 洛伊克·巴罗 , 余安中 , 玛丽亚诺·科丽亚·梅格里奥利 , 大卫·戴尔 , 宁东 , 保尔·安布罗斯·杜昆 , 哈迪·埃尔萨哈 , 洪玉宫 , 凯文·赫夫南 , 约翰·霍夫曼 , 克里斯托弗·克莱伯 , 李鹏伟 , 丹尼尔·利希特 , 由第戎市长麦拉得 , 艾丽斯·拉科图雷森 , 考希克·拉姆·萨达戈潘 , 纪尧姆·温泽克 , 伊桑·叶 , 巴皮·阿库拉 , 陈鹏仁 , Naji El Hachem公司 , 布莱恩·埃利斯 , 加布里埃尔·梅贾·冈萨雷斯 , 贾斯汀·哈海姆 , Prangship Hansanti公司 , 罗斯·豪斯 , 黄伯尼(Bernie Huang) , 黄敏杰 , 稻谷博文 , 索米亚·贾因 , Elahe Kalbassi公司 , 阿曼达·卡莱特 , 伊利亚·库利科夫 , 林碧珍 , 丹尼尔·李 , 许泰马 , 鲁斯兰·马夫柳托夫 , 本杰明·佩洛金 , 穆罕默德·拉马丹 , 阿比尼什·拉马克里希南 , 安娜·Y·孙 , 陈凯文(Kevin Tran) , 团结 , 伊戈尔·图法诺夫 , 维什·沃盖蒂 , 卡利·伍德 , 杨依林 , 余伯凯 , 皮埃尔·安德鲁斯 , 坎·巴利格鲁 , Marta R.Costa-jussá , Onur Celebi公司 , 马哈·埃尔巴亚德 , 辛西娅·高 , 弗朗西斯科·古兹曼 , 贾斯汀·高 , 安·李 , 亚历山大·穆拉赫科 , 胡安·皮诺 , 斯拉维亚·波普里 , 克里斯托夫·罗珀斯 , 萨菲亚·萨利姆 , 霍尔格·施文克 , 帕登·托马塞洛 , 王长汉(Changhan Wang) , 王建复 , 斯凯勒·王 :
SeamlessM4T-大规模多语言和多模态机器翻译。 CoRR公司 abs/2308.11596 ( 2023 ) [i34] 洛伊克·巴罗 , 余安中 , 玛丽亚诺·科丽亚·梅格里奥利 , 大卫·戴尔 , 宁东 , 马克·杜彭塔勒 , 保尔·安布罗斯·杜昆 , 布莱恩·埃利斯 , 哈迪·埃尔萨哈 , 贾斯汀·哈海姆 , 约翰·霍夫曼 , 黄敏杰 , 稻谷博文 , 克里斯托弗·克莱伯 , 伊利亚·库利科夫 , 李鹏伟 , 丹尼尔·利希特 , 由第戎市长麦拉得 , 鲁斯兰·马夫柳托夫 , 艾丽斯·拉科图雷森 , 考希克·拉姆·萨达戈潘 , 阿比尼什·拉马克里希南 , 团结 , 纪尧姆·温泽克 , 杨依林 , 伊桑·叶 , 伊万·埃夫蒂莫夫 , 皮埃尔·费尔南德斯 , 辛西娅·高 , Prangship Hansanti公司 , Elahe Kalbassi公司 , 阿曼达·卡莱特 , Artyom Kozhevnikov先生 , 加布里埃尔·梅贾·冈萨雷斯 , 罗宾·圣罗曼 , 克里斯托弗·图雷 , 科琳·黄 , 卡利·伍德 , 余伯凯 , 皮埃尔·安德鲁斯 , 坎·巴利格鲁 , 陈鹏仁 , Marta R.Costa-jussá , 马哈·埃尔巴亚德 , 洪玉宫 , 弗朗西斯科·古兹曼 , 凯文·赫夫南 , 索米亚·贾因 , 贾斯汀·高 , 安·李 , 许泰马 , 亚历山大·穆拉赫科 , 本杰明·佩洛金 , 胡安·皮诺 , 斯拉维亚·波普里 , 克里斯托夫·罗珀斯 , 萨菲亚·萨利姆 , 霍尔格·施文克 , 安娜·Y·孙 , 帕登·托马塞洛 , 王长汉(Changhan Wang) , 王建复 , 斯凯勒·王 , 玛丽·威廉姆森 :
无缝:多语言表达和流式语音翻译。 CoRR公司 abs/2312.05187 ( 2023 ) 2022 [公元34年] 云堂(Yun Tang) , 洪玉宫 , 宁东 , 王长汉(Changhan Wang) , 徐伟宁 , 顾嘉涛 , 阿列克谢·巴耶夫斯基 , 西安丽 , 阿卜杜勒拉赫曼·穆罕默德 , 迈克尔·奥利 , 胡安·米盖尔·皮诺 :
语音翻译和识别的统一语音-文本预训练。 ACL(1) 2022 : 1488-1499 [公元33年] 安·李 , 陈鹏仁 , 王长汉(Changhan Wang) , 顾嘉涛 , 斯拉维亚·波普里 , 许泰马 , 亚当·波利亚克 , 约西·阿迪 , 清河 , 云堂(Yun Tang) , 胡安·皮诺 , 徐伟宁 :
使用离散单元的直接语音转换。 ACL(1) 2022 : 3327-3339 [公元32年] 玄丕阮 , 洪玉宫 , 云堂(Yun Tang) , 王长汉(Changhan Wang) , 菲利普·科恩 , 沙菲克·乔蒂 :
对比聚类挖掘无监督翻译的伪并行数据。 ICLR公司 2022 [公元31年] Danni Liu(刘丹妮) , 王长汉(Changhan Wang) , 洪玉宫 , 许泰马 , 云堂(Yun Tang) , 胡安·米盖尔·皮诺 :
从开始到结束:同步语音转换中增量语音合成的延迟减少策略。 INTERSPEECH公司 2022 : 1771-1775 [公元30年] 阿伦·巴布 , 王长汉(Changhan Wang) , 安德洛斯·特詹德拉 , 库沙尔·拉霍蒂亚 , 徐千桐 , 纳曼·戈亚尔 , 克里蒂卡·辛格 , 帕特里克·冯·普拉滕 , 亚特哈特·萨拉夫 , 胡安·皮诺 , 阿列克谢·巴耶夫斯基 , 亚历克西斯·康诺 , 迈克尔·奥利 :
XLS-R:自我监督的跨语言言语表征学习量表。 棘突间 2022 : 2278-2282 [公元29年] 斯拉维亚·波普里 , 陈鹏仁 , 王长汉(Changhan Wang) , 胡安·皮诺 , 约西·阿迪 , 顾嘉涛 , 徐伟宁 , 安·李 :
使用自我监督的预训练和数据增强增强的直接语音转换。 INTERSPEECH公司 2022 : 5195-5199 [公元28年] 安东尼奥斯·阿纳斯塔索普洛斯 , 洛伊克·巴罗 , 路易斯·本蒂沃格利 , 马塞利·扎农·博伊托 , Ondrej Bojar公司 , 罗尔达诺·卡托尼 , 绘者 , 乔治亚娜·迪努 , 杜凯文(Kevin Duh) , 马哈·埃尔巴亚德 , 克拉拉·伊曼纽尔 , Yannick Estève公司 , 马塞洛·费德里科 , 克里斯蒂安·费德曼 , 苏希尔·加比奇 , 洪玉宫 , 罗曼·格兰基维奇 , 巴里·哈多 , 徐本杰明 , 达维德·贾沃斯克 , 维拉·克劳多娃 , 沙拉三明治Melaku Lakew , 许泰马 , 普拉桑特·马图尔 , 麦克纳米 , 肯顿·默里 , 玛丽亚·纳德杰德 , 中村佐治 , 马泰奥·内格里 , 简·尼休斯 , 杏牛 , 约翰·奥尔特加 , 胡安·米盖尔·皮诺 , 伊丽莎白·塞尔斯基 , 加通石 , 马蒂亚斯·斯珀伯 , 塞巴斯蒂安·施蒂克 , 胜下洙(Katsuhito Sudoh) , 马可·图尔奇 , 约格什·维尔卡 , 亚历山大·威贝尔 , 王长汉(Changhan Wang) , 渡边信治 :
IWSLT 2022评估活动的结果。 ACL处的IWSLT 2022 : 98-157 [公元27年] 安·李 , 洪玉宫 , 保尔·安布罗斯·杜昆 , 霍尔格·施文克 , 陈鹏仁 , 王长汉(Changhan Wang) , 斯拉维亚·波普里 , 约西·阿迪 , 胡安·米盖尔·皮诺 , 顾嘉涛 , 徐伟宁 :
基于真实数据的无文本语音转换。 NAACL-HLT公司 2022 : 860-872 [i33] 斯拉维亚·波普里 , 陈鹏仁 , 王长汉(Changhan Wang) , 胡安·皮诺 , 约西·阿迪 , 顾嘉涛 , 徐伟宁 , 安·李 :
使用自我监督的预训练和数据增强增强的直接语音转换。 CoRR公司 abs/2204.02967 ( 2022 ) [i32] 云堂(Yun Tang) , 洪玉宫 , 宁东 , 王长汉(Changhan Wang) , 徐伟宁 , 顾嘉涛 , 阿列克谢·巴耶夫斯基 , 西安丽 , 阿卜杜勒拉赫曼·穆罕默德 , 迈克尔·奥利 , 胡安·米盖尔·皮诺 :
语音翻译和识别的统一语音-文本预训练。 CoRR公司 abs/2204.05409 ( 2022 ) [i31] 王长汉(Changhan Wang) , 稻谷博文 , 陈鹏仁 , 伊利亚·库利科夫 , 云堂(Yun Tang) , 徐伟宁 , 迈克尔·奥利 , 胡安·皮诺 :
简单有效的无监督语音翻译。 CoRR公司 腹肌/2210.10191 ( 2022 ) [i30] 玄丕阮 , 斯拉维亚·波普里 , 王长汉(Changhan Wang) , 云堂(Yun Tang) , 伊利亚·库利科夫 , 洪玉宫 :
通过无标签文本改进语音转换。 CoRR公司 abs/2210.14514 ( 2022 ) [i29] 保尔·安布罗斯·杜昆 , 洪玉宫 , 宁东 , 杜景飞 , 安·李 , 韦达努伊·戈斯瓦米 , 王长汉(Changhan Wang) , 胡安·米盖尔·皮诺 , 贝诺西翁 , 霍尔格·施文克 :
SpeechMatrix:多语言语音转换的大规模挖掘语料库。 CoRR公司 abs/2211.04508 ( 2022 ) [第28条] 陈鹏仁 , 陈凯文(Kevin Tran) , 杨依林 , 杜景飞 , 贾斯汀·高 , 余安中 , 帕登·托马塞洛 , 保尔·安布罗斯·杜昆 , 霍尔格·施文克 , 洪玉宫 , 稻谷博文 , 斯拉维亚·波普里 , 王长汉(Changhan Wang) , 胡安·米盖尔·皮诺 , 徐伟宁 , 安·李 :
面向现实世界的非书面语言的语音翻译。 CoRR公司 腹肌/2211.06474 ( 2022 ) [i27] Derek Xu(德里克·许) , 舒延东(Shuyan Dong) , 王长汉(Changhan Wang) , 苏宇金(Suyoun Kim) , 林兆江 , 阿克沙特·施里瓦斯塔瓦 , 尚文丽 , 梁焕曾 , 阿列克谢·巴耶夫斯基 , 关廷林 , 李鸿业(Hung-yi Lee) , 孙益洲 , 王伟(音译) :
将语义引入语音编码器。 CoRR公司 abs/2211.08402 ( 2022 ) [i26] 稻谷博文 , 斯拉维亚·波普里 , 伊利亚·库利科夫 , 陈鹏仁 , 王长汉(Changhan Wang) , 余安中 , 云堂(Yun Tang) , 安·李 , 渡边信治 , 胡安·皮诺 :
UnitY:使用离散单元进行两遍直接语音转换。 CoRR公司 abs/2212.08055 ( 2022 ) 2021 [公元26年] 恒乐 , 胡安·米盖尔·皮诺 , 王长汉(Changhan Wang) , 顾嘉涛 , 迪迪埃·施瓦布 , 劳伦特·贝萨西尔 :
用于多语言语音翻译的轻量级适配器调整。 ACL/IJCNLP(2) 2021 : 817-824 [公元25年] 西安丽 , 王长汉(Changhan Wang) , 云堂(Yun Tang) , Chau Tran公司 , 余庆堂 , 胡安·米盖尔·皮诺 , 阿列克谢·巴耶夫斯基 , 亚历克西斯·康诺 , 迈克尔·奥利 :
通过预训练模型的有效微调实现多语言语音翻译。 ACL/IJCNLP(1) 2021 : 827-838 [公元24年] 王长汉(Changhan Wang) , Morgane Rivière公司 , 安·李 , 安妮·吴 , Chaitanya Talnikar公司 , 丹尼尔·哈齐扎 , 玛丽·威廉姆森 , 胡安·米盖尔·皮诺 , 伊曼纽尔·杜普克斯 :
VoxPopuli:用于表征学习、半监督学习和口译的大规模多语言语音语料库。 ACL/IJCNLP(1) 2021 : 993-1003 [c23] 云堂(Yun Tang) , 胡安·米盖尔·皮诺 , 西安丽 , 王长汉(Changhan Wang) , 德米特里·根泽尔 :
通过理解和学习辅助文本翻译任务改进语音翻译。 ACL/IJCNLP(1) 2021 : 4252-4261 [公元22年] 王长汉(Changhan Wang) , 徐伟宁 , 约西·阿迪 , 亚当·波利亚克 , 安·李 , 陈鹏仁 , 顾嘉涛 , 胡安·皮诺 :
fairseq S^2:一个可伸缩和可积的语音合成工具包。 EMNLP(演示) 2021 : 143-152 【c21】 云堂(Yun Tang) , 胡安·米盖尔·皮诺 , 王长汉(Changhan Wang) , 许泰马 , 德米特里·根泽尔 :
一个通用的多任务学习框架,用于将文本数据用于语音到文本任务。 ICASSP公司 2021 : 6209-6213 [公元20年] 王长汉(Changhan Wang) , 安妮·吴 , 胡安·皮诺 , 阿列克谢·巴耶夫斯基 , 迈克尔·奥利 , 亚历克西斯·康诺 :
语音翻译的大规模自我和半监督学习。 Interspeech公司 2021 : 2242-2246 [第19条] 王长汉(Changhan Wang) , 安妮·吴 , 顾嘉涛 , 胡安·皮诺 :
CoVoST 2和大规模多语言语音翻译。 Interspeech公司 2021 : 2247-2251 [第18条] 安东尼奥斯·阿纳斯塔索普洛斯 , Ondrej Bojar公司 , 雅各布·布雷默曼 , 罗尔达诺·卡托尼 , 马哈·埃尔巴亚德 , 马塞洛·费德里科 , 许泰马 , 中村佐治 , 马泰奥·内格里 , 简·尼休斯 , 胡安·米盖尔·皮诺 , 伊丽莎白·塞尔斯基 , 塞巴斯蒂安·施蒂克 , 胜下洙(Katsuhito Sudoh) , 马可·图尔奇 , 亚历克斯·魏贝尔 , 王长汉(Changhan Wang) , 马修·维斯纳 :
IWSLT 2021评估活动的结果。 IWSLT公司 2021 : 1-29 [第17条] 云堂(Yun Tang) , 洪玉宫 , 西安丽 , 王长汉(Changhan Wang) , 胡安·米盖尔·皮诺 , 霍尔格·施文克 , 纳曼·戈亚尔 :
FST:用于IWSLT21多语言共享任务的公平语音翻译系统。 IWSLT公司 2021 : 131-137 [i25] 王长汉(Changhan Wang) , Morgane Rivière公司 , 安·李 , 安妮·吴 , Chaitanya Talnikar公司 , 丹尼尔·哈齐扎 , 玛丽·威廉姆森 , 胡安·米盖尔·皮诺 , 伊曼纽尔·杜普克斯 :
VoxPopuli:用于表征学习、半监督学习和口译的大规模多语言语音语料库。 CoRR公司 绝对值/2101.00390 ( 2021 ) 【i24】 王长汉(Changhan Wang) , 安妮·吴 , 胡安·米盖尔·皮诺 , 阿列克谢·巴耶夫斯基 , 迈克尔·奥利 , 亚历克西斯·康诺 :
语音翻译的大规模自我和半监督学习。 CoRR公司 abs/2104.06678 ( 2021 ) [第23条] 杭乐 , 胡安·米盖尔·皮诺 , 王长汉(Changhan Wang) , 顾嘉涛 , 迪迪埃·施瓦布 , 劳伦特·贝萨西尔 :
用于多语言语音翻译的轻量级适配器调整。 CoRR公司 abs/2106.01463 ( 2021 ) [i22] 安·李 , 陈鹏仁 , 王长汉(Changhan Wang) , 顾嘉涛 , 许泰马 , 亚当·波利亚克 , 约西·阿迪 , 清河 , 云堂(Yun Tang) , 胡安·米盖尔·皮诺 , 徐伟宁 :
使用离散单元进行直接语音转换。 CoRR公司 abs/2107.05604 ( 2021 ) 【i21】 云堂(Yun Tang) , 胡安·米盖尔·皮诺 , 西安丽 , 王长汉(Changhan Wang) , 德米特里·根泽尔 :
通过理解和学习辅助文本翻译任务改进语音翻译。 CoRR公司 abs/2107.05782 ( 2021 ) [i20] 云堂(Yun Tang) , 洪玉宫 , 西安丽 , 王长汉(Changhan Wang) , 胡安·米盖尔·皮诺 , 霍尔格·施文克 , 纳曼·戈亚尔 :
FST:用于IWSLT21多语言共享任务的公平语音翻译系统。 CoRR公司 abs/2107.06959 ( 2021 ) [i19] 王长汉(Changhan Wang) , 徐伟宁 , 约西·阿迪 , 亚当·波利亚克 , 安·李 , 陈鹏仁 , 顾嘉涛 , 胡安·米盖尔·皮诺 :
fairseq S^2:一个可扩展和可集成的语音合成工具包。 CoRR公司 abs/2109.06912 ( 2021 ) [i18] Danni Liu(刘丹妮) , 王长汉(Changhan Wang) , 洪玉宫 , 许泰马 , 云堂(Yun Tang) , 胡安·米盖尔·皮诺 :
用于语音转换的增量语音合成。 CoRR公司 abs/2110.08214 ( 2021 ) [i17] 阿伦·巴布 , 王长汉(Changhan Wang) , 安德洛斯·特詹德拉 , 库沙尔·拉霍蒂亚 , 徐千桐 , 纳曼·戈亚尔 , 克里蒂卡·辛格 , 帕特里克·冯·普拉滕 , 亚特哈特·萨拉夫 , 胡安·皮诺 , 阿列克谢·巴耶夫斯基 , 亚历克西斯·康诺 , 迈克尔·奥利 :
XLS-R:自我监督的跨语言言语表征学习量表。 CoRR公司 abs/2111.09296 ( 2021 ) [i16] 安·李 , 洪玉宫 , 保尔·安布罗斯·杜昆 , 霍尔格·施文克 , 陈鹏仁 , 王长汉(Changhan Wang) , 斯拉维亚·波普里 , 胡安·米盖尔·皮诺 , 顾嘉涛 , 徐伟宁 :
基于真实数据的无文本语音转换。 CoRR公司 abs/2112.08352 ( 2021 ) 2020 [第16条] 王长汉(Changhan Wang) , Kyunghyun Cho(赵京贤) , 顾嘉涛 :
基于字节级子词的神经机器翻译。 AAAI公司 2020 : 9154-9160 [第15条] 恒乐 , 胡安·米盖尔·皮诺 , 王长汉(Changhan Wang) , 顾嘉涛 , 迪迪埃·施瓦布 , 劳伦特·贝萨西尔 :
用于联合自动语音识别和多语言语音翻译的双解码器变压器。 冷却 2020 : 3520-3533 [第14条] 许泰马 , 穆罕默德·贾瓦德·杜斯蒂 , 王长汉(Changhan Wang) , 顾嘉涛 , 胡安·米盖尔·皮诺 :
SIMULEVAL:同声翻译评估工具包。 EMNLP(演示) 2020 : 144-150 [第13条] 王长汉(Changhan Wang) , 云堂(Yun Tang) , 许泰马 , 安妮·吴 , 德米特罗·奥洪科 , 胡安·米盖尔·皮诺 :
Fairseq S2T:Fairsez的快速语音到文本建模。 AACL/IJCNLP(系统演示) 2020 : 33-39 [第12条] 安妮·吴 , 王长汉(Changhan Wang) , 胡安·米盖尔·皮诺 , 顾嘉涛 :
自我监督的表达改善了端到端的语音翻译。 INTERSPEECH公司 2020 : 1491-1495 [第11条] 王长汉(Changhan Wang) , 胡安·米盖尔·皮诺 , 顾嘉涛 :
利用语音翻译改进端到端语音识别的跨语言迁移学习。 INTERSPEECH公司 2020 : 4731-4735 [c10] 易卜拉欣·安萨里 , 阿米泰·阿克塞尔罗德 , 阮巴赫 , Ondrej Bojar公司 , 罗尔达诺·卡托尼 , 法希姆·达维 , 纳迪尔·杜拉尼 , 马塞洛·费德里科 , 克里斯蒂安·费德曼 , 顾嘉涛 , 费黄(Fei Huang) , 凯文·奈特 , 许泰马 , 阿杰·纳格什 , 马泰奥·内格里 , 简·尼休斯 , 胡安·米盖尔·皮诺 , 伊丽莎白·塞尔斯基 , 兴世 , 塞巴斯蒂安·施蒂克 , 马可·图尔奇 , 亚历山大·威贝尔 , 王长汉(Changhan Wang) :
IWSLT 2020评估活动的结果。 IWSLT公司 2020 : 1-34 【c9】 王长汉(Changhan Wang) , 胡安·米盖尔·皮诺 , 安妮·吴 , 顾嘉涛 :
CoVoST:一个多元化的多语言演讲-文本翻译语料库。 LREC公司 2020 : 4197-4203 【c8】 陈鹏仁 , 安·李 , 王长汉(Changhan Wang) , 纳曼·戈亚尔 , Angela Fan(安吉拉·范) , 玛丽·威廉姆森 , 顾嘉涛 :
脸书AI的WMT20新闻翻译任务提交。 WMT@EMNLP 2020 : 113-125 【i15】 王长汉(Changhan Wang) , 胡安·米盖尔·皮诺 , 安妮·吴 , 顾嘉涛 :
CoVoST:一个多元化的多语言演讲-文本翻译语料库。 CoRR公司 abs/2002.01320 ( 2020 ) [第14条] 王长汉(Changhan Wang) , 胡安·米盖尔·皮诺 , 顾嘉涛 :
利用语音翻译改进端到端语音识别的跨语言迁移学习。 CoRR公司 abs/2006.05474 ( 2020 ) [i13] 安妮·吴 , 王长汉(Changhan Wang) , 胡安·米盖尔·皮诺 , 顾嘉涛 :
自我监督的表达改善了端到端的语音翻译。 CoRR公司 abs/2006.12124 ( 2020 ) [i12] 王长汉(Changhan Wang) , 安妮·吴 , 胡安·米盖尔·皮诺 :
CoVoST 2:一个大规模的多语言语音到文本翻译语料库。 CoRR公司 abs/2007.10310 ( 2020 ) [i11] 许泰马 , 穆罕默德·贾瓦德·杜斯蒂 , 王长汉(Changhan Wang) , 顾嘉涛 , 胡安·米盖尔·皮诺 :
SimulEval:同声翻译评估工具包。 CoRR公司 腹肌/2007.16193 ( 2020 ) [i10] 王长汉(Changhan Wang) , 云堂(Yun Tang) , 许泰马 , 安妮·吴 , 德米特罗·奥洪科 , 胡安·米盖尔·皮诺 :
fairseq S2T:fairseq的快速语音到文本建模。 CoRR公司 abs/2010.05171 ( 2020 ) [第九章] 云堂(Yun Tang) , 胡安·米盖尔·皮诺 , 王长汉(Changhan Wang) , 许泰马 , 德米特里·根泽尔 :
一个通用的多任务学习框架,用于将文本数据用于语音到文本任务。 CoRR公司 abs/2010.11338 ( 2020 ) [i8] Chau Tran公司 , 王长汉(Changhan Wang) , 余庆堂 , 云堂(Yun Tang) , 胡安·米盖尔·皮诺 , 西安丽 :
多语言语音到文本翻译的跨模式迁移学习。 CoRR公司 abs/2010.12829 ( 2020 ) [i7] 恒乐 , 胡安·米盖尔·皮诺 , 王长汉(Changhan Wang) , 顾嘉涛 , 迪迪埃·施瓦布 , 劳伦特·贝萨西尔 :
用于联合自动语音识别和多语言语音翻译的双解码器变压器。 CoRR公司 abs/2011.00747 ( 2020 ) [i6] 陈鹏仁 , 安·李 , 王长汉(Changhan Wang) , 纳曼·戈亚尔 , Angela Fan(安吉拉·范) , 玛丽·威廉姆森 , 顾嘉涛 :
脸书AI的WMT20新闻翻译任务提交。 CoRR公司 abs/2011.08298 ( 2020 )
2010 – 2019
2019 【c7】 Terrance DeVries公司 , 伊斯汉·米斯拉 , 王长汉(Changhan Wang) , 劳伦斯·范德马滕 :
对象识别对每个人都有效吗? CVPR研讨会 2019 : 52-59 【c6】 王长汉(Changhan Wang) , 阿尼鲁德·贾恩 , 陈丹露 , 顾嘉涛 :
VizSeq:一个用于文本生成任务的可视化分析工具包。 EMNLP/IJCNLP(3) 2019 : 253-258 【c5】 顾嘉涛 , 王长汉(Changhan Wang) , 赵俊博 :
Levenshtein变压器。 NeurIPS公司 2019 : 11179-11189 [i5] 顾嘉涛 , 王长汉(Changhan Wang) , 杰克·赵 :
Levenshtein变压器。 CoRR公司 abs/1905.11006 ( 2019 ) [i4] Terrance DeVries公司 , 伊斯汉·米斯拉 , 王长汉(Changhan Wang) , 劳伦斯·范德马滕 :
对象识别对每个人都有效吗? CoRR公司 abs/1906.02659 ( 2019 ) [i3] 王长汉(Changhan Wang) , Kyunghyun Cho(赵京贤) , 顾嘉涛 :
基于字节级子词的神经机器翻译。 CoRR公司 abs/1909.03341 ( 2019 ) [i2] 王长汉(Changhan Wang) , 阿尼鲁德·贾恩 , 陈丹露 , 顾嘉涛 :
VizSeq:用于文本生成任务的可视化分析工具包。 CoRR公司 腹肌/1909.05424 ( 2019 ) 2018 【c4】 王长汉(Changhan Wang) , Kyunghyun Cho(赵京贤) , 杜威-基拉 :
具有嵌入注意的代码切换命名实体识别。 代码开关@ACL 2018 : 154-158 【c3】 杜威-基拉 , 王长汉(Changhan Wang) , Kyunghyun Cho(赵京贤) :
用于改进句子表示的动态元嵌入。 EMNLP公司 2018 : 1466-1477 [i1] 杜威-基拉 , 王长汉(Changhan Wang) , Kyunghyun Cho(赵京贤) :
用于改进句子表征的上下文注意嵌入。 CoRR公司 abs/1804.07983 ( 2018 ) 2015 【c2】 王长汉(Changhan Wang) , 辛陈燕 , 马克斯·史密斯 , 卡尼卡·科查尔 , 马西·鲁宾 , 史蒂芬·M·沃伦 , 詹姆斯·弗罗贝尔(James S.Wrobel) , 李洪拉克 :
使用深度卷积神经网络进行自动伤口分割和分析的统一框架。 欧洲工商管理委员会 2015 : 2415-2418 2013 【c1】 张宏欣 , 刘东雨 , 王长汉(Changhan Wang) :
内置:用于图像数据库浏览的交互式草图。 CAD/图形 2013 : 423-424