余安中
人员信息
SPARQL查询
优化列表
2020年–今天
2024 [公元24年] 恒瑞昌 , 宁东 , 鲁斯兰·马夫柳托夫 , 斯拉维亚·波普里 , 余安中 :
COLLD:用于压缩多语言预训练语音编码器的对比层到层蒸馏。 ICASSP公司 2024 : 10801-10805 2023 [c23] 陈鹏仁 , 陈凯文(Kevin Tran) , 杨依林 , 杜景飞 , 贾斯汀·高 , 余安中 , 帕登·托马塞洛 , 保罗·安布罗瓦斯·杜肯 , 霍尔格·施文克 , 洪玉宫 , 稻谷博文 , 斯拉维亚·波普里 , 王长汉(Changhan Wang) , 胡安·皮诺 , 徐伟宁 , 安·李 :
面向现实世界非书面语言的语音翻译。 ACL(调查结果) 2023 : 4969-4983 [公元22年] 稻谷博文 , 斯拉维亚·波普里 , 伊利亚·库利科夫 , 陈鹏仁 , 王长汉(Changhan Wang) , 余安中 , 云堂(Yun Tang) , 安·李 , 渡边信治 , 胡安·皮诺 :
UnitY:使用离散单元进行两遍直接语音转换。 ACL(1) 2023 : 15655-15680 [i32] 无缝通信 , 洛伊克·巴罗 , 余安中 , 玛丽亚诺·科丽亚·梅格里奥利 , 大卫·戴尔 , 宁东 , 保罗·安布罗瓦斯·杜肯 , 哈迪·埃尔萨哈尔 , 洪玉宫 , 凯文·赫夫南 , 约翰·霍夫曼 , 克里斯托弗·克莱伯 , 李鹏伟 , 丹尼尔·利希特 , 由第戎市长麦拉得 , 艾丽斯·拉科图雷森 , 考希克·拉姆·萨达戈潘 , 纪尧姆·温泽克 , 伊桑·叶 , 巴皮·阿库拉 , 陈鹏仁 , Naji El Hachem公司 , 布莱恩·埃利斯 , 加布里埃尔·梅加·冈萨雷斯 , 贾斯汀·哈海姆 , Prangship Hansanti公司 , 罗斯·豪斯 , 黄伯尼(Bernie Huang) , Min Jae Hwang女士 , 稻谷博文 , 索米亚·贾因 , Elahe Kalbassi公司 , 阿曼达·卡莱特 , 伊利亚·库利科夫 , 林碧珍 , 丹尼尔·李 , 许泰马 , 鲁斯兰·马夫柳托夫 , 本杰明·佩洛金 , 穆罕默德·拉马丹 , 阿比尼什·拉马克里希南 , 安娜·Y·孙 , 陈凯文(Kevin Tran) , 团结 , 伊戈尔·图法诺夫 , 维什·沃盖蒂 , 卡利·伍德 , 杨依林 , 余伯凯 , 皮埃尔·安德鲁斯 , 坎·巴利格鲁 , Marta R.Costa-jussá , Onur Celebi公司 , 马哈·埃尔巴亚德 , 辛西娅·高 , 弗朗西斯科·古兹曼 , 贾斯汀·高 , 安·李 , 亚历山大·穆拉赫科 , 胡安·皮诺 , 斯拉维亚·波普里 , 克里斯托夫·罗珀斯 , 萨菲亚·萨利姆 , 霍尔格·施文克 , 帕登·托马塞洛 , 王长汉(Changhan Wang) , 王建复 , 斯凯勒·王 :
SeamlessM4T-大规模多语言和多模态机器翻译。 CoRR公司 abs/2308.11596 ( 2023 ) [i31] 恒瑞昌 , 宁东 , 鲁斯兰·马夫柳托夫 , 斯拉维亚·波普里 , 余安中 :
CoLLD:用于压缩多语言预训练语音编码器的对比层到层提取。 CoRR公司 abs/2309.07707 ( 2023 ) [i30] 洛伊克·巴罗 , 余安中 , 玛丽亚诺·科丽亚·梅格里奥利 , 大卫·戴尔 , 宁东 , 马克·杜彭塔勒 , 保罗·安布罗瓦斯·杜肯 , 布莱恩·埃利斯 , 哈迪·埃尔萨哈尔 , 贾斯汀·哈海姆 , 约翰·霍夫曼 , Min Jae Hwang女士 , 稻谷博文 , 克里斯托弗·克莱伯 , 伊利亚·库利科夫 , 李鹏伟 , 丹尼尔·利希特 , 由第戎市长麦拉得 , 鲁斯兰·马夫柳托夫 , 艾丽斯·拉科图雷森 , 考希克·拉姆·萨达戈潘 , 阿比尼什·拉马克里希南 , 团结 , 纪尧姆·温泽克 , 杨依林 , 伊桑·叶 , 伊万·埃夫蒂莫夫 , 皮埃尔·费尔南德斯 , 辛西娅·高 , Prangship Hansanti公司 , Elahe Kalbassi公司 , 阿曼达·卡莱特 , Artyom Kozhevnikov公司 , 加布里埃尔·梅加·冈萨雷斯 , 罗宾·圣罗曼 , 克里斯托夫·图雷特 , 科琳·黄 , 卡利·伍德 , 余伯凯 , 皮埃尔·安德鲁斯 , 坎·巴利格鲁 , 陈鹏仁 , Marta R.Costa-jussá , 马哈·埃尔巴亚德 , 洪玉宫 , 弗朗西斯科·古兹曼 , 凯文·赫夫南 , 索米亚·贾因 , 贾斯汀·高 , 安·李 , 许泰马 , 亚历山大·穆拉赫科 , 本杰明·佩洛金 , 胡安·皮诺 , 斯拉维亚·波普里 , 克里斯托夫·罗珀斯 , 萨菲亚·萨利姆 , 霍尔格·施文克 , 安娜·Y·孙 , 帕登·托马塞洛 , 王长汉(Changhan Wang) , 王建复 , 斯凯勒·王 , 玛丽·威廉姆森 :
无缝:多语言表达和流式语音翻译。 CoRR公司 abs/2312.05187 ( 2023 ) 2022 【b1】 余安中 :
语音处理的自我监督学习。 美国麻省理工学院, 2022 [注2] 杨根平 , 宋琳叶 , 余安中 , 詹姆斯·格拉斯 , 郝唐 :
自回归预测编码:一项综合研究。 IEEE J.选择。 顶部。 信号处理。 16 ( 6 ) : 1380-1390 ( 2022 ) 【c21】 袁巩 , 程伊来 , 余安中 , 詹姆斯·格拉斯 :
SSAST:自我监督音频频谱变压器。 AAAI公司 2022 : 10699-10709 [i29] 陈鹏仁 , 陈凯文(Kevin Tran) , 杨依林 , 杜景飞 , 贾斯汀·高 , 余安中 , 帕登·托马塞洛 , 保罗·安布罗瓦斯·杜肯 , 霍尔格·施文克 , 洪玉宫 , 稻谷博文 , 斯拉维亚·波普里 , 王长汉(Changhan Wang) , 胡安·米盖尔·皮诺 , 徐伟宁 , 安·李 :
面向现实世界的非书面语言的语音翻译。 CoRR公司 abs/2211.06474 ( 2022 ) [第28条] 稻谷博文 , 斯拉维亚·波普里 , 伊利亚·库利科夫 , 陈鹏仁 , 王长汉(Changhan Wang) , 余安中 , 云堂(Yun Tang) , 安·李 , 渡边信治 , 胡安·皮诺 :
UnitY:使用离散单元进行两遍直接语音转换。 CoRR公司 abs/2212.08055 ( 2022 ) 2021 [j1] 袁巩 , 余安中 , 詹姆斯·格拉斯 :
PSLA:通过预训练、采样、标记和聚合改进音频标记。 IEEE ACM传输。 音频语音语言处理。 29 : 3292-3306 ( 2021 ) [公元20年] 余安中 , 张宇 , 魏翰 , Chung-Cheng Chiu公司 , 詹姆斯·秦 , 彭若明 , 吴永辉 :
w2v-BERT:将对比学习和屏蔽语言建模相结合,用于自我监督的语音预训练。 ASRU公司 2021 : 244-250 [第19条] 余安中 , 约纳坦·贝林科夫 , 詹姆斯·格拉斯 :
自我监督言语表征的相似性分析。 ICASSP公司 2021 : 3040-3044 [第18条] 袁巩 , 余安中 , 詹姆斯·格拉斯 :
AST:音频频谱变压器。 Interspeech公司 2021 : 571-575 [第17条] 亚历山大·H·刘 , 余安中 , 詹姆斯·格拉斯 :
从局部依赖学习语音表示的非自回归预测编码。 Interspeech公司 2021 : 3730-3734 [第16条] 余安中 , 朱晨光 , 迈克尔·曾 :
SPLAT:口语理解的口语联合预训练。 NAACL-HLT公司 2021 : 1897-1907 [i27] 袁巩 , 余安中 , 詹姆斯·格拉斯 :
PSLA:通过预训练、采样、标记和聚合改进音频事件分类。 CoRR公司 abs/2102.01243 ( 2021 ) [i26] 袁巩 , 余安中 , 詹姆斯·格拉斯 :
AST:音频频谱变压器。 CoRR公司 abs/2104.01778 ( 2021 ) [i25] 余安中 , 张宇 , 魏翰 , Chung-Cheng Chiu公司 , 詹姆斯·秦 , 彭若明 , 吴永辉 :
W2v-BERT:将对比学习和屏蔽语言建模相结合,用于自我监督的语音预训练。 CoRR公司 abs/2108.06209 ( 2021 ) 【i24】 袁巩 , 程一杰·赖 , 余安中 , 詹姆斯·格拉斯 :
SSAST:自我监督音频频谱变压器。 CoRR公司 abs/2110.09784 ( 2021 ) [第23条] 安库尔·巴纳 , 余安中 , 吴楠 , 安莫·古拉蒂 , 叶佳 , 乔纳森·克拉克 , 梅尔文·约翰逊 , 杰森·里萨 , 亚历克西斯·康诺 , 张宇 :
SLAM:通过语音-文本联合预训练进行语音和语言建模的统一编码器。 CoRR公司 abs/2110.10329 ( 2021 ) 2020 [第15条] 余安中 , 詹姆斯·格拉斯 :
用多目标自回归预测编码改进语音表示。 国际计算语言学协会 2020 : 2353-2358 [第14条] 余安中 , 詹姆斯·格拉斯 :
基于自回归预测编码的语音生成预训练。 ICASSP公司 2020 : 3497-3501 [第13条] 余安中 , 郝唐 , 詹姆斯·格拉斯 :
矢量量化自回归预测编码。 INTERSPEECH公司 2020 : 3760-3764 [第12条] 余安中 , 邵文阳 , 宣铁林 :
具有分层成本估算的成本敏感型深度学习。 TAAI公司 2020 : 108-113 [i22] 魏洪翁 , 余安中 , Schrasing大钳 :
基于句法否定和语义概念识别的临床文本总结。 CoRR公司 abs/2003.00353 ( 2020 ) 【i21】 余安中 , 詹姆斯·格拉斯 :
用多目标自回归预测编码改进语音表示。 CoRR公司 abs/2004.05274 ( 2020 ) [i20] 余安中 , 郝唐 , 詹姆斯·格拉斯 :
矢量量化自回归预测编码。 CoRR公司 abs/2005.08392 ( 2020 ) [i19] 余安中 , 朱晨光 , 迈克尔·曾 :
口语理解半监督口语-语言联合预训练。 CoRR公司 abs/2010.02295 ( 2020 ) [i18] 余安中 , 约纳坦·贝林科夫 , 詹姆斯·格拉斯 :
自我监督言语表征的相似性分析。 CoRR公司 abs/2010.11481 ( 2020 ) [i17] 亚历山大·H·刘 , 余安中 , 詹姆斯·格拉斯 :
从局部依赖学习语音表示的非自回归预测编码。 CoRR公司 abs/2011.00406 ( 2020 )
2010 – 2019
2019 [第11条] 徐伟宁 , 张宇 , 罗恩·韦斯 , 余安中 , 王宇轩 , 吴永辉 , 詹姆斯·格拉斯 :
通过数据增强和对抗因子分解分离相关说话人和噪声用于语音合成。 ICASSP公司 2019 : 5901-5905 [c10] 余安中 , 王宇轩 , 徐伟宁 , 张宇 , R.J.斯凯里·瑞恩 :
提高端到端语音合成数据效率的半监督训练。 ICASSP公司 2019 : 6940-6944 【c9】 余安中 , 魏洪翁 , Schrasing通 , 詹姆斯·格拉斯 :
走向无监督的演讲-文本翻译。 ICASSP公司 2019 : 7170-7174 【c8】 余安中 , 徐伟宁 , 郝唐 , 詹姆斯·格拉斯 :
语音表征学习的无监督自回归模型。 INTERSPEECH公司 2019 : 146-150 【c7】 魏洪翁 , 余安中 , 彼得·索洛维茨 :
无监督临床语言翻译。 KDD公司 2019 : 3121-3131 [i16] 魏洪翁 , 余安中 , 彼得·索洛维茨 :
无监督临床语言翻译。 CoRR公司 abs/1902.01177 ( 2019 ) 【i15】 余安中 , 徐伟宁 , 郝唐 , 詹姆斯·格拉斯 :
语音表征学习的无监督自回归模型。 CoRR公司 abs/1904.03240 ( 2019 ) [第14条] 魏芳 , 余安中 , 詹姆斯·格拉斯 :
基于深度预训练语言模型的端到端语音合成的迁移学习。 CoRR公司 abs/1906.07307 ( 2019 ) [i13] 彼得·J·刘 , 余安中 , 杰仁 :
SummaAE:使用长度不确定性自动编码器的零镜头抽象文本摘要。 CoRR公司 abs/1910.00998 ( 2019 ) [i12] 余安中 , 詹姆斯·格拉斯 :
基于自回归预测编码的语音生成预训练。 CoRR公司 abs/1910.12607 ( 2019 ) 2018 【c6】 余安中 , 詹姆斯·格拉斯 :
Speech2Vec:一个从语音中学习单词嵌入的序列到序列框架。 INTERSPEECH公司 2018 : 811-815 【c5】 余安中 , 李鸿业(Hung-yi Lee) , 詹姆斯·格拉斯 :
有监督和无监督的问题回答迁移学习。 NAACL-HLT公司 2018 : 1585-1594 【c4】 余安中 , 魏洪翁 , Schrasing通 , 詹姆斯·格拉斯 :
语音和文本嵌入空间的无监督跨模式对齐。 NeurIPS公司 2018 : 7365-7375 [i11] 余安中 , 詹姆斯·格拉斯 :
Speech2Vec:一个从语音中学习单词嵌入的序列到序列框架。 CoRR公司 abs/1803.08976 ( 2018 ) [i10] 余安中 , 魏洪翁 , Schrasing通 , 詹姆斯·格拉斯 :
语音和文本嵌入空间的无监督跨模式对齐。 CoRR公司 abs/1805.07467 ( 2018 ) [第九章] 余安中 , 王宇轩 , 徐伟宁 , 张宇 , R.J.斯凯里·瑞恩 :
提高端到端语音合成数据效率的半监督培训。 CoRR公司 abs/1808.10128 ( 2018 ) [i8] 余安中 , 魏洪翁 , Schrasing通 , 詹姆斯·格拉斯 :
走向无监督的演讲-文本翻译。 CoRR公司 abs/1811.01307 ( 2018 ) 2017 [i7] 姚元阳 , 李少川 , 余安中 , 董恩武 , 陈思安(Si-An Chen) , 玄天麟 :
libact:Python中基于池的主动学习。 CoRR公司 abs/1710.00379 ( 2017 ) [i6] 余安中 , 詹姆斯·格拉斯 :
从演讲中学习单词嵌入。 CoRR公司 abs/1711.01515 ( 2017 ) [i5] 余安中 , 李鸿祎 , 詹姆斯·格拉斯 :
有监督和无监督的问题回答迁移学习。 CoRR公司 abs/1711.05345 ( 2017 ) [i4] 余安中 , 魏洪翁 :
使用暹罗CNN学习医学图像的深度表示,并应用于基于内容的图像检索。 CoRR公司 abs/1711.08490 ( 2017 ) 2016 【c3】 余安中 , 宣铁林 , 邵文阳 :
针对多类成本敏感型深度学习的成本软件预培训。 国际JCAI 2016 : 1411-1417 【c2】 余安中 , 吴朝昌 , 沈嘉浩 , 李鸿业(Hung-yi Lee) , 李林山 :
音频Word2Vec:使用序列对序列自动编码器的音频段表示的无监督学习。 INTERSPEECH公司 2016 : 765-769 [i3] 余安中 , 吴朝昌 , 沈嘉浩 , 李鸿业(Hung-yi Lee) , 李林山 :
音频Word2Vec:使用序列对序列自动编码器的音频段表示的无监督学习。 CoRR公司 abs/1603.00982 ( 2016 ) [i2] 余安中 , 宣铁林 :
具有分层成本估算的成本敏感型深度学习。 CoRR公司 abs/1611.05134 ( 2016 ) 2015 【c1】 陈伟煌 , 余安中 , 黄培树 , 曹小丽 :
嵌入式图形处理器的高级能耗模型。 数字信号处理器 2015 : 105-109 [i1] 余安中 , 宣铁林 , 邵文阳 :
针对多类成本敏感深度学习的成本软件预培训。 CoRR公司 腹肌/1511.09337 ( 2015 )