马修·维斯纳
人员信息
优化列表
2020年–今天
2024 [i19] 德什·拉吉 , 马修·维斯纳 , 马修·马西耶夫斯基 , 莱布尼·保拉·加西亚·佩雷拉 , 丹尼尔·波维 , 桑吉夫·库丹普尔 :
论SURT中的说话人归因。 CoRR公司 腹肌/2401.15676 ( 2024 ) 2023 [公元24年] 黄瑞哲 , 马修·维斯纳 , 莱布尼·保拉·加西亚·佩雷拉 , 丹尼尔·波维 , Jan Trmal公司 , 桑吉夫·库丹普尔 :
从端到端Asr系统构建关键字搜索系统。 ICASSP公司 2023 : 1-5 【c23】 布莱恩·燕 , 马修·维斯纳 , 昂德雷·克莱奇 , 普雷西·乔蒂(Preethi Jyothi) , 渡边信治 :
朝向零炮编码切换语音识别。 ICASSP公司 2023 : 1-5 [公元22年] 阿米尔·侯赛因 , 萧慈涵 , 尼哈·维尔玛 , 托马斯·特波特 , 马修·维斯纳 , 桑吉夫·库丹普尔 :
JHU IWSLT 2023方言语音翻译系统描述。 ACL处的IWSLT 2023 : 283-290 【c21】 亨利·李新元 , 尼哈·维尔玛 , 俾斯麦巴姆福·奥多姆 , 乌伊瓦拉·普拉迪普 , 马修·维斯纳 , 桑吉夫·库丹普尔 :
JHU IWSLT 2023多语言语音翻译系统描述。 ACL处的IWSLT 2023 : 302-310 [i18] 东吉高 , 马修·维斯纳 , 海南徐 , 莱布尼·保拉·加西亚 , 丹尼尔·波维 , 桑吉夫·库丹普尔 :
绕过时间分类:具有不完整抄本的弱监督自动语音识别。 CoRR公司 腹肌/2306.01031 ( 2023 ) [i17] 萧慈涵 , 亨利·李新元 , 杨金一 , 东吉高 , 马修·维斯纳 , 杜凯文(Kevin Duh) , 桑吉夫·库丹普尔 :
HK-LegiCoST:利用非言语抄本进行语音翻译。 CoRR公司 abs/2306.11252 ( 2023 ) [i16] 萨缪尔·康奈尔 , 马修·维斯纳 , 渡边信治 , 德什·拉吉 , 张玄凯 , 保拉·加西亚 , 吉木正山 , 王忠秋 , 斯特凡诺·斯夸蒂尼 , 桑吉夫·库丹普尔 :
CHiME-7 DASR挑战:在不同场景中使用多个设备进行远程会议转录。 CoRR公司 abs/2306.13734 ( 2023 ) 【i15】 阿米尔·侯赛因 , 多尔萨·泽纳利 , 昂德雷·克莱奇 , 马修·维斯纳 , 布莱恩·燕 , Shammur Absar Chowdhury公司 , 艾哈迈德·阿里 , 渡边信治 , 桑吉夫·库丹普尔 :
语音拼贴:通过拼贴单语语料库生成代码切换音频。 CoRR公司 abs/2309.15674 ( 2023 ) 2022 [公元20年] 马修·维斯纳 , 德什·拉吉 , 桑吉夫·库丹普尔 :
在自我监督模式下的少数快照学习中注入文本和跨语言监督。 ICASSP公司 2022 : 8597-8601 [第19条] 杨金一 , 阿米尔·侯赛因 , 马修·维斯纳 , 桑吉夫·库丹普尔 :
JHU IWSLT 2022方言语音翻译系统描述。 ACL处的IWSLT 2022 : 319-326 [第14条] 布莱恩·严 , 马修·维斯纳 , 昂德雷·克莱奇 , 普雷西·乔蒂(Preethi Jyothi) , 渡边信治 :
朝向零炮编码切换语音识别。 CoRR公司 abs/2211.01458 ( 2022 ) 2021 [第18条] 马修·维斯纳 , 穆斯米塔·萨尔马 , 阿什什·阿罗拉 , 德什·拉吉 , 东吉高 , 黄瑞哲 , Supreet预告 , 莫里斯·约翰逊 , 齐克拉·伊克巴尔 , 纳根德拉·戈尔 , Jan Trmal公司 , 莱布尼·保拉·加西亚·佩雷拉 , 桑吉夫·库丹普尔 :
针对编码切换语音识别的噪声音译文本训练混合模型。 Interspeech公司 2021 : 2010年6月29日 [第17条] 伊丽莎白·塞尔斯基 , 马修·维斯纳 , 雅各布·布雷默曼 , 罗尔达诺·卡托尼 , 马泰奥·内格里 , 马可·图尔奇 , 道格拉斯·W·奥德 , 马特·波斯特 :
用于语音识别和翻译的多语言TEDx语料库。 Interspeech公司 2021 : 3655-3659 [第16条] 安东尼奥斯·阿纳斯塔索普洛斯 , Ondrej Bojar公司 , 雅各布·布雷默曼 , 罗尔达诺·卡托尼 , 马哈·埃尔巴亚德 , 马塞洛·费德里科 , 许泰马 , 中村佐治 , 马泰奥·内格里 , 简·尼休斯 , 胡安·米盖尔·皮诺 , 伊丽莎白·塞尔斯基 , 塞巴斯蒂安·施蒂克 , 胜下洙(Katsuhito Sudoh) , 马可·图尔奇 , 亚历克斯·魏贝尔 , 王长汉(Changhan Wang) , 马修·维斯纳 :
IWSLT 2021评估活动的结果。 IWSLT公司 2021 : 1-29 [第15条] Motoi Omachi公司 , 藤田裕雅 , 渡边信治 , 马修·维斯纳 :
端到端ASR联合预测转录和语言注释。 NAACL-HLT公司 2021 : 1861-1871 [i13] 伊丽莎白·塞尔斯基 , 马修·维斯纳 , 雅各布·布雷默曼 , 罗尔达诺·卡托尼 , 马泰奥·内格里 , 马可·图尔奇 , 道格拉斯·W·奥德 , 马特·波斯特 :
语音识别和翻译的多语言TEDx语料库。 CoRR公司 abs/2102.01757 ( 2021 ) [i12] 马修·维斯纳 , 德什·拉吉 , 桑吉夫·库丹普尔 :
在自我监督模式下的少数快照学习中注入文本和跨语言监督。 CoRR公司 abs/2110.04863 ( 2021 ) 2020 [第14条] 伊丽莎白·塞尔斯基 , 埃莉诺·乔德罗夫 , 蒂亚戈·皮门特尔 , 马修·维斯纳 , 瑞恩·科特雷尔 , 艾伦·W·布莱克 , 杰森·艾斯纳 :
大型语音类型学语料库。 国际计算语言学协会 2020 : 4526-4546 [第13条] 奥利弗·亚当斯 , 马修·维斯纳 , Jan Trmal公司 , 加勒特·尼古莱 , 大卫·亚罗斯基 :
诱发屈折-在语音中设置关键字搜索。 SIGMORPHON公司 2020 : 210-216年 [i11] 伊丽莎白·塞尔斯基 , 埃莉诺·乔德罗夫 , 蒂亚戈·皮门特尔 , 马修·维斯纳 , 瑞恩·科特雷尔 , 艾伦·W·布莱克 , 杰森·艾斯纳 :
大型语音类型学语料库。 CoRR公司 abs/2005.13962 ( 2020 )
2010 – 2019
2019 [c12] 马修·维斯纳 , 奥利弗·亚当斯 , 大卫·亚罗斯基 , Jan Trmal公司 , 桑吉夫·库丹普尔 :
跨语言声学模型传输的零炮发音词典。 ASRU公司 2019 : 1048-1054 [第11条] 马丁·卡拉法特 , 穆拉利·卡西姆·巴斯卡 , 渡边信治 , 高崎县 , 马修·维斯纳 , 扬·塞诺克(Jan Cernock) :
多语言序列对序列语音识别系统分析。 INTERSPEECH公司 2019 : 2220-2224 [第10条] 马修·维斯纳 , Adithya Renduchintala公司 , 渡边信治 , 刘春熙 , 纳吉姆·德哈克 , 桑吉夫·库丹普尔 :
在低资源设置中通过反向翻译进行端到端ASR的预训练。 INTERSPEECH公司 2019 : 4375-4379 【c9】 奥利弗·亚当斯 , 马修·维斯纳 , 渡边信治 , 大卫·亚罗斯基 :
大规模多语言对手语音识别。 NAACL-HLT(1) 2019 : 96年至108年 [i10] 奥利弗·亚当斯 , 马修·维斯纳 , 渡边信治 , 大卫·亚罗斯基 :
大规模多语言对手语音识别。 CoRR公司 abs/1904.02210 ( 2019 ) [第九章] 奥利弗·亚当斯 , 马修·维斯纳 , Jan Trmal公司 , 加勒特·尼古莱 , 大卫·亚罗斯基 :
诱发屈折-在语音中设置关键字搜索。 CoRR公司 abs/1910.12299 ( 2019 ) 2018 【c8】 马修·维斯纳 , 刘春熙 , 卢卡斯·昂德尔 , 克雷格·哈曼 , 维马尔·马诺哈 , Jan Trmal公司 , 黄忠强 , 纳吉姆·德哈克 , 桑吉夫·库丹普尔 :
Almost-Zero-Resource语言的自动语音识别和主题识别。 INTERSPEECH公司 2018 : 2052-2056 【c7】 渡边信治 , 高崎县 , Shigeki Karita公司 , Tomoki Hayashi先生 , 西岛义郎 , 尤亚·恩诺 , 纳尔逊·恩里克·雅尔塔·索普林 , 扬·海曼 , 马修·维斯纳 , 陈南欣 , Adithya Renduchintala公司 , Tsubasa Ochiai公司 :
ESPnet:端到端语音处理工具包。 INTERSPEECH公司 2018 : 2207-2211 【c6】 Adithya Renduchintala公司 , 朔阳顶 , 马修·维斯纳 , 渡边信治 :
端到端ASR的多模式数据增强。 INTERSPEECH公司 2018 : 2394-2398 【c5】 Jaejin Cho公司 , 穆拉利·卡西姆·巴斯卡 , 李瑞芝 , 马修·维斯纳 , 斯里·哈里什·马利迪 , 纳尔逊·雅尔塔 , 马丁·卡拉法特 , 渡边信治 , 高崎县 :
多语言序列对序列语音识别:架构、迁移学习和语言建模。 SLT公司 2018 : 521-527 【c4】 刘春熙 , 马修·维斯纳 , 渡边信治 , 克雷格·哈曼 , Jan Trmal公司 , 纳吉姆·德哈克 , 桑吉夫·库丹普尔 :
言语中的低资源语境主题识别。 SLT公司 2018 : 656-663 [i8] 马修·维斯纳 , 刘春熙 , 卢卡斯·昂德尔 , 克雷格·哈曼 , 维马尔·马诺哈 , Jan Trmal公司 , 黄忠强 , 桑吉夫·库丹普尔 , 纳吉姆·德哈克 :
JHU Speech LOREHLT 2017系统:用于态势帧检测的跨语言传输。 CoRR公司 abs/1802.08731 ( 2018 ) [i7] Adithya Renduchintala公司 , 朔阳顶 , 马修·维斯纳 , 渡边信治 :
端到端ASR的多模式数据增强。 CoRR公司 腹肌/180310299 ( 2018 ) [i6] 渡边信治 , 高崎县 , Shigeki Karita公司 , Tomoki Hayashi先生 , 西岛义郎 , 尤亚·恩诺 , 纳尔逊·恩里克·雅尔塔·索普林 , 扬·海曼 , 马修·维斯纳 , 陈南欣 , Adithya Renduchintala公司 , Tsubasa Ochiai公司 :
ESPnet:端到端语音处理工具包。 CoRR公司 abs/1804.00015 ( 2018 ) [i5] 刘春喜 , 马修·维斯纳 , 渡边信治 , 克雷格·哈曼 , Jan Trmal公司 , 纳吉姆·德哈克 , 桑吉夫·库丹普尔 :
基于语音的低资源上下文主题识别。 CoRR公司 abs/1807.06204 ( 2018 ) [i4] 杰金·赵(Jaejin Cho) , Murali Karthick Baskar公司 , 李瑞芝 , 马修·维斯纳 , Sri Harish Reddy Mallidi女士 , 纳尔逊·雅尔塔 , 马丁·卡拉法特 , 渡边信治 , 高崎县 :
多语言序列到序列语音识别:架构、迁移学习和语言建模。 CoRR公司 abs/1810.03459 ( 2018 ) [i3] 马丁·卡拉法特 , 穆拉利·卡西姆·巴斯卡 , 渡边信治 , 高崎县 , 马修·维斯纳 , 简·本扎·塞诺克(Jan Honza Cernock) :
多语言序列对序列语音识别系统分析。 CoRR公司 abs/1811.03451 ( 2018 ) [i2] 马修·维斯纳 , Adithya Renduchintala公司 , 渡边信治 , 刘春熙 , 纳吉姆·德哈克 , 桑吉夫·库丹普尔 :
端到端ASR的低资源多模式数据增强。 CoRR公司 abs/1812.03919 ( 2018 ) 2017 【c3】 刘春熙 , Jan Trmal公司 , 马修·维斯纳 , 克雷格·哈曼 , 桑吉夫·库丹普尔 :
无ASR语音的主题识别。 INTERSPEECH公司 2017 : 2501-2505 [c2] Jan Trmal公司 , 马修·维斯纳 , 维贾亚迪提亚·佩丁蒂 , 张晓慧 , 佩加·加赫勒马尼 , 王一鸣 , 维马尔·马诺哈 , 海南徐 , 丹尼尔·波维 , 桑吉夫·库丹普尔 :
Kaldi OpenKWS系统:改进低资源关键字搜索。 INTERSPEECH公司 2017 : 3597-3601 [i1] 刘春熙 , Jan Trmal公司 , 马修·维斯纳 , 克雷格·哈曼 , 桑吉夫·库丹普尔 :
无ASR语音的主题识别。 CoRR公司 abs/1703.07476 ( 2017 ) 2015 【c1】 海内克·赫尔曼斯基 , 卢卡斯汉堡 , 乔丹·科恩 , 伊曼纽尔·杜普克斯 , 内奥米·费尔德曼 , 高德菲 , 桑吉夫·库丹普尔 , 马修·马西耶夫斯基 , Sri Harish Reddy Mallidi女士 , 安贾利·梅农 , 小川哲治 , 维贾亚迪提亚·佩丁蒂 , 理查德·罗斯 , 理查德·斯特恩 , 马修·维斯纳 , 卡雷尔·维塞尔 :
面向知道何时不知道的机器:2014年弗雷德里克·杰利内克纪念研讨会工作总结。 ICASSP公司 2015 : 5009-5013