稻谷博文
人员信息
SPARQL查询
优化列表
2020年–今天
2024 [公元40年] 加通石 , 稻谷博文 , 许泰马 , 伊利亚·库利科夫 , 安娜·Y·孙 :
多分辨率HuBERT:带屏蔽单元预测的多分辨率语音自我监督学习。 ICLR公司 2024 [i40] 加通石 , 许泰马 , 稻谷博文 , 安娜·Y·孙 , 渡边信治 :
MMM:自监督学习模型的多层多剩余多流离散语音表示。 CoRR公司 abs/2406.09869 ( 2024 ) [i39] 黄朝伟 , 慧露 , 洪玉宫 , 稻谷博文 , 伊利亚·库利科夫 , 鲁斯兰·马夫柳托夫 , 斯拉维亚·波普里 :
研究用于语音到文本翻译的仅解码大型语言模型。 CoRR公司 abs/2407.03169 ( 2024 ) 2023 [j1] 稻谷博文 , 川原达也 :
在线流式关注语音识别中的对齐知识提取。 IEEE ACM传输。 音频语音语言处理。 31 : 1371-1385 ( 2023 ) [公元39年] 布莱恩·燕 , 加通石 , 云堂(Yun Tang) , 稻谷博文 , 彭一凡 , Siddharth Dalmia公司 , 彼得·波拉克 , 帕特里克·费尔南德斯 , 丹·贝雷比 , Tomoki Hayashi先生 , 张晓慧 , 倪兆亨 , Moto Hira公司 , Soumi Maiti公司 , 胡安·皮诺 , 渡边信治 :
ESPnet-ST-v2:多用途口语翻译工具包。 ACL(演示) 2023 : 400-411 [公元38年] 陈鹏仁 , 陈凯文(Kevin Tran) , 杨依林 , 杜景飞 , 贾斯汀·高 , 余安中 , 帕登·托马塞洛 , 保尔·安布罗斯·杜昆 , 霍尔格·施文克 , 洪玉宫 , 稻谷博文 , 斯拉维亚·波普里 , 王长汉(Changhan Wang) , 胡安·皮诺 , 徐伟宁 , 安·李 :
面向现实世界非书面语言的语音翻译。 ACL(调查结果) 2023 : 4969-4983 [公元37年] 王长汉(Changhan Wang) , 稻谷博文 , 陈鹏仁 , 伊利亚·库利科夫 , 云堂(Yun Tang) , 徐伟宁 , 迈克尔·奥利 , 胡安·皮诺 :
简单有效的无监督语音翻译。 ACL(1) 2023 : 10771-10784 [公元36年] 云堂(Yun Tang) , 安娜·Y·孙 , 稻谷博文 , 陈新跃(Xinyue Chen) , 宁东 , 许泰马 , 帕登·托马塞洛 , 胡安·皮诺 :
用于语音对文本任务的混合传感器和基于注意的编码器-解码器建模。 ACL(1) 2023 : 12441-12455 [公元35年] 稻谷博文 , 斯拉维亚·波普里 , 伊利亚·库利科夫 , 陈鹏仁 , 王长汉(Changhan Wang) , 余安中 , 云堂(Yun Tang) , 安·李 , 渡边信治 , 胡安·皮诺 :
UnitY:使用离散单元进行两遍直接语音转换。 ACL(1) 2023 : 15655-15680 [公元34年] 马尔科·盖多 , 云堂(Yun Tang) , 伊利亚·库利科夫 , 黄荣庆 , 洪玉宫 , 稻谷博文 :
用于直接语音翻译的命名实体检测和注入。 ICASSP公司 2023 : 1-5 [公元33年] 加通石 , 云堂(Yun Tang) , 安·李 , 稻谷博文 , 王长汉(Changhan Wang) , 胡安·皮诺 , 渡边信治 :
使用多个TTS目标增强语音转换。 ICASSP公司 2023 : 1-5 [公元32年] 加通石 , 云堂(Yun Tang) , 稻谷博文 , 洪玉宫 , 胡安·皮诺 , 渡边信治 :
多分辨率HuBERT的探索。 棘突间 2023 : 3287-3291 [公元31年] 斯威塔·阿格拉瓦尔 , 安东尼奥斯·阿纳斯塔索普洛斯 , 路易斯·本蒂沃格利 , Ondrej Bojar公司 , 克劳迪娅·博格 , 海洋木瓜 , 罗尔达诺·卡托尼 , 毛罗·塞托洛 , 陈明达 , 威廉·陈 , 哈立德·乔克里 , 亚历山德拉·克洛诺普鲁(Alexandra Chronopoulou) , 绘者 , 蒂埃里·德克勒克 , 向前东 , 杜凯文(Kevin Duh) , Yannick Estève公司 , 马塞洛·费德里科 , 苏希尔·加比奇 , 巴里·哈多 , 徐本杰明 , Phu Mon Htut公司 , 稻谷博文 , 达维德·贾沃斯克 , 约翰·贾奇 , 关野康正 , 汤姆·科 , 里舒·库马尔 , 李鹏伟 , 许泰马 , 普拉桑特·马图尔 , 叶夫根尼·马图索夫 , 麦克纳米 , 约翰·麦克雷 , 肯顿·默里 , 玛丽亚·纳德杰德 , 中村佐治 , 马泰奥·内格里 , Ha Nguyen先生 , 简·尼休斯 , 杏牛 , Atul Kr.Ojha公司 , 约翰·奥尔特加 , 普罗亚格·帕尔 , 胡安·皮诺 , 隆内克·范德普拉斯 , 彼得·波拉克 , 以利亚·里佩斯 , 伊丽莎白·塞尔斯基 , 加通石 , 马蒂亚斯·斯珀伯 , 塞巴斯蒂安·施蒂克 , 胜下洙(Katsuhito Sudoh) , 云堂(Yun Tang) , 布赖恩·汤普森 , 陈凯文(Kevin Tran) , 马可·图尔奇 , 亚历克斯·魏贝尔 , 王明轩 , 渡边信治 , 鲁道夫·泽瓦洛斯 :
IWSLT 2023评估活动的结果。 ACL处的IWSLT 2023 : 1-61 [i38] 加通石 , 云堂(Yun Tang) , 安·李 , 稻谷博文 , 王长汉(Changhan Wang) , 胡安·皮诺 , 渡边信治 :
使用多个TTS目标增强语音转换。 CoRR公司 abs/2304.04618 ( 2023 ) [i37] 云堂(Yun Tang) , 安娜·Y·孙 , 稻谷博文 , 陈新跃(Xinyue Chen) , 宁东 , 许泰马 , 巴登·D·托马塞洛 , 胡安·皮诺 :
用于语音对文本任务的混合传感器和基于注意的编码器-解码器建模。 CoRR公司 腹肌/2305.03101 ( 2023 ) [公元36年] 加通石 , 云堂(Yun Tang) , 稻谷博文 , 洪玉宫 , 胡安·皮诺 , 渡边信治 :
多分辨率HuBERT探索。 CoRR公司 abs/2306.01084 ( 2023 ) [i35] 无缝通信 , 洛伊克·巴罗 , 余安中 , 玛丽亚诺·科丽亚·梅格里奥利 , 大卫·戴尔 , 宁东 , 保尔·安布罗斯·杜昆 , 哈迪·埃尔萨哈 , 洪玉宫 , 凯文·赫夫南 , 约翰·霍夫曼 , 克里斯托弗·克莱伯 , 李鹏伟 , 丹尼尔·利希特 , 由第戎市长麦拉得 , 艾丽斯·拉科图雷森 , 考希克·拉姆·萨达戈潘 , 纪尧姆·温泽克 , 伊桑·叶 , 巴皮·阿库拉 , 陈鹏仁 , Naji El Hachem公司 , 布莱恩·埃利斯 , 加布里埃尔·梅贾·冈萨雷斯 , 贾斯汀·哈海姆 , Prangship Hansanti公司 , 罗斯·豪斯 , 黄伯尼(Bernie Huang) , 黄敏杰 , 稻谷博文 , 索米亚·贾因 , Elahe Kalbassi公司 , 阿曼达·卡莱特 , 伊利亚·库利科夫 , 林碧珍 , 丹尼尔·李 , 许泰马 , 鲁斯兰·马夫柳托夫 , 本杰明·佩洛金 , 穆罕默德·拉马丹 , 阿比尼什·拉马克里希南 , 安娜·Y·孙 , 陈凯文(Kevin Tran) , 团结 , 伊戈尔·图法诺夫 , 维什·沃盖蒂 , 卡利·伍德 , 杨依林 , 余伯凯 , 皮埃尔·安德鲁斯 , 坎·巴利格鲁 , Marta R.Costa-jussá , Onur Celebi公司 , 马哈·埃尔巴亚德 , 辛西娅·高 , 弗朗西斯科·古兹曼 , 贾斯汀·高 , 安·李 , 亚历山大·穆拉赫科 , 胡安·皮诺 , 斯拉维亚·波普里 , 克里斯托夫·罗珀斯 , 萨菲亚·萨利姆 , 霍尔格·施文克 , 帕登·托马塞洛 , 王长汉(Changhan Wang) , 王建复 , 斯凯勒·王 :
SeamlessM4T-大规模多语言和多模态机器翻译。 CoRR公司 abs/2308.11596 ( 2023 ) [i34] 加通石 , 稻谷博文 , 许泰马 , 伊利亚·库利科夫 , 安娜·Y·孙 :
多分辨率HuBERT:带屏蔽单元预测的多分辨率语音自我监督学习。 CoRR公司 abs/2310.02720 ( 2023 ) [i33] 许泰马 , 安娜·Y·孙 , 四七欧阳 , 稻谷博文 , 帕登·托马塞洛 :
高效的单调多头注意力。 CoRR公司 abs/2312.04515 ( 2023 ) [i32] 洛伊克·巴罗 , 余安中 , 玛丽亚诺·科丽亚·梅格里奥利 , 大卫·戴尔 , 宁东 , 马克·杜彭塔勒 , 保尔·安布罗斯·杜昆 , 布莱恩·埃利斯 , 哈迪·埃尔萨哈 , 贾斯汀·哈海姆 , 约翰·霍夫曼 , 黄敏杰 , 稻谷博文 , 克里斯托弗·克莱伯 , 伊利亚·库利科夫 , 李鹏伟 , 丹尼尔·利希特 , 由第戎市长麦拉得 , 鲁斯兰·马夫柳托夫 , 艾丽斯·拉科图雷森 , 考希克·拉姆·萨达戈潘 , 阿比尼什·拉马克里希南 , 团结 , 纪尧姆·温泽克 , 杨依林 , 伊桑·叶 , 伊万·埃夫蒂莫夫 , 皮埃尔·费尔南德斯 , 辛西娅·高 , Prangship Hansanti公司 , Elahe Kalbassi公司 , 阿曼达·卡莱特 , Artyom Kozhevnikov先生 , 加布里埃尔·梅贾·冈萨雷斯 , 罗宾·圣罗曼 , 克里斯托弗·图雷 , 科琳·黄 , 卡利·伍德 , 余伯凯 , 皮埃尔·安德鲁斯 , 坎·巴利格鲁 , 陈鹏仁 , Marta R.Costa-jussá , 马哈·埃尔巴亚德 , 洪玉宫 , 弗朗西斯科·古兹曼 , 凯文·赫夫南 , 索米亚·贾因 , 贾斯汀·高 , 安·李 , 许泰马 , 亚历山大·穆拉赫科 , 本杰明·佩洛金 , 胡安·皮诺 , 斯拉维亚·波普里 , 克里斯托夫·罗珀斯 , 萨菲亚·萨利姆 , 霍尔格·施文克 , 安娜·Y·孙 , 帕登·托马塞洛 , 王长汉(Changhan Wang) , 王建复 , 斯凯勒·王 , 玛丽·威廉姆森 :
无缝:多语言表达和流式语音翻译。 CoRR公司 abs/2312.05187 ( 2023 ) 2022 [公元30年] Hayato Futami先生 , 稻谷博文 , Sei Ueno公司 , 三村正人 , 酒井信介 , 川原达也 :
基于CTC的语音条件掩蔽LM ASR的非自回归误差校正。 棘突间 2022 : 3889-3893 [i31] 弗洛里安·博伊尔 , Yusuke Shinohara公司 , 石井高崎 , 稻谷博文 , 渡边信治 :
基于传感器的ESPnet端到端ASR的研究:架构、辅助损耗和解码策略。 CoRR公司 abs/2201.05420 ( 2022 ) [i30] Hayato Futami先生 , 稻谷博文 , 三村正人 , 酒井信介 , 川原达也 :
为基于CTC的ASR提取BERT知识。 CoRR公司 abs/2209.02030 ( 2022 ) [i29] Hayato Futami先生 , 稻谷博文 , Sei Ueno公司 , 三村正人 , 酒井信介 , 川原达也 :
基于CTC的语音条件掩蔽LM ASR的非自回归误差校正。 CoRR公司 abs/2209.04062 ( 2022 ) [第28条] 王长汉(Changhan Wang) , 稻谷博文 , 陈鹏仁 , 伊利亚·库利科夫 , 云堂(Yun Tang) , 徐伟宁 , 迈克尔·奥利 , 胡安·皮诺 :
简单有效的无监督语音翻译。 CoRR公司 腹肌/2210.10191 ( 2022 ) [i27] 马尔科·盖多 , 云堂(Yun Tang) , 伊利亚·库利科夫 , 黄荣庆 , 洪玉宫 , 稻谷博文 :
用于直接语音翻译的命名实体检测和注入。 CoRR公司 abs/2210.11981 ( 2022 ) [i26] 陈鹏仁 , 陈凯文(Kevin Tran) , 杨依林 , 杜景飞 , 贾斯汀·高 , 余安中 , 帕登·托马塞洛 , 保尔·安布罗斯·杜昆 , 霍尔格·施文克 , 洪玉宫 , 稻谷博文 , 斯拉维亚·波普里 , 王长汉(Changhan Wang) , 胡安·米盖尔·皮诺 , 徐伟宁 , 安·李 :
面向现实世界的非书面语言的语音翻译。 CoRR公司 腹肌/2211.06474 ( 2022 ) [i25] 稻谷博文 , 斯拉维亚·波普里 , 伊利亚·库利科夫 , 陈鹏仁 , 王长汉(Changhan Wang) , 余安中 , 云堂(Yun Tang) , 安·李 , 渡边信治 , 胡安·皮诺 :
UnitY:使用离散单元进行两遍直接语音转换。 CoRR公司 abs/2212.08055 ( 2022 ) 2021 【b1】 稻谷博文 :
快速和低延迟端到端语音识别和翻译。 日本京都大学, 2021 [公元29年] 弗洛里安·博伊尔 , Yusuke Shinohara公司 , 石井高崎 , 稻谷博文 , 渡边信治 :
基于传感器的ESPnet端到端ASR的研究:架构、辅助损耗和解码策略。 ASRU公司 2021 : 16-23 [公元28年] Yosuke Higuchi先生 , 陈南欣 , 藤田裕雅 , 稻谷博文 , 小松达也 , Jaesong Lee公司 , 野崎朱蒙 , 王天子 , 渡边信治 :
语音到文本生成的非自回归模型的比较研究。 ASRU公司 2021 : 47-54 [公元27年] Hayato Futami先生 , 稻谷博文 , 三村正人 , 酒井信介 , 川原达也 :
用Electra进行ASR重取和置信度估计。 ASRU公司 2021 : 380-387 [公元26年] 稻谷博文 , Siddharth Dalmia公司 , 布莱恩·燕 , 渡边信治 :
Fast-MD:使用非自回归隐藏中介体的快速多解码器端到端语音翻译。 ASRU公司 2021 : 922-929 [公元25年] 郭鹏程 , 弗洛里安·博伊尔 , 张玄凯 , Tomoki Hayashi先生 , Yosuke Higuchi先生 , 稻谷博文 , Naoyuki Kamo公司 , 李成达 , 丹尼尔·加西亚-罗梅罗 , 加通石 , 景实 , 渡边信治 , Kun Wei(昆威) , 张望友 , 张月凯 :
Conformer推动的Espnet工具包的最新发展。 ICASSP公司 2021 : 5874-5878 [公元24年] 稻谷博文 , Yosuke Higuchi先生 , 杜凯文(Kevin Duh) , 川原达也 , 渡边信治 :
ORTHROS:使用双解码器的非自回归端到端语音翻译。 ICASSP公司 2021 : 7503-7507 【c23】 Yosuke Higuchi先生 , 稻谷博文 , 渡边信治 , 小川哲治 , 小林哲森 :
改进了非自回归端到端ASR的Mask-CTC。 ICASSP公司 2021 : 8363-8367 [公元22年] 稻谷博文 , 川原达也 :
StableEmit:减少流式单调注意ASR发射延迟的选择概率折扣。 Interspeech公司 2021 : 1817-1821 【c21】 稻谷博文 , 川原达也 :
无VAD-Free流媒体混合CTC/Attention ASR用于非分段录制。 Interspeech公司 2021 : 4049-4053 [公元20年] 稻谷博文 , 布莱恩·燕 , Siddharth Dalmia公司 , 郭鹏程 , 加通石 , 杜凯文(Kevin Duh) , 渡边信治 :
ESPnet-ST IWSLT 2021离线语音翻译系统。 IWSLT公司 2021 : 100-109 [第19条] 稻谷博文 , 川原达也 , 渡边信治 :
面向端到端语音翻译的源和目标双向知识提取。 NAACL-HLT公司 2021 : 1872-1881 【i24】 稻谷博文 , 川原达也 :
在线流注意语音识别中的对齐知识提取。 CoRR公司 abs/2103.00422 ( 2021 ) [第23条] 稻谷博文 , 川原达也 , 渡边信治 :
面向端到端语音翻译的源和目标双向知识提取。 CoRR公司 abs/2104.06457 ( 2021 ) [i22] 稻谷博文 , 川原达也 :
StableEmit:减少流式单调注意ASR发射延迟的选择概率折扣。 CoRR公司 abs/2107.00635 ( 2021 ) 【i21】 稻谷博文 , 布莱恩·燕 , Siddharth Dalmia公司 , 郭鹏程 , 加通石 , 杜凯文(Kevin Duh) , 渡边信治 :
ESPnet-ST IWSLT 2021离线语音翻译系统。 CoRR公司 腹肌/2107.00636 ( 2021 ) [i20] 稻谷博文 , 川原达也 :
无VAD流媒体混合CTC/Attention ASR用于非分段录制。 CoRR公司 abs/2107.07509 ( 2021 ) [i19] 稻谷博文 , Yosuke Higuchi先生 , 杜凯文(Kevin Duh) , 川原达也 , 渡边信治 :
带并行自回归重取的非自回归端到端语音翻译。 CoRR公司 abs/2109.04411 ( 2021 ) [i18] 稻谷博文 , Siddharth Dalmia公司 , 布莱恩·燕 , 渡边信治 :
Fast-MD:使用非自回归隐藏中介体的快速多解码器端到端语音翻译。 CoRR公司 abs/2109.12804 ( 2021 ) [i17] Hayato Futami先生 , 稻谷博文 , 三村正人 , 酒井信介 , 川原达也 :
用ELECTRA进行ASR重取和置信度估计。 CoRR公司 abs/2110.01857 ( 2021 ) [i16] Yosuke Higuchi先生 , 陈南欣 , 藤田裕雅 , 稻谷博文 , 小松达也 , Jaesong Lee公司 , 野崎朱蒙 , 王天子 , 渡边信治 :
语音到文本生成的非自回归模型的比较研究。 CoRR公司 abs/2110.05249 ( 2021 ) 2020 [第18条] 稻谷博文 , 顺基诺(Shun Kiyono) , 杜凯文(Kevin Duh) , Shigeki Karita公司 , 纳尔逊·雅尔塔 , Tomoki Hayashi先生 , 渡边信治 :
ESPnet-ST:全功能语音翻译工具包。 ACL(演示) 2020 : 302-311 [第17条] 稻谷博文 , 亚西什·高尔 , 梁璐 , 李金玉 , 一帆功 :
流式序列到序列ASR的最小延迟训练策略。 ICASSP公司 2020 : 6064-6068 [第16条] 稻谷博文 , 三村正人 , 川原达也 :
单调注意模型的CTC-同步训练。 棘突间 2020 : 571-575 [第15条] 稻谷博文 , 三村正人 , 川原达也 :
提高流式ASR的单调多头关注度。 棘突间 2020 : 2137-2141 [第14条] Hayato Futami先生 , 稻谷博文 , Sei Ueno公司 , 三村正人 , 酒井信介 , 川原达也 :
提取序列到序列ASR的BERT知识。 棘突间 2020 : 3635-3639 [第13条] 越真党 , 赵天宇 , Sei Ueno公司 , 稻谷博文 , 川原达也 :
端到端语音到对话-行为识别。 棘突间 2020 : 3910-3914 【i15】 稻谷博文 , 亚西什·高尔 , 梁璐 , 李金玉 , 一帆功 :
流式序列到序列ASR的最小延迟训练策略。 CoRR公司 abs/2004.05009 ( 2020 ) [第14条] 稻谷博文 , 顺基诺(Shun Kiyono) , 杜凯文(Kevin Duh) , Shigeki Karita公司 , 纳尔逊·恩里克·雅尔塔·索普林 , Tomoki Hayashi先生 , 渡边信治 :
ESPnet-ST:全功能语音翻译工具包。 CoRR公司 abs/2004.10234 ( 2020 ) [i13] 越真党 , 赵天宇 , Sei Ueno公司 , 稻谷博文 , 川原达也 :
端到端语音到对话-ct识别。 CoRR公司 abs/2004.11419 ( 2020 ) [i12] 稻谷博文 , 三村正人 , 川原达也 :
单调注意模型的CTC同步训练。 CoRR公司 abs/2005.04712 ( 2020 ) [i11] 稻谷博文 , 三村正人 , 川原达也 :
提高流式ASR的单调多头关注度。 CoRR公司 abs/2005.09394 ( 2020 ) [i10] Hayato Futami先生 , 稻谷博文 , Sei Ueno公司 , 三村正人 , 酒井信介 , 川原达也 :
提取序列到序列ASR的BERT知识。 CoRR公司 腹肌/2008.03822 ( 2020 ) [第九章] 稻谷博文 , Yosuke Higuchi先生 , 杜凯文(Kevin Duh) , 川原达也 , 渡边信治 :
Orthros:带双解码器的非自回归端到端语音翻译。 CoRR公司 abs/2010.13047 ( 2020 ) [i8] Yosuke Higuchi先生 , 稻谷博文 , 渡边信治 , 小川哲治 , 小林哲森 :
改进了非自回归端到端ASR的Mask-CTC。 CoRR公司 abs/2010.13270 ( 2020 ) [i7] 郭鹏程 , 弗洛里安·博伊尔 , 张玄凯 , Tomoki Hayashi先生 , Yosuke Higuchi先生 , 稻谷博文 , Naoyuki Kamo公司 , 李成达 , 丹尼尔·加西亚-罗梅罗 , 加通石 , 景实 , 渡边信治 , Kun Wei(昆威) , 张望友 , 张月凯 :
Conformer推动的ESPnet工具包的最新发展。 CoRR公司 abs/2010.13956 ( 2020 ) [i6] 渡边信治 , 弗洛里安·博伊尔 , 张玄凯 , 郭鹏程 , Tomoki Hayashi先生 , Yosuke Higuchi先生 , Hori高木 , 黄文钦 , 稻谷博文 , Naoyuki Kamo公司 , Shigeki Karita公司 , 李成达 , 景实 , Aswin Shanmugam Subramanian公司 , 张望友 :
2020年ESPnet更新:新功能、扩展应用、性能改进和未来计划。 CoRR公司 abs/2012.13006 ( 2020 )
2010 – 2019
2019 [第12条] Shigeki Karita公司 , 王晓飞 , 渡边信治 , 竹本吉村 , 张望友 , 陈南欣 , Tomoki Hayashi先生 , Hori高木 , 稻谷博文 , 姜紫嫣 , Masao Someki公司 , 纳尔逊·恩里克·雅尔塔·索普林 , 山本良治 :
语音应用中变换器与RNN的比较研究。 ASRU公司 2019 : 449-456 [第11条] 稻谷博文 , 杜凯文(Kevin Duh) , 川原达也 , 渡边信治 :
多语言端到端语音翻译。 ASRU公司 2019 : 570-577 [第10条] 稻谷博文 , 杰金·赵(Jaejin Cho) , 穆拉利·卡西姆·巴斯卡 , 川原达也 , 渡边信治 :
基于语言模型融合的语言相关端到端ASR迁移学习。 ICASSP公司 2019 : 6096-6100 【c9】 杰金·赵(Jaejin Cho) , 渡边信治 , Hori高木 , 穆拉利·卡西姆·巴斯卡 , 稻谷博文 , 杰苏斯·维拉尔巴 , 纳吉姆·德哈克 :
基于记忆控制的序列到序列语音识别语言模型集成。 ICASSP公司 2019 : 6191-6195 【c8】 稻谷博文 , 顺基诺(Shun Kiyono) , 纳尔逊·恩里克·雅尔塔·索普林 , 铃木骏 , 杜凯文(Kevin Duh) , 渡边信治 :
2019年IWSLT ESPnet How2语音翻译系统:预培训、知识提炼和深入。 IWSLT公司 2019 [i5] Shigeki Karita公司 , 陈南欣 , Tomoki Hayashi先生 , Hori高木 , 稻谷博文 , 姜紫嫣 , Masao Someki公司 , 纳尔逊·恩里克·雅尔塔·索普林 , 山本良治 , 王晓飞 , 渡边信治 , 竹本吉村 , 张望友 :
语音应用中变换器与RNN的比较研究。 CoRR公司 腹肌/190906317 ( 2019 ) [i4] 稻谷博文 , 三村正人 , 酒井信介 , 川原达也 :
在语音合成语音识别中使用外部语言模型改进OOV检测和分辨率。 CoRR公司 abs/1909.09993 ( 2019 ) [i3] 稻谷博文 , 杜凯文(Kevin Duh) , 川原达也 , 渡边信治 :
多语言端到端语音翻译。 CoRR公司 abs/1910.00254 ( 2019 ) 2018 【c7】 Sei Ueno公司 , 稻谷博文 , 三村正人 , 川原达也 :
基于声词注意的模型与基于字符级CTC的模型互补。 ICASSP公司 2018 : 5804-5808 【c6】 稻谷博文 , 三村正人 , 井上康二 , 吉井和吉 , 川原达也 :
一种端到端的联合社会信号检测和自动语音识别方法。 ICASSP公司 2018 : 6214-6218 [c5] 稻谷博文 , 张宣 , 王志琦 , Adithya Renduchintala公司 , 渡边信治 , 杜凯文(Kevin Duh) :
2018年IWSLT JHU/KyotoU语音翻译系统。 IWSLT公司 2018 : 153-159 【c4】 稻谷博文 , 三村正人 , 酒井信介 , 川原达也 :
在语音合成语音识别中使用外部语言模型改进OOV检测和分辨率。 SLT公司 2018 : 212-218 【c3】 三村正人 , Sei Ueno公司 , 稻谷博文 , 酒井信介 , 川原达也 :
利用序列-序列语音合成增强声-词语音识别。 SLT公司 2018 : 477-484 [i2] 稻谷博文 , 杰金·赵(Jaejin Cho) , 穆拉利·卡西姆·巴斯卡 , 川原达也 , 渡边信治 :
基于语言模型融合的语言无关端到端ASR迁移学习。 CoRR公司 abs/1811.02134 ( 2018 ) [i1] 杰金·赵(Jaejin Cho) , 渡边信治 , Hori高木 , 穆拉利·卡西姆·巴斯卡 , 稻谷博文 , 杰苏斯·维拉尔巴 , 纳吉姆·德哈克 :
基于记忆控制的语言模型集成用于序列到序列语音识别。 CoRR公司 腹肌/1811.02162 ( 2018 ) 2017 【c2】 稻谷博文 , 井上康二 , 三村正人 , 川原达也 :
基于双向LSTM-CTC的自发对话中的社会信号检测。 棘突间 2017 : 1691-1695 2016 【c1】 稻谷博文 , 井上康二 , 中村静香 , Katsuya Takanashi先生 , 川原达也 :
在第一次会议对话中使用韵律特征预测参与者之间的破冰。 ASSP4MI@ICMI 2016 : 11-15