金川田
人员信息
其他同名人员
优化列表
2020年–今天
2024 【i15】 彭一凡 , 金川田 , 威廉·陈 , 悉达恩·阿罗拉 , 布莱恩·严 , 尤素多(Yui Sudo) , 穆罕默德·沙克尔 , Kwanghee Choi先生 , 加通石 , 张玄凯 , 郑哲文(Jee-weon Jung) , 渡边信治 :
OWSM v3.1:基于E-Branchformer的更好更快的开放式耳语风格语音模型。 CoRR公司 abs/2401.16658 ( 2024 ) 2023 [注2] 金川田 , 于建伟 , 赵翁 , 邹月仙 , 董瑜(Dong Yu) :
将无格MMI集成到端到端语音识别中。 IEEE ACM传输。 音频语音语言处理。 31 : 25-38 ( 2023 ) 【c7】 彭一凡 , 金川田 , 布莱恩·燕 , 丹·贝雷比 , 张玄凯 , 李新建 , 加通石 , 悉达恩·阿罗拉 , 威廉·陈 , 罗珊·沙尔马 , 张望友 , 尤素多(Yui Sudo) , 穆罕默德·沙克尔 , Jee-Weon Jung先生 , Soumi Maiti公司 , 渡边信治 :
使用开放源代码工具包和公开可用数据再现耳语风格训练。 ASRU公司 2023 : 1至8 【c6】 金川田 , 布莱恩·燕 , 于建伟 , 赵翁 , 董瑜(Dong Yu) , 渡边信治 :
贝叶斯风险CTC:序列到序列任务中的可控CTC对齐。 ICLR公司 2023 【c5】 杜一超 , 郭正声(音) , 金川田 , 张志瑞 , Xing Wang(王兴) , 于建伟 , 涂兆鹏 , 童旭 , 陈恩宏 :
用于IWSLT 2023离线语音翻译和语音转换任务的MineTrans系统。 ACL处的IWSLT 2023 : 79年至88年 [第14条] 杨东超 , 刘松香 , 黄荣杰 , 金川田 , 赵翁 , 邹跃仙 :
HiFi-Codec:用于高保真音频编解码器的组剩余矢量量化。 CoRR公司 abs/2305.02765 ( 2023 ) [i13] 金川田 , 于建伟 , 陈汉廷(Hangting Chen) , 布莱恩·燕 , 赵翁 , 董瑜(Dong Yu) , 渡边信治 :
贝叶斯风险传感器:具有可控校准预测的传感器。 CoRR公司 abs/2308.10107 ( 2023 ) [i12] 彭一凡 , 金川田 , 布莱恩·燕 , 丹·贝雷比 , 张玄凯 , 李新建 , 加通石 , 悉达恩·阿罗拉 , 威廉·陈 , 罗珊·沙尔马 , 张望友 , 尤素多(Yui Sudo) , 穆罕默德·沙克尔 , 吉文荣 , Soumi Maiti公司 , 渡边信治 :
使用开放源代码工具包和公开可用数据再现耳语风格训练。 CoRR公司 abs/2309.13876 ( 2023 ) [i11] 于建伟 , 陈汉廷(Hangting Chen) , 卞延尧 , 向丽 , 伊洛 , 金川田 , 刘梦阳 , 蒋嘉怡 , 王帅(Shuai Wang) :
AutoPrep:一种用于在线语音数据的自动预处理框架。 CoRR公司 abs/2309.13905 ( 2023 ) [i10] 张玄凯 , 布莱恩·燕 , Kwanghee Choi先生 , Jee-Weon Jung先生 , 宜城路 , Soumi Maiti公司 , 罗珊·沙尔马 , 加通石 , 金川田 , 渡边信治 , 藤田裕也 , Maekaku先生 , 郭鹏程 , 姚菲成 , 帕维尔·杰尼索夫 , Kohei Saijo公司 , 小宣王 :
探索离散语音单元的语音识别、翻译和理解:比较研究。 CoRR公司 abs/2309.15800 ( 2023 ) [第九章] 杨东超 , 金川田 , 徐坦 , 黄荣杰 , 刘松香 , 张宣凯 , 加通石 , Sheng Zhao先生 , 江边 , 吴西新 , 周照(音) , 渡边信治 , 蒙美玲 :
UniAudio:面向通用音频生成的音频基础模型。 CoRR公司 abs/2310.00704 ( 2023 ) 2022 [j1] 金川田 , 于建伟 , 赵翁 , 邹跃仙 , 董瑜(Dong Yu) :
利用词N-Gram语言模型改进汉语端到端语音识别。 IEEE信号处理。 莱特。 29 : 812-816 ( 2022 ) 【c4】 金川田 , 于建伟 , 赵翁 , Shi-Xiong Zhang先生 , 丹·苏 , 董瑜(Dong Yu) , 邹跃仙 :
使用无格MMI进行端到端语音识别的一致训练和解码。 ICASSP公司 2022 : 7782-7786 【c3】 金川田 , 于建伟 , 张春蕾 , 邹跃仙 , 董瑜(Dong Yu) :
LAE:用于单语和多语言ASR的语言软件编码器。 INTERSPEECH公司 2022 : 3178-3182 【c2】 赵紫峰 , 顾荣志 , 杨东超 , 金川田 , 邹跃仙 :
用于弱监督说话人提取的说话人感知混合训练。 INTERSPEECH公司 2022 : 5318-5322 [i8] 金川田 , 于建伟 , 赵翁 , 邹跃仙 , 董瑜(Dong Yu) :
利用单词N元语言模型改进普通话端到端语音识别。 CoRR公司 abs/2201.01995 ( 2022 ) [i7] 金川田 , 于建伟 , 赵翁 , 邹月仙 , 董瑜(Dong Yu) :
将无格MMI集成到端到端语音识别中。 CoRR公司 abs/2203.15614 ( 2022 ) [i6] 赵紫峰 , 顾荣志 , 杨东超 , 金川田 , 邹跃仙 :
用于弱监督说话人提取的说话人感知混合训练。 CoRR公司 abs/2204.07375 ( 2022 ) [i5] 金川田 , 于建伟 , 张春蕾 , 赵翁 , 邹跃仙 , 董瑜(Dong Yu) :
LAE:用于单语言和多语言ASR的语言感知编码器。 CoRR公司 abs/2206.02093 ( 2022 ) [i4] 金川田 , 布莱恩·燕 , 于建伟 , 赵翁 , 董瑜(Dong Yu) , 渡边信治 :
贝叶斯风险CTC:序列对序列任务中的可控CTC对齐。 CoRR公司 abs/2210.07499 ( 2022 ) 2021 [i3] 金川田 , 顾荣志 , 王和林 , 邹跃仙 :
层缩减:通过层一致性加速基于Conformer的自我监督模型。 CoRR公司 abs/2105.00812 ( 2021 ) [i2] 金川田 , 于建伟 , 赵翁 , 张世雄 , 丹·苏 , 董瑜(Dong Yu) , 邹跃仙 :
使用无格MMI进行端到端语音识别的一致训练和解码。 CoRR公司 abs/2112.02498 ( 2021 ) 2020 【c1】 黄一恒 , 金川田 , 雷寒 , 王广森 , 兴城松 , 丹·苏 , 董瑜(Dong Yu) :
用于神经语言建模的随机流言BMUF过程。 ICASSP公司 2020 : 7959-7963
2010 – 2019
2019 [i1] 黄一恒 , 金川田 , 雷寒 , 王广森 , 兴城松 , 丹·苏 , 董瑜(Dong Yu) :
用于神经语言建模的随机流言BMUF过程。 CoRR公司 abs/1909.09010 ( 2019 )