叶白
人员信息
优化列表
2020年–今天
2024 [i18] 叶白 , 李晨兴 , 郝丽 , 赵媛媛 , 王晓瑞 :
基于多任务音频源分离的语音和歌唱声音联合识别。 CoRR公司 abs/2404.11275 ( 2024 ) 2023 [j8] 姜堰易 , 陶建华 , 叶白 , 田正坤 , 村杭风机 :
通过对抗性训练传授标点预测知识。 语音通信。 149 : 1-10 ( 2023 ) [公元30年] 金泽瑜 , 王子轩 , 王琦欣(Qixin Wang) , 贾佳 , 叶白 , 易昭 , 郝丽 , 王晓瑞 :
全息歌手:语义和音乐驱动的运动生成与八面体全息投影。 ACM多媒体 2023 : 9393-9395 [i17] 钱钱洞 , 黄志英 , 乔天 , 陈旭 , 汤姆·科 , 赵云龙 , 冯思远 , 唐丽 , 王可欣 , 徐新成 , 岳凤鹏 , 叶白 , 席晨 , 陆璐 , 马泽君 , 王玉平 , 王明轩 , 王宇轩 :
PolyVoice:语音到语音翻译的语言模型。 CoRR公司 abs/2306.02982 ( 2023 ) 2022 [公元29年] 张颖(音) , 彭阳 , 金巴肖 , 叶白 , 郝车 , 王晓瑞 :
K-Converter:一种无监督的歌唱语音转换系统。 ICASSP公司 2022 : 6662-6666 [公元28年] 姜堰易 , 傅瑞波 , 陶建华 , 帅聂 , 马浩欣 , 王成龙 , 王涛(音译) , 田正坤 , 叶白 , 村杭风机 , 单良 , 王世明 , 张帅(Shuai Zhang) , 辛瑞燕 , 乐旭 , 郑琪文 , 李海洲 :
ADD 2022:首个音频深度合成检测挑战。 ICASSP公司 2022 : 9216-9220 [公元27年] 叶白 , 李杰(音译) , 韩文静 , 郝妮 , 徐凯拓 , 卓章 , 程毅 , 王晓瑞 :
通过共享稀疏门专家进行端到端语音识别的参数高效整合器。 INTERSPEECH公司 2022 : 1676-1680 [i16] 姜堰易 , 傅瑞波 , 陶建华 , 帅聂 , 马浩欣 , 王成龙 , 王涛(音译) , 田正坤 , 叶白 , 存航风扇 , 单良 , 王世明 , 张帅(Shuai Zhang) , 辛瑞燕 , 乐旭 , 郑琪文 , 李海洲 , 郑连(音) , 刘斌(Bin Liu) :
ADD 2022:首个音频深度合成检测挑战。 CoRR公司 abs/2202.08433 ( 2022 ) 【i15】 叶白 , 李杰(音译) , 韩文静 , 郝妮 , 徐凯拓 , 卓章 , 程毅 , 王晓瑞 :
通过共享稀疏门专家进行端到端语音识别的参数高效整合器。 CoRR公司 abs/2209.08326 ( 2022 ) 2021 [j7] 叶白 , 姜堰易 , 陶建华 , 郑琪文 , 田正坤 , 张帅(Shuai Zhang) :
从外部纯文本数据将知识集成到端到端语音识别中。 IEEE ACM传输。 音频语音语言处理。 29 : 1340-1351 ( 2021 ) [j6] 叶白 , 姜堰易 , 陶建华 , 田正坤 , 郑琪文 , 张帅(Shuai Zhang) :
通过非自回归模型和BERT的交叉模式知识传输实现快速端到端语音识别。 IEEE ACM传输。 音频语音语言处理。 29 : 1897-1911 ( 2021 ) [公元26年] 田正坤 , 姜堰易 , 叶白 , 陶建华 , 张帅(Shuai Zhang) , 郑琪文 :
百分之一:从众多候选语音识别中选择最佳预测序列。 APSIPA ASC公司 2021 : 454-459 [公元25年] 张帅(Shuai Zhang) , 姜堰易 , 田正坤 , 叶白 , 陶建华 , 文正琪 :
端到端代码切换自动语音识别的语音和语言解耦。 ICASSP公司 2021 : 6249-6253 [公元24年] 张帅(Shuai Zhang) , 姜堰易 , 田正坤 , 叶白 , 陶建华 , 刘雪飞 , 郑琪文 :
编码切换语音识别中基于声学特征的端到端拼写校正。 Interspeech公司 2021 : 266-270 【c23】 马浩欣 , 姜堰易 , 陶建华 , 叶白 , 田正坤 , 王成龙 :
持续学习假音频检测。 Interspeech公司 2021 : 886-890 [公元22年] 姜堰易 , 叶白 , 陶建华 , 马浩欣 , 田正坤 , 王成龙 , 王涛(音译) , 傅瑞波 :
半真值:部分伪造的音频检测数据集。 Interspeech公司 2021 : 1654-1658 【c21】 田正坤 , 姜堰易 , 叶白 , 陶建华 , 张帅(Shuai Zhang) , 郑琪文 :
FSR:通过应用快速跳过正则化加速基于传感器模型的推断过程。 Interspeech公司 2021 : 4034-4038 [公元20年] 王成龙 , 姜堰易 , 陶建华 , 叶白 , 田正坤 :
分层关注的时间频率和信道特性,用于改进说话人验证。 ISCSLP公司 2021 : 1-5 [第19条] 张帅(Shuai Zhang) , 姜堰易 , 田正坤 , 陶建华 , 叶白 :
端到端曼语-英语代码转换语音识别中带有语言偏见的Rnn转换器。 ISCSLP公司 2021 : 1-5 [第14条] 叶白 , 姜堰易 , 陶建华 , 田正坤 , 郑琪文 , 张帅(Shuai Zhang) :
通过非自回归模型和BERT的交叉模式知识传输实现快速端到端语音识别。 CoRR公司 abs/2102.07594 ( 2021 ) [i13] 田正坤 , 姜堰易 , 陶建华 , 叶白 , 张帅(Shuai Zhang) , 郑琪文 , 刘雪飞 :
TSNAT:用于语音识别的两步非自回归变换器模型。 CoRR公司 abs/2104.01522 ( 2021 ) [i12] 田正坤 , 姜堰易 , 叶白 , 陶建华 , 张帅(Shuai Zhang) , 郑琪文 :
FSR:通过应用快速跳过正则化加速基于传感器模型的推断过程。 CoRR公司 abs/2104.02882 ( 2021 ) [i11] 姜堰易 , 叶白 , 陶建华 , 田正坤 , 王成龙 , 王涛(音译) , 傅瑞波 :
半真值:部分伪造的音频检测数据集。 CoRR公司 abs/2104.03617 ( 2021 ) [i10] 马浩欣 , 姜堰易 , 陶建华 , 叶白 , 田正坤 , 王成龙 :
持续学习假音频检测。 CoRR公司 abs/2104.07286 ( 2021 ) 2020 [j5] 赵伯承 , 陶建华 , 杨明浩 , 田正坤 , 村杭风机 , 叶白 :
深度模仿:通过深度关注网络进行手写书法模仿。 模式识别。 104 : 107080 ( 2020 ) 【j4】 叶白 , 姜堰易 , 陶建华 , 郑琪文 , 村杭风机 :
用于语言模型自适应的公共汉语数据集。 J.信号处理。 系统。 92 ( 8 ) : 839-851 ( 2020 ) [第18条] 田正坤 , 姜堰易 , 叶白 , 陶建华 , 张帅(Shuai Zhang) , 郑琪文 :
端到端语音识别的同步变压器。 ICASSP公司 2020 : 7884-7888 [第17条] 姜堰易 , 陶建华 , 田正坤 , 叶白 , 存航风扇 :
标点预测的焦点损失。 INTERSPEECH公司 2020 : 721-725 [第16条] 叶白 , 姜堰易 , 陶建华 , 田正坤 , 郑琪文 , 张帅(Shuai Zhang) :
注意倾听,拼写一次:通过非自回归架构生成整个句子,用于低延迟语音识别。 INTERSPEECH公司 2020 : 3381-3385 [第15条] 田正坤 , 姜堰易 , 陶建华 , 叶白 , 张帅(Shuai Zhang) , 郑琪文 :
用于端到端语音识别的尖峰触发非自回归变压器。 INTERSPEECH公司 2020 : 5026-5030 [第九章] 张帅(Shuai Zhang) , 姜堰易 , 田正坤 , 陶建华 , 叶白 :
用于端到端曼语-英语编码切换语音识别的带有语言偏见的Rnn转换器。 CoRR公司 abs/2002.08126 ( 2020 ) [i8] 姜堰易 , 陶建华 , 叶白 , 田正坤 , 村杭风机 :
标点符号恢复的对抗迁移学习。 CoRR公司 腹肌/2004.00248 ( 2020 ) [i7] 叶白 , 姜堰易 , 陶建华 , 田正坤 , 郑琪文 , 张帅(Shuai Zhang) :
注意倾听,拼写一次:通过非自回归架构生成整个句子,用于低延迟语音识别。 CoRR公司 abs/2005.04862 ( 2020 ) [i6] 田正坤 , 姜堰易 , 陶建华 , 叶白 , 张帅(Shuai Zhang) , 郑琪文 :
用于端到端语音识别的尖峰触发非自回归变压器。 CoRR公司 abs/2005.07903 ( 2020 ) [i5] 张帅(Shuai Zhang) , 姜堰易 , 田正坤 , 叶白 , 陶建华 , 郑琪文 :
端到端代码切换自动语音识别的语音和语言解耦。 CoRR公司 abs/2010.14798 ( 2020 )
2010 – 2019
2019 [j3] 叶白 :
基于Diffie-Hellman密钥交换算法的音乐专业学生心理应激干预效果研究。 俱乐部。 计算。 22 ( 6 ) : 13723-13729 ( 2019 ) [注2] 斯里坎思·古鲁拉扬 , 叶白 :
四旋翼机的自主“图8”飞行:实验数据集。 数据 4 ( 1 ) : 39 ( 2019 ) [j1] 姜堰易 , 陶建华 , 郑琪文 , 叶白 :
低资源语音识别的语言-语音转换学习。 IEEE ACM传输。 音频语音语言处理。 27 ( 三 ) : 621-630 ( 2019 ) [第14条] 村杭风机 , 刘斌(Bin Liu) , 陶建华 , 姜堰易 , 文正琪 , 叶白 :
基于门限卷积生成对抗网络的语音增强噪声先验知识学习。 亚太投资促进局 2019 : 662-666 [第13条] 马浩欣 , 叶白 , 姜堰易 , 陶建华 :
查询示例关键字定位的超球体嵌入和添加边距。 亚太投资促进局 2019 : 868-872年 [第12条] 叶白 , 姜堰易 , 陶建华 , 郑琪文 , 刘斌(Bin Liu) :
基于时延神经网络的语音活动检测。 亚太投资促进局 2019 : 1173-1178 [第11条] 姜堰易 , 陶建华 , 叶白 :
用于低资源语音识别的对抗端到端声学模型的语言无关瓶颈特征。 ICASSP公司 2019 : 6071-6075 [第10条] 叶白 , 姜堰易 , 陶建华 , 文正琪 , 田正坤 , 赵成浩 , 村杭风机 :
一种用于小足迹关键词识别的共享权重自关注时延神经网络。 INTERSPEECH公司 2019 : 2190-2194年 【c9】 叶白 , 姜堰易 , 陶建华 , 田正坤 , 文正琪 :
从老师那里学习拼写:将知识从语言模型转移到序列到序列语音识别。 INTERSPEECH公司 2019 : 3795-3799 【c8】 田正坤 , 姜堰易 , 陶建华 , 叶白 , 文正琪 :
用于端到端语音识别的自我注意传感器。 INTERSPEECH公司 2019 : 4395-4399 [i4] 叶白 , 姜堰易 , 陶建华 , 田正坤 , 文正琪 :
从老师那里学习拼写:将知识从语言模型转移到序列到序列语音识别。 CoRR公司 abs/1907.06017 ( 2019 ) [i3] 田正坤 , 姜堰易 , 陶建华 , 叶白 , 郑琪文 :
用于端到端语音识别的自我注意传感器。 CoRR公司 abs/1909.13037 ( 2019 ) [i2] 叶白 , 姜堰易 , 陶建华 , 田正坤 , 郑琪文 , 张帅(Shuai Zhang) :
将整个上下文集成到序列对序列语音识别中。 CoRR公司 腹肌/1912.01777 ( 2019 ) [i1] 田正坤 , 姜堰易 , 叶白 , 陶建华 , 张帅(Shuai Zhang) , 郑琪文 :
端到端语音识别用同步变压器。 CoRR公司 abs/1912.02958 ( 2019 ) 2018 【c7】 姜堰易 , 陶建华 , 郑琪文 , 叶白 :
低资源语音识别的对抗性多语言训练。 ICASSP公司 2018 : 4899-4903 【c6】 村杭风机 , 刘斌(Bin Liu) , 陶建华 , 郑琪文 , 姜堰易 , 叶白 :
单通道语音分离中带鉴别学习的语音级置换不变量训练。 ISCSLP公司 2018 : 26-30 【c5】 叶白 , 陶建华 , 姜堰易 , 郑琪文 , 存航风扇 :
CLMAD:一个汉语模型自适应数据集。 ISCSLP公司 2018 : 275-279 2016 【c4】 叶白 , 姜堰易 , 郝妮 , 郑琪文 , 刘斌(Bin Liu) , 亚莉 , 陶建华 :
基于连接词时间分类的汉语端到端关键词识别。 ISCSLP公司 2016 : 1-5 2013 【c3】 叶白 , 薛丽生 , 孙春燕 , 金汉 :
复杂水域中基于接触式传导发射机的语音编码算法研究。 WUW网 2013 : 19:1-19:2 2011 【c2】 于云亮 , 张婷婷 , 叶白 , 王建强 :
基于改进BP神经网络的数字素材地图中道路线识别方法。 CSISE(1) 2011 : 113-117 【c1】 于云亮 , 叶白 , 张婷婷 , 王建强 :
基于免疫自组织神经网络的重矿物分析。 CSISE(1) 2011 : 119-123