青峰叶
人员信息
优化列表
2020年–今天
2023 [公元28年] 青峰叶 , 黄伯尧 , 瓦苏·夏尔马 , 尚文丽 , 加吉·戈什 :
翻盖:快速语言-音频预训练。 ASRU公司 2023 : 1-8 [公元27年] 阿努杰·迪万 , 青峰叶 , 徐伟宁 , 帕登·托马塞洛 , 蔡恩索尔 , 大卫·哈瓦特 , 阿卜杜勒拉赫曼·穆罕默德 :
使用去纠缠Conformers的设备上语音识别的连续学习。 ICASSP公司 2023 : 1-5 【i21】 青峰叶 , 徐伟宁 , 帕登·托马塞洛 , 阿卜杜勒拉赫曼·穆罕默德 :
低比特量化的高效语音表示学习。 CoRR公司 abs/2301.00652 ( 2023 ) [i20] 青峰叶 , 黄宝瑶 , 瓦苏·夏尔马 , 尚文丽 , 加吉·戈什 :
FLAP:快速语言音频预训练。 CoRR公司 腹肌/2311.01615 ( 2023 ) [i19] Sungho Jeon先生 , 青峰叶 , 哈坎·伊南 , 徐伟宁 , 拉希·隆塔 , 亚沙尔·梅哈达德 , 丹尼尔·比克尔 :
注意或卷积:音频语言模型中的变压器编码器以提高推理效率。 CoRR公司 abs/2311.02772 ( 2023 ) 2022 [公元26年] 孙子峰 , 董淑燕(Shuyan Annie Dong) , 青峰叶 , 舒文阳 , 林子泉 , 加通石 , Kai-Wei Chang公司 , 黄子立 , 吴海滨 , 张玄凯 , 渡边信治 , 阿卜杜勒拉赫曼·穆罕默德 , 尚文丽 , 李鸿业(Hung-yi Lee) :
Superb@SLT 2022:自我监督言语表征学习的泛化和效率挑战。 SLT公司 2022 : 1096-1103 [i18] 孙子峰 , 董淑燕(Shuyan Annie Dong) , 青峰叶 , 舒文阳 , 子泉林 , 加通石 , Kai-Wei Chang公司 , 黄子立 , 吴海滨 , 张玄凯 , 渡边信治 , 阿卜杜勒拉赫曼·穆罕默德 , 尚文丽 , 李鸿业(Hung-yi Lee) :
SUPERB@SLT 2022:自我监督语音表示学习的泛化和效率挑战。 CoRR公司 abs/2210.08634 ( 2022 ) [i17] 阿努吉·迪万 , 清风野 , 徐伟宁 , 帕登·托马塞洛 , 蔡恩索尔 , 大卫·哈瓦特 , 阿卜杜勒拉赫曼·穆罕默德 :
使用去纠缠Conformers的设备上语音识别的连续学习。 CoRR公司 abs/2212.01393 ( 2022 ) 2021 [公元25年] 王永强 , 杨阳石 , 弗兰克·张 , 吴春阳 , 朱利安·陈 , 青峰叶 , 亚历克斯·肖 :
Transformer in Action:大型语音识别应用中基于Transformer的声学模型的比较研究。 ICASSP公司 2021 : 6778-6782 [公元24年] 杨阳石 , 王永强 , 吴春阳 , 青峰叶 , 朱利安·陈 , 弗兰克·张 , 杜克勒 , 迈克·萨尔茨 :
Emformer:用于低延迟流语音识别的高效记忆变压器声学模型。 ICASSP公司 2021 : 6783-6787 【c23】 苏宇金(Suyoun Kim) , 阿比纳夫·阿罗拉 , 杜克·勒 , 青峰叶 , 克里斯蒂安·福根 , 奥兹勒姆·卡林利 , 迈克尔·L·萨尔茨 :
语义距离:口语理解ASR性能分析的新指标。 Interspeech公司 2021 : 1977-1981 [公元22年] 杨阳石 , 瓦伦·纳加拉贾 , 吴春阳 , 杰·马哈迪卡尔 , 杜克·勒 , 罗希特·帕巴瓦尔卡 , 亚历克斯·肖 , 青峰叶 , 朱利安·陈 , 克里斯蒂安·福根 , 奥兹勒姆·卡林利 , 迈克尔·L·萨尔茨 :
动态编码器传感器:一种灵活的解决方案,用于权衡延迟精度。 Interspeech公司 2021 : 2042-2046 【c21】 青峰叶 , 王永强 , 杨阳石 , 吴春阳 , 弗兰克·张 , 朱利安·陈 , 迈克尔·L·萨尔茨 :
用于端到端语音识别的基于流注意的增强内存模型。 SLT公司 2021 : 8-14 [公元20年] 张晓慧 , 弗兰克·张 , 刘春熙 , 克杰尔·舒伯特 , 朱利安·陈 , 普拉多特·普拉卡什 , 刘军(Jun Liu) , 青峰叶 , 彭富春 , 亚特哈特·萨拉夫 , 杰弗里·茨威格 :
流式ASR的LF-MMI、CTC和RNN-T标准基准。 SLT公司 2021 : 46-51 [第19条] 杰·马哈迪卡尔 , 袁上官 , 杜克·勒 , 吉尔·克伦 , 杭素 , 通乐 , 青峰叶 , 克里斯蒂安·福根 , 迈克尔·L·萨尔茨 :
对齐受限流式递归神经网络转换器。 SLT公司 2021 : 52-59 [i16] 苏宇金(Suyoun Kim) , 阿比纳夫·阿罗拉 , 杜克·勒 , 青峰叶 , 克里斯蒂安·福根 , 奥兹勒姆·卡林利 , 迈克尔·L·萨尔茨 :
语义距离:口语理解ASR性能分析的新指标。 CoRR公司 abs/2104.02138 ( 2021 ) 【i15】 杨阳石 , 瓦伦·纳加拉贾 , 吴春阳 , 杰·马哈迪卡尔 , 杜克·勒 , 罗希特·帕巴瓦尔卡 , 亚历克斯·肖 , 青峰叶 , 朱利安·陈 , 克里斯蒂安·福根 , 奥兹勒姆·卡林利 , 迈克尔·L·萨尔茨 :
动态编码器转换器:一种灵活的解决方案,用于权衡延迟的准确性。 CoRR公司 腹肌/2104.02176 ( 2021 ) [第14条] 姚元阳 , Moto Hira公司 , 倪兆亨 , 安贾利·乔尔迪亚 , 阿特约姆·阿斯塔弗罗夫 , 卡罗琳·陈 , 青峰叶 , 克里斯蒂安·普尔施 , 大卫·波拉克 , 德米特里·根泽尔 , 唐尼·格林伯格 , 爱德华·Z·杨 , 詹森·廉 , 杰·马哈迪卡尔 , 杰夫·黄 , 纪晨 , 彼得·戈德斯伯勒 , 普拉巴特·罗伊 , 肖恩·纳伦蒂兰 , 渡边信治 , Soumith Chintala公司 , 文森特·昆奈维勒·贝莱尔 , 杨阳石 :
TorchAudio:音频和语音处理的构建块。 CoRR公司 abs/2110.15018 ( 2021 ) 2020 [第18条] 陈一晨 , 杨昭君 , 青峰叶 , 马哈维·贾因 , 迈克尔·L·萨尔茨 :
Aipnet:用于端到端语音识别的重音素转换网络的生成性对抗预训练。 ICASSP公司 2020 : 6979-6983 [第17条] 吴春阳 , 王永强 , 杨阳石 , 青峰叶 , 弗兰克·张 :
基于流式变换器的声学模型,使用增强记忆的自我注意。 INTERSPEECH公司 2020 : 2132-2136 [第16条] 杨阳石 , 王永强 , 吴春阳 , 克里斯蒂安·福根 , 弗兰克·张 , 杜克·勒 , 青峰叶 , 迈克尔·L·萨尔茨 :
基于变压器的语音识别中的弱注意抑制。 INTERSPEECH公司 2020 : 4996-5000 [i13] 吴春阳 , 王永强 , 杨阳石 , 青峰叶 , 弗兰克·张 :
基于流式变换器的声学模型,使用增强记忆的自我注意。 CoRR公司 abs/2005.08042 ( 2020 ) [i12] 杨阳石 , 王永强 , 吴春阳 , 克里斯蒂安·福根 , 弗兰克·张 , 杜克·勒 , 青峰叶 , 迈克尔·L·塞尔策 :
基于变压器的语音识别中的弱注意抑制。 CoRR公司 abs/2005.09137 ( 2020 ) [i11] 杨阳石 , 王永强 , 吴春阳 , 青峰叶 , 朱利安·陈 , 弗兰克·张 , 杜克·勒 , 迈克尔·L·萨尔茨 :
Emformer:用于低延迟流语音识别的高效基于内存变换的声学模型。 CoRR公司 abs/2010.10759 ( 2020 ) [i10] 王永强 , 杨阳石 , 弗兰克·张 , 吴春阳 , 朱利安·陈 , 青峰叶 , 亚历克斯·肖 :
变压器在行动:基于变压器的声学模型在大规模语音识别应用中的比较研究。 CoRR公司 腹肌/2010.14665 ( 2020 ) [第九章] 杰·马哈迪卡尔 , 袁上官 , 杜克·勒 , 吉尔·克伦 , 杭素 , 通乐 , 青峰叶 , 克里斯蒂安·福根 , 迈克尔·L·萨尔茨 :
校准受限流递归神经网络传感器。 CoRR公司 abs/2011.03072 ( 2020 ) [i8] 张晓慧 , 弗兰克·张 , 刘春熙 , 谢尔·舒伯特 , 朱利安·陈 , 普拉多特·普拉卡什 , 刘军 , 清风野 , 彭富春 , 亚特哈特·萨拉夫 , 杰弗里·茨威格 :
流式ASR的LF-MMI、CTC和RNN-T标准基准。 CoRR公司 abs/2011.04785 ( 2020 ) [i7] 青峰叶 , 王永强 , 杨阳石 , 吴春阳 , 弗兰克·张 , 朱利安·陈 , 迈克尔·L·萨尔茨 :
用于端到端语音识别的基于流注意的增强内存模型。 CoRR公司 abs/2011.07120 ( 2020 )
2010 – 2019
2019 [i6] 青峰叶 , 杰·马哈迪卡尔 , Kaustubh Kalgaonkar公司 , 王永强 , 杜克·勒 , 马哈维·贾因 , 克杰尔·舒伯特 , 克里斯蒂安·福根 , 迈克尔·L·萨尔茨 :
转换器:具有自我注意的端到端语音识别。 CoRR公司 abs/1910.12977 ( 2019 ) [i5] 马哈维·贾因 , 谢尔·舒伯特 , 杰·马哈迪卡尔 , 青峰叶 , 考斯图布·卡尔甘卡 , 阿努罗普·斯里拉姆 , 克里斯蒂安·福根 , 迈克尔·L·萨尔茨 :
RNN-T用于具有改进波束搜索的延迟控制ASR。 CoRR公司 abs/1911.01629 ( 2019 ) [i4] 陈一晨 , 杨兆军 , 青峰叶 , 马哈维·贾因 , 迈克尔·L·萨尔茨 :
AIPNet:用于端到端语音识别的重音-变网络的生成性对抗预训练。 CoRR公司 腹肌/1911.111935 ( 2019 ) 2018 [第15条] 夕阳 , 青峰叶 , 黄美玉 , 玛丽·奥斯滕多夫 , 谢磊(音) :
重音语音识别领域对抗训练。 ICASSP公司 2018 : 4854-4858 [第14条] 夕阳 , 青峰叶 , 玛丽·奥斯滕多夫 , 黄美玉 , 谢磊(音) :
用于鲁棒语音识别的训练增强与对抗示例。 INTERSPEECH公司 2018 : 2404-2408 [i3] 夕阳 , 青峰叶 , 玛丽·奥斯滕多夫 , 黄美玉 , 谢磊(音) :
用于鲁棒语音识别的训练增强与对抗示例。 CoRR公司 abs/1806.02782 ( 2018 ) [i2] 夕阳 , 青峰叶 , 黄美玉 , 玛丽·奥斯滕多夫 , 谢磊(音) :
重音语音识别领域对抗训练。 CoRR公司 abs/1806.02786 ( 2018 ) 2017 [j5] 曾俊明 , 李冰冰 , 青峰叶 , 香芝Jhan , 左敏蔡 , 马克·波洪琳 , 乌尔夫·施利特曼 :
一种高效的基于两相ILP的CMOS RFIC精确版图生成算法。 IEEE传输。 计算。 辅助设计。 集成。 电路系统。 36 ( 8 ) : 1313-1326 ( 2017 ) [i1] 曾俊明 , 李冰冰 , 青峰叶 , 香芝Jhan , 左敏蔡 , 马克·波洪琳 , 乌尔夫·施利特曼 :
采用并行器件布局和固定长度微带布线的新型CMOS RFIC版图生成。 CoRR公司 腹肌/1705.04991 ( 2017 ) 2016 [第13条] 曾俊明 , 李冰冰 , 青峰叶 , 香芝Jhan , 左敏蔡 , 马克·波洪琳 , 乌尔夫·施利特曼 :
新型CMOS RFIC布局生成,具有并行器件布局和固定长度微带布线。 数模转换器 2016 : 101:1-101:6 2015 【j4】 程凤叶 , 李林山 :
使用跨语言声学建模和框架级语言识别识别高度不平衡双语代码切换演讲的改进框架。 IEEE ACM传输。 音频语音语言处理。 23 ( 7 ) : 1144-1159 ( 2015 ) [j3] 吴伯孙 , 马克·波洪琳 , 陈东芝 , 青峰叶 , 辛莉(Xin Li) , 宗义浩 :
集成现有设计专业知识的新型模拟物理合成方法。 IEEE传输。 计算。 辅助设计。 集成。 电路系统。 34 ( 2 ) : 199-212 ( 2015 ) [第12条] 程凤叶 , 刘元明 , 李鸿业(Hung-yi Lee) , 李林山 :
个性化语音识别器,使用基于关键字的个性化词汇和使用词向量表示的语言模型。 INTERSPEECH公司 2015 : 3521-3525 2014 [注2] 李鸿业(Hung-yi Lee) , Sz-Rung Shiang先生 , 程凤叶 , 陈云农(Yun-Nung Chen) , 于晃(音) , 孔圣一 , 李林山 :
基于语义结构的口语知识组织和个性化学习原型课程讲授系统。 IEEE ACM传输。 音频语音语言处理。 22 ( 5 ) : 881-896 ( 2014 ) [j1] 吴宝勋 , 马克·波洪琳 , 陈东芝 , 青峰叶 , 宗义浩 , 刘斌达 :
探索用于模拟放置的切片树中对称岛和单调电流路径的可行性。 IEEE传输。 计算。 辅助设计。 集成。 电路系统。 33 ( 6 ) : 879-892 ( 2014 ) [第11条] 程凤叶 , 李林山 :
在声学建模中,使用深度神经网络和单元合并来转录代码切换双语讲座。 ICASSP公司 2014 : 220-224 2013 [第10条] 程凤叶 , 李鸿业(Hung-yi Lee) , 李林山 :
针对移动设备上的个性化语音识别器,使用基于格的上下文相关音素持续时间建模实现语音速率规范化。 INTERSPEECH公司 2013 : 1741-1745 2012 【c9】 程凤叶 , 亚伦·海德尔 , 李鸿业(Hung-yi Lee) , 李林山 :
基于模糊后验图的帧级语言检测用于高度不平衡码控双语语音识别。 ICASSP公司 2012 : 4873-4876 【c8】 程凤叶 , Yiu Chang Lin(柳昌林) , 李林山 :
用于双语代码转换语音转录的合并声学单元的最小电话错误模型训练。 ISCSLP公司 2012 : 320-324 2011 【c7】 程凤叶 , 梁雪阳 , 赵玉煌 , 李林山 :
基于状态映射和三阶段自适应的双语声学建模,用于转录不平衡的代码编码讲座。 ICASSP公司 2011 : 5020-5023 【c6】 陈云农(Yun-Nung Chen) , 于晃(音) , 程凤叶 , 李林山 :
通过随机遍历由自动提取的关键术语构建的图进行口语总结。 INTERSPEECH公司 2011 : 933-936 【c5】 程凤叶 , 赵玉煌 , 李林山 :
基于不同层次单元合并和跨层次集成的双语声学模型自适应。 INTERSPEECH公司 2011 : 2317-2320 2010 【c4】 李鸿业(Hung-yi Lee) , 陈家平(Chia-Ping Chen) , 程凤叶 , 李林山 :
通过基于用户相关反馈的声学模型的区分训练改进了口语词检测。 INTERSPEECH公司 2010 : 1273-1276 【c3】 陈家平(Chia-Ping Chen) , 李鸿业(Hung-yi Lee) , 程凤叶 , 李林山 :
通过特征空间伪相关反馈改进了口语词汇检测。 INTERSPEECH公司 2010 : 1672-1675 【c2】 程凤叶 , 赵玉煌 , 梁雪阳 , 李林山 :
通过改进声学和语言建模,转录汉英代码混合演讲的综合框架。 ISCSLP公司 2010 : 214-219 【c1】 李鸿业(Hung-yi Lee) , 陈家平(Chia-Ping Chen) , 程凤叶 , 李林山 :
一个集成不同相关反馈场景和方法的框架,用于口语词汇检测。 SLT公司 2010 : 389-394