鲍里斯·金斯伯格
人员信息
优化列表
2020年–今天
2024 [公元156年] 海南徐 , 陈哲怀 , 费佳 , 鲍里斯·金斯伯格 :
用于自动语音识别的带语音感知嵌入的换能器。 CoRR公司 abs/2404.04295 ( 2024 ) [i55] 谢成平 , 孙思孟 , 塞缪尔·克里曼 , 山塔努·阿查里亚 , 迪玛·雷克什 , 费佳 , 杨章 , 鲍里斯·金斯伯格 :
RULER:你的长上下文语言模型的实际上下文大小是多少? CoRR公司 abs/2404.06654 ( 2024 ) 2023 [公元39年] 亚历山大·梅斯特 , 马特维·诺维科夫 , 尼古拉·卡尔波夫 , 伊芙琳娜·巴赫图利纳 , 维塔利·拉夫鲁金 , 鲍里斯·金斯伯格 :
LibriSpeech-PC:端到端ASR模型标点符号和资本化能力评估基准。 ASRU公司 2023 : 1-7 [公元38年] 迪玛·雷克什 , 尼廷·拉奥·科卢古里 , 塞缪尔·克里曼 , Somshubra Majumdar公司 , 瓦希德·诺鲁齐 , 何晃 , Oleksii Hrinchuk公司 , 克里希纳·C·普瓦达 , 安库尔·库马尔 , 贾加迪什·巴兰 , 鲍里斯·金斯伯格 :
具有线性可缩放关注度的快速一致器,用于高效语音识别。 ASRU公司 2023 : 1-8 [公元37年] 罗汉·巴德拉尼 , 阿基思·阿罗拉 , Subhankar Ghosh公司 , 拉斐尔·瓦莱 , 凯文·J·施 , 乔·菲利佩·桑托斯 , 鲍里斯·金斯伯格 , 布莱恩·卡坦扎罗 :
Vani:非常轻便的重音可控TTS,适用于母语和非母语使用者,具有身份保护功能。 ICASSP公司 2023 : 1-2 [公元36年] 特拉维斯·M·巴特利 , 费佳 , 克里希纳·C·普瓦达 , 塞缪尔·克里曼 , 鲍里斯·金斯伯格 :
意外学习者:多语言自我监督模型中的口语识别。 ICASSP公司 2023 : 1-5 [公元35年] 谢泽恩·侯赛因 , 帕斯·尼卡拉 , 乔斯琳·黄 , 杰森·李 , 鲍里斯·金斯伯格 :
ACE-VC:使用明确分离的自我监督语音表示的自适应和可控语音转换。 ICASSP公司 2023 : 1-5 [公元34年] 亚历克桑德·拉普特夫 , 弗拉基米尔·巴塔耶夫 , 伊戈尔·吉特曼 , 鲍里斯·金斯伯格 :
用于雷诺传感器损耗的强大且可扩展的WFST框架。 ICASSP公司 2023 : 1-5 [公元33年] 海南徐 , 费佳 , Somshubra Majumdar公司 , 渡边信治 , 鲍里斯·金斯伯格 :
语音识别用多块换能器。 ICASSP公司 2023 : 1-5 [公元32年] 杨章 , 克里希纳·C·普瓦达 , 维塔利·拉夫鲁金 , 鲍里斯·金斯伯格 :
基于Conformer的单声道音频目标扬声器自动语音识别。 ICASSP公司 2023 : 1-5 [公元31年] 桑吉尔·李 , 魏平 , 鲍里斯·金斯伯格 , 布莱恩·卡坦扎罗 , Sungroh Yoon公司 :
BigVGAN:具有大规模训练的通用神经声码器。 ICLR公司 2023 [公元30年] 海南徐 , 费佳 , Somshubra Majumdar公司 , 何晃 , 渡边信治 , 鲍里斯·金斯伯格 :
联合预测标记和持续时间的高效序列转导。 ICML公司 2023 : 38462-38484 [公元29年] Oleksii Hrinchuk公司 , 弗拉基米尔·巴塔耶夫 , 伊芙琳娜·巴赫图利纳 , 鲍里斯·金斯伯格 :
适用于IWSLT 2023的NVIDIA NeMo离线语音翻译系统。 ACL处的IWSLT 2023 : 442-448 [公元28年] Ante Jukic公司 , 贾加德什·巴拉姆 , 鲍里斯·金斯伯格 :
噪声抑制前端的灵活多通道语音增强。 WASPAA公司 2023 : 1-5 [公元54年] 谢泽恩·侯赛因 , 帕亚斯·奈卡拉(Paarth Neekhara) , 乔斯琳·黄 , 杰森·李 , 鲍里斯·金斯伯格 :
ACE-VC:使用显式分离自监督语音表示的自适应和可控语音转换。 CoRR公司 abs/2302.08137 ( 2023 ) [第53条] 弗拉基米尔·巴塔耶夫 , 罗曼·科罗斯蒂克 , 叶夫根尼·沙巴林 , 维塔利·拉夫鲁金 , 鲍里斯·金斯伯格 :
使用集成的文本到mel声谱图生成器进行端到端ASR的纯文本域自适应。 CoRR公司 abs/2302.14036 ( 2023 ) [i52] 罗汉·巴德拉尼 , 阿基思·阿罗拉 , Subhankar Ghosh公司 , 拉斐尔·瓦莱 , 凯文·J·施 , 乔·菲利佩·桑托斯 , 鲍里斯·金斯伯格 , 布莱恩·卡坦扎罗 :
VANI:非常轻量级的可控制重音的TTS,适用于具有身份保护功能的母语和非母语使用者。 CoRR公司 abs/2303.07578 ( 2023 ) [i51] 亚历克桑德·拉普特夫 , 弗拉基米尔·巴塔耶夫 , 伊戈尔·吉特曼 , 鲍里斯·金斯伯格 :
用于RNN传感器损耗的强大且可扩展的WFST框架。 CoRR公司 abs/2303.10384 ( 2023 ) [i50] 海南徐 , 费佳 , Somshubra Majumdar公司 , 何晃 , 渡边信治 , 鲍里斯·金斯伯格 :
联合预测标记和持续时间的高效序列转导。 CoRR公司 abs/2304.06795 ( 2023 ) [i49] 迪玛·雷克什 , 塞缪尔·克里曼 , Somshubra Majumdar公司 , 瓦希德·诺鲁齐 , 何晃 , Oleksii Hrinchuk公司 , 安库尔·库马尔 , 鲍里斯·金斯伯格 :
具有线性可伸缩注意的快速一致器,用于高效语音识别。 CoRR公司 abs/2305.05084 ( 2023 ) [i48] 亚历山大·安东诺娃 , 伊芙琳娜·巴赫图利纳 , 鲍里斯·金斯伯格 :
SpellMapper:一种非自回归神经拼写检查器,用于ASR定制,基于n-gram映射的候选检索。 CoRR公司 腹肌/2306.02317 ( 2023 ) [i47] 库纳尔·达旺 , 迪玛·雷克什 , 鲍里斯·金斯伯格 :
从单语数据源训练双语和代码切换语音识别模型。 CoRR公司 abs/2306.08753 ( 2023 ) [i46] 伊戈尔·吉特曼 , 维塔利·拉夫鲁金 , 亚历克桑德·拉普特夫 , 鲍里斯·金斯伯格 :
基于可信度的端到端语音识别模型集成。 CoRR公司 abs/2306.15824 ( 2023 ) [i45] 何晃 , 贾加迪什·巴兰 , 鲍里斯·金斯伯格 :
利用预训练ASR编码器实现高效的端到端语音意图分类和时隙填充。 CoRR公司 abs/2307.07057 ( 2023 ) [i44] 杨章 , 克里希纳·C·普瓦达 , 维塔利·拉夫鲁金 , 鲍里斯·金斯伯格 :
用于单声道音频的基于Conformer的目标扬声器自动语音识别。 CoRR公司 abs/2308.05218 ( 2023 ) [i43] 尼廷·拉奥·科卢古里 , 塞缪尔·克里曼 , 乔治·泽伦弗洛因 , Somshubra Majumdar公司 , 迪玛·雷克什 , 瓦希德·诺鲁齐 , 贾加迪什·巴兰 , 鲍里斯·金斯伯格 :
调查长格式音频转录的端到端ASR架构。 CoRR公司 abs/2309.09950 ( 2023 ) [i42] 克里希纳·C·普瓦达 , 尼廷·拉奥·科卢古里 , 库纳尔·达旺 , 贾加迪什·巴兰 , 鲍里斯·金斯伯格 :
离散音频表示作为梅尔谱图的替代方案,用于说话人和语音识别。 CoRR公司 abs/2309.10922 ( 2023 ) [i41] 杨章 , 特拉维斯·M·巴特利 , 玛丽亚娜·格雷特罗·富恩市长 , 维塔利·拉夫鲁金 , 伊芙琳娜·巴赫图利纳 , 鲍里斯·金斯伯格 :
关于无聊问题的聊天:研究基于GPT的文本规范化。 CoRR公司 abs/2309.13426 ( 2023 ) [i40] 亚历山大·梅斯特 , 马特维·诺维科夫 , 尼古拉·卡尔波夫 , 伊芙琳娜·巴赫图利纳 , 维塔利·拉夫鲁金 , 鲍里斯·金斯伯格 :
LibriSpeech-PC:端到端ASR模型标点符号和资本化能力评估基准。 CoRR公司 abs/2310.02943 ( 2023 ) [i39] 陈哲怀 , 何晃 , 安德烈·安德卢森科 , Oleksii Hrinchuk公司 , 克里希纳·C·普瓦达 , 杰森·李 , Subhankar Ghosh公司 , 贾加迪什·巴兰 , 鲍里斯·金斯伯格 :
SALM:语音识别和翻译的语音增强语言模型和In-context学习。 CoRR公司 abs/2310.09424 ( 2023 ) [i38] 帕斯·尼卡拉 , 谢泽恩·侯赛因 , 拉斐尔·瓦莱 , 鲍里斯·金斯伯格 , 里沙布·兰扬 , 什洛莫·杜布诺夫 , 法里纳兹·库沙法尔 , 朱利安·麦考利 :
SelfVC:使用自变换进行迭代优化的语音转换。 CoRR公司 abs/2310.09653 ( 2023 ) [i37] 大津公园 , 何晃 , 科尔曼·霍珀 , 尼廷·拉奥·科卢古里 , 库纳尔·达旺 , 安特·朱基克 , 贾加迪什·巴兰 , 鲍里斯·金斯伯格 :
属性感知的多扬声器数据模拟:合成数据生成的概率建模技术。 CoRR公司 abs/2310.12371 ( 2023 ) [公元36年] 大津公园 , 何晃 , 安特·朱基克 , 库纳尔·达旺 , 克里希纳·C·普瓦达 , 尼廷·拉奥·科卢古里 , 尼古拉·卡尔波夫 , 亚历克桑德·拉普特夫 , 贾加迪什·巴兰 , 鲍里斯·金斯伯格 :
CHiME-7挑战:NeMo团队DASR系统的系统描述和性能。 CoRR公司 abs/2310.12378 ( 2023 ) [i35] 瓦希德·诺鲁齐 , Somshubra Majumdar公司 , 安库尔·库马尔 , 贾加迪什·巴兰 , 鲍里斯·金斯伯格 :
用于流式自动语音识别的状态一致性与基于缓存的推断。 CoRR公司 abs/2312.17279 ( 2023 ) 2022 [公元27年] 奥克泰·塔塔诺夫 , 斯坦尼斯拉夫·贝利亚耶夫 , 鲍里斯·金斯伯格 :
Mixer-TTS:基于语言模型嵌入的非自回归、快速和紧凑的文本到语音模型。 ICASSP公司 2022 : 7482-7486 [c26] 尼廷·拉奥·科卢古里 , 大津公园 , 鲍里斯·金斯伯格 :
TitaNet:具有一维深度-方向可分离卷积和全局上下文的说话人表示神经模型。 ICASSP公司 2022 : 8102-8106 [公元25年] 伊芙琳娜·巴赫图利纳 , 杨章 , 鲍里斯·金斯伯格 :
加权有限状态转换器与文本规范化语言模型的浅融合。 INTERSPEECH公司 2022 : 491-495 [公元24年] 亚历山大·安东诺娃 , 伊芙琳娜·巴赫图利纳 , 鲍里斯·金斯伯格 :
Thutmose Tagger:反向文本规范化的单程神经模型。 INTERSPEECH公司 2022 : 550-554 【c23】 大津公园 , 尼廷·拉奥·科卢古里 , 费佳 , 贾加迪什·巴兰 , 鲍里斯·金斯伯格 :
NeMo开源扬声器日记系统。 INTERSPEECH公司 2022 : 853-854 [公元22年] 亚历克桑德·拉普特夫 , Somshubra Majumdar公司 , 鲍里斯·金斯伯格 :
CTC通过新WFST拓扑变化。 INTERSPEECH公司 2022 : 1041-1045年 【c21】 大津公园 , 尼廷·拉奥·科卢古里 , 贾加迪什·巴兰 , 鲍里斯·金斯伯格 :
动态称重的多尺度扬声器分辨率。 INTERSPEECH公司 2022 : 5080-5084 [公元20年] Somshubra Majumdar公司 , 山塔努·阿查里亚 , 维塔利·拉夫鲁金 , 鲍里斯·金斯伯格 :
基于换能器的自动语音识别领域自适应过程中的损伤控制。 SLT公司 2022 : 130-135 [第19条] 亚历克桑德·拉普特夫 , 鲍里斯·金斯伯格 :
端到端自动语音识别中基于熵的快速字级置信度估计方法。 SLT公司 2022 : 152-159 [i34] 伊芙琳娜·巴赫图利纳 , 杨章 , 鲍里斯·金斯伯格 :
加权有限状态转换器与文本规范化语言模型的浅融合。 CoRR公司 腹肌/2203.15917 ( 2022 ) [i33] 大津公园 , 尼廷·拉奥·科卢古里 , 贾加迪什·巴兰 , 鲍里斯·金斯伯格 :
动态称重的多尺度扬声器分辨率。 CoRR公司 abs/2203.15974 ( 2022 ) [i32] 桑吉尔·李 , 魏平 , 鲍里斯·金斯伯格 , 布莱恩·卡坦扎罗 , Sungroh Yoon公司 :
BigVGAN:具有大规模训练的通用神经声码器。 CoRR公司 abs/2206.04658 ( 2022 ) [i31] 亚历山大·安东诺娃 , 伊芙琳娜·巴赫图利纳 , 鲍里斯·金斯伯格 :
Thutmose Tagger:反向文本规范化的单程神经模型。 CoRR公司 abs/2208.00064 ( 2022 ) [i30] Somshubra Majumdar公司 , 山塔努·阿查里亚 , 维塔利·拉夫鲁金 , 鲍里斯·金斯伯格 :
基于换能器的自动语音识别领域自适应过程中的损伤控制。 CoRR公司 abs/2210.03255 ( 2022 ) [i29] 费佳 , 尼廷·拉奥·科卢古里 , 贾加迪什·巴兰 , 鲍里斯·金斯伯格 :
AmberNet:一种紧凑的端到端口语识别模型。 CoRR公司 abs/2210.15781 ( 2022 ) [第28条] 谢成平 , Subhankar Ghosh公司 , 鲍里斯·金斯伯格 :
针对新扬声器的基于适配器的多扬声器文本到语音模型扩展。 CoRR公司 abs/2211.00585 ( 2022 ) [i27] 海南徐 , 费佳 , Somshubra Majumdar公司 , 渡边信治 , 鲍里斯·金斯伯格 :
用于语音识别的多空白换能器。 CoRR公司 abs/2211.03541 ( 2022 ) [i26] 特拉维斯·M·巴特利 , 费佳 , 克里希纳·C·普瓦达 , 塞缪尔·克里曼 , 鲍里斯·金斯伯格 :
意外学习者:多语言自我监督模型中的口语识别。 CoRR公司 abs/2211.05103 ( 2022 ) [i25] 亚历克桑德·拉普特夫 , 鲍里斯·金斯伯格 :
端到端自动语音识别中基于熵的字级置信度快速估计方法。 CoRR公司 腹肌/2212.08703 ( 2022 ) 2021 [注2] 玛丽亚·科尔舒诺娃 , 鲍里斯·金斯伯格 , 亚历山大·特罗普沙 , 亚历山大·伊萨耶夫 :
OpenChem:计算化学和药物设计的深度学习工具包。 化学杂志。 信息模型。 61 ( 1 ) : 7-13 ( 2021 ) [第18条] 费佳 , Somshubra Majumdar公司 , 鲍里斯·金斯伯格 :
MarbleNet:用于语音活动检测的深度1D时间通道可分离卷积神经网络。 ICASSP公司 2021 : 6818-6822 [第17条] 罗健(Jian Luo) , 王建宗 , 宁成 , 爱德华·肖 , 景晓 , 乔治·库斯科 , 帕特里克·K·奥尼尔 , 贾加迪什·巴兰 , 斯莱恩·邓 , 阿德里亚娜·弗洛雷斯 , 鲍里斯·金斯伯格 , 乔斯琳·黄 , 奥列克西·库查耶夫 , 维塔利·拉夫鲁金 , Jason Li(杰森·李) :
端到端自动语音识别的跨语言迁移学习和域自适应。 国际货币兑换协会 2021 : 1-6 [第16条] 帕特里克·K·奥尼尔 , 维塔利·拉夫鲁金 , Somshubra Majumdar公司 , 瓦希德·诺鲁齐 , 张月凯 , 奥列克西·库查耶夫 , 贾加迪什·巴兰 , 尤利娅·多夫琴科 , 基南·弗里伯格 , 迈克尔·D·舒尔曼 , 鲍里斯·金斯伯格 , 渡边信治 , 格奥尔格·库斯科 :
SPGISpeech:5000小时转录的金融音频,用于完全格式化的端到端语音识别。 Interspeech公司 2021 : 1434-1438 [第15条] 伊芙琳娜·巴赫图利纳 , 维塔利·拉夫鲁金 , 鲍里斯·金斯伯格 , 杨章 :
Hi-Fi多扬声器英语TTS数据集。 Interspeech公司 2021 : 2776-2780 [第14条] 斯坦尼斯拉夫·贝利亚耶夫 , 鲍里斯·金斯伯格 :
TalkNet:语音合成的非自回归深度-宽度可分离卷积模型。 Interspeech公司 2021 : 3760-3764个 [第13条] 杨章 , 伊芙琳娜·巴赫图利纳 , 凯尔·戈尔曼 , 鲍里斯·金斯伯格 :
NeMo反向文本规范化:从开发到生产。 Interspeech公司 2021 : 4468-4472 [c12] 杨章 , 伊芙琳娜·巴赫图利纳 , 鲍里斯·金斯伯格 :
NeMo(反向)文本规范化:从开发到生产。 Interspeech公司 2021 : 4857-4859 [第11条] 伊芙琳娜·巴赫图利纳 , 维塔利·拉夫鲁金 , 鲍里斯·金斯伯格 :
用于构建和分析语音数据集的工具箱。 NeurIPS数据集和基准 2021 【i24】 帕特里克·K·奥尼尔 , 维塔利·拉夫鲁金 , Somshubra Majumdar公司 , 瓦希德·诺鲁齐 , 张月凯 , 奥列克西·库查耶夫 , 贾加德什·巴拉姆 , 尤利娅·多夫真科 , 基南·弗里伯格 , 迈克尔·D·舒尔曼 , 鲍里斯·金斯伯格 , 渡边信治 , 乔治·库斯科 :
SPGISpeech:5000小时转录的金融音频,用于完全格式化的端到端语音识别。 CoRR公司 abs/2104.02014 ( 2021 ) [第23条] 伊芙琳娜·巴赫图利纳 , 维塔利·拉夫鲁金 , 鲍里斯·金斯伯格 :
NeMo语音数据集构建工具箱。 CoRR公司 abs/2104.04896 ( 2021 ) [i22] 杨章 , 伊芙琳娜·巴赫图利纳 , 凯尔·戈尔曼 , 鲍里斯·金斯伯格 :
NeMo反向文本规范化:从开发到生产。 CoRR公司 abs/2104.05055 ( 2021 ) 【i21】 斯坦尼斯拉夫·贝利亚耶夫 , 鲍里斯·金斯伯格 :
TalkNet 2:具有显式基音和持续时间预测的语音合成非自回归深度-宽度可分离卷积模型。 CoRR公司 abs/2104.08189 ( 2021 ) [i20] 杨章 , 瓦希德·诺鲁齐 , 伊芙琳娜·巴赫图利纳 , 鲍里斯·金斯伯格 :
SGD-QA:用于未知服务的快速模式引导对话状态跟踪。 CoRR公司 abs/2105.08049 ( 2021 ) [i19] 阿列克塞·卡利诺夫 , Somshubra Majumdar公司 , 贾加迪什·巴兰 , 鲍里斯·金斯伯格 :
CarneliNet:自动语音识别的神经混合模型。 CoRR公司 abs/2107.10708 ( 2021 ) [i18] 团曼莱 , 杨章 , 伊芙琳娜·巴赫图利纳 , 鲍里斯·金斯伯格 , 恒基 :
基于统一变换的双重文本规范化框架。 CoRR公司 abs/2108.09889 ( 2021 ) [i17] 亚历克桑德·拉普特夫 , Somshubra Majumdar公司 , 鲍里斯·金斯伯格 :
CTC通过新WFST拓扑变化。 CoRR公司 abs/2110.03098 ( 2021 ) [i16] 尼廷·拉奥·科卢古里 , 大津公园 , 鲍里斯·金斯伯格 :
TitaNet:用一维深度可分离卷积和全局上下文表示说话人的神经模型。 CoRR公司 abs/2110.04410 ( 2021 ) 【i15】 帕亚斯·奈卡拉(Paarth Neekhara) , 杰森·李 , 鲍里斯·金斯伯格 :
使用转移学习为新演讲者调整TTS模型。 CoRR公司 abs/2110.05798 ( 2021 ) 2020 [第10条] 塞缪尔·克里曼 , 斯坦尼斯拉夫·贝利亚耶夫 , 鲍里斯·金斯伯格 , 乔斯琳·黄 , 奥列克西·库查耶夫 , 维塔利·拉夫鲁金 , 瑞恩·利里 , 杰森·李 , 杨章 :
Quartznet:具有1D时间信道可分离卷积的深度自动语音识别。 ICASSP公司 2020 : 6124-6128 【c9】 Oleksii Hrinchuk公司 , 玛丽亚·波波娃 , 鲍里斯·金斯伯格 :
用变压器序列-序列模型校正自动语音识别。 ICASSP公司 2020 : 7074-7078 【c8】 Somshubra Majumdar公司 , 鲍里斯·金斯伯格 :
MatchboxNet:用于语音命令识别的1D时间信道可分离卷积神经网络结构。 INTERSPEECH公司 2020 : 3356-3360 [第14条] 鲍里斯·金斯伯格 :
关于梯度下降、层不平衡和平坦极小值的正则化。 CoRR公司 abs/2007.09286 ( 2020 ) [i13] 费佳 , Somshubra Majumdar公司 , 鲍里斯·金斯伯格 :
MarbleNet:用于语音活动检测的深度1D时间通道可分离卷积神经网络。 CoRR公司 abs/2010.13886 ( 2020 )
2010 – 2019
2019 【c7】 杰森·李 , 维塔利·拉夫鲁金 , 鲍里斯·金斯伯格 , 瑞恩·利里 , 奥列克西·库查耶夫 , 乔纳森·科恩 , 阮惠仁(Huyen Nguyen) , 拉维·特贾·加德 :
贾斯珀:一个端到端卷积神经声学模型。 INTERSPEECH公司 2019 : 71-75 [i12] 杰森·李 , 维塔利·拉夫鲁金 , 鲍里斯·金斯伯格 , 瑞恩·利里 , 奥列克西·库查耶夫 , 乔纳森·科恩 , 阮惠仁(Huyen Nguyen) , 拉维·特贾·加德 :
贾斯珀:一个端到端卷积神经声学模型。 CoRR公司 abs/1904.03288 ( 2019 ) [i11] 鲍里斯·金斯伯格 , 帕特里斯·卡斯通圭 , Oleksii Hrinchuk公司 , 奥列克西·库查耶夫 , 维塔利·拉夫鲁金 , 瑞恩·利里 , 杰森·李 , 阮惠仁(Huyen Nguyen) , 乔纳森·科恩 :
深层网络训练的分层自适应矩随机梯度法。 CoRR公司 abs/1905.11286 ( 2019 ) [i10] 奥列克西·库查耶夫 , 杰森·李 , 阮惠仁(Huyen Nguyen) , Oleksii Hrinchuk公司 , 瑞恩·利里 , 鲍里斯·金斯伯格 , 塞缪尔·克里曼 , 斯坦尼斯拉夫·贝利亚耶夫 , 维塔利·拉夫鲁金 , 杰克·库克 , 帕特里斯·卡斯通圭 , 玛丽亚·波波娃 , 乔斯琳·黄 , 乔纳森·科恩 :
NeMo:一个使用神经模块构建AI应用程序的工具包。 CoRR公司 abs/1909.09577 ( 2019 ) [第九章] Oleksii Hrinchuk公司 , 玛丽亚·波波娃 , 鲍里斯·金斯伯格 :
用变换序列到序列模型校正自动语音识别。 CoRR公司 abs/1910.10697 ( 2019 ) 2018 [j1] 阿纳斯塔西亚·杜布罗维纳 , 帕维尔·基西列夫 , 鲍里斯·金斯伯格 , 沙贝尔·Y·哈苏尔 , 罗恩·金梅尔 :
使用深层神经网络的计算乳房X射线照相术。 计算。 方法生物技术。 生物识别。 工程成像视觉。 6 ( 三 ) : 243-247 ( 2018 ) 【c6】 彼得·H·金 , 鲍里斯·金斯伯格 , 库尔特·科伊策 :
空间平行卷积。 ICLR(车间) 2018 【c5】 保利乌斯·米切维希乌斯 , 沙兰·纳朗 , 乔纳·阿尔本 , 格雷戈里·迪亚莫斯 , 埃里希·埃尔森 , 大卫·加西亚 , 鲍里斯·金斯伯格 , 迈克尔·休斯顿 , 奥列克西·库查耶夫 , 加内什·文卡泰什 , 郝武 :
混合精准训练。 ICLR(海报) 2018 [i8] 奥列克西·库查耶夫 , 鲍里斯·金斯伯格 , 伊戈尔·吉特曼 , 维塔利·拉夫鲁金 , 卡尔·凯斯 , 保利乌斯·米切维希乌斯 :
OpenSeq2Seq:用于序列到序列模型的分布式和混合精度训练的可扩展工具包。 CoRR公司 abs/1805.10387 ( 2018 ) [i7] 杰森·李 , 拉维·加德 , 鲍里斯·金斯伯格 , 维塔利·拉夫鲁金 :
用合成语音增强训练神经语音识别系统。 CoRR公司 abs/1811.00707 ( 2018 ) 2017 【c4】 奥列克西·库查耶夫 , 鲍里斯·金斯伯格 :
LSTM网络的因子分解技巧。 ICLR(车间) 2017 【c3】 凯文·文森特 , 凯文·斯蒂芬诺 , 迈克尔·弗鲁姆金 , 鲍里斯·金斯伯格 , 朱利安·德莫斯 :
提高Winograd卷积的数值稳定性。 ICLR(车间) 2017 [i6] 奥列克西·库查耶夫 , 鲍里斯·金斯伯格 :
LSTM网络的因子分解技巧。 CoRR公司 abs/1703.10722 ( 2017 ) [i5] 奥列克西·库查耶夫 , 鲍里斯·金斯伯格 :
培训Deep AutoEncoder进行协作过滤。 CoRR公司 abs/1708.01715 ( 2017 ) [i4] 杨友 , 伊戈尔·吉特曼 , 鲍里斯·金斯伯格 :
针对ImageNet培训,将SGD批量大小调整为32K。 CoRR公司 abs/1708.03888 ( 2017 ) [i3] 伊戈尔·吉特曼 , 鲍里斯·金斯伯格 :
用于大规模图像分类的批量归一化和权重归一化算法的比较。 CoRR公司 abs/1709.08145 ( 2017 ) [i2] 保利乌斯·米切维希乌斯 , 沙兰·纳朗 , 乔纳·阿尔本 , 格雷戈里·迪亚莫斯 , 埃里希·埃尔森 , 大卫·加西亚 , 鲍里斯·金斯伯格 , 迈克尔·休斯顿 , 奥列克西·库查耶夫 , 加内什·文卡特什 , 郝武 :
混合精准训练。 CoRR公司 abs/1710.03740 ( 2017 ) 2016 [c2] 艾拉·理查森 , 罗姆·赫斯科维茨 , 鲍里斯·金斯伯格 , 迈克尔·齐布列夫斯基 :
SEBOOST-使用子空间优化技术促进随机学习。 NIPS公司 2016 : 1534-1542 [i1] 艾拉·理查森 , 罗姆·赫斯科维茨 , 鲍里斯·金斯伯格 , 迈克尔·齐布列夫斯基 :
SEBOOST-使用子空间优化技术促进随机学习。 CoRR公司 abs/1609.00629 ( 2016 )