张彪0006 刘忠涛 科林·切里 奥汉·菲拉特 当缩放满足LLM微调:数据、模型和微调方法的影响。 2024 腹肌/240217193 CoRR公司 https://doi.org/10.48550/arXiv.2402.17193 db/journals/corr/corr2402.html#abs-2402-17193
张彪0006 巴里·哈多 亚历山德拉·伯奇 机器翻译的提示大型语言模型:一个案例研究。 2023 abs/2301.07069 CoRR公司 https://doi.org/10.44850/arXiv.2301.07069 数据库/期刊/corr/corr2301.html#abs-2301-07069
张彪0006 巴里·哈多 里科·森里奇 通过粗标签实现高效的CTC正则化,实现端到端语音翻译。 2023 abs/2302.10871 CoRR公司 https://doi.org/10.48550/arXiv.2302.10871 数据库/期刊/corr/corr2302.html#abs-2302-10871
张彪0006 马蒂亚斯·米勒0002 里科·森里奇 SLTUNET:手语翻译的简单统一模型。 2023 abs/2305.01778 CoRR公司 https://doi.org/10.48550/arXiv.2305.01778 数据库/期刊/corr/corr2305.html#abs-2305-01778
克里斯托斯·巴齐奥蒂斯 张彪0006 亚历山大·伯奇 巴里·哈多 单语言数据何时有助于多语言翻译:领域和模型尺度的作用。 2023 abs/2305.14124 CoRR公司 https://doi.org/10.48550/arXiv.2305.14124 数据库/期刊/corr/corr2305.html#abs-2305-14124
斯内哈·库杜贡塔 艾萨克·卡斯维尔 张彪0006 泽维尔·加西亚 克里斯托弗·乔奎特(Christopher A.Choquette-Choo) 凯瑟琳·李 Derrick Xin公司 阿迪蒂亚·库苏帕蒂 罗米·斯特拉 安库尔·巴纳 奥汉·菲拉特 MADLAD-400:一个多语言和文档级的大型审计数据集。 2023 abs/2309.04662 CoRR公司 https://doi.org/10.48550/arXiv.2309.04662 数据库/期刊/corr/corr2309.html#abs-2309-04662
张彪0006 Behrooz Ghorbani公司 安库尔·巴纳 永成 泽维尔·加西亚 乔纳森·沈 奥汉·菲拉特 研究机器翻译语言模型体系结构的缩放和转换。 2022 abs/2202.00528 CoRR公司 https://arxiv.org/abs/2202.00528 db/journals/corr/corr2202.html#abs-2202-00528
亚米尼·班萨尔 Behrooz Ghorbani公司 Ankush Garg公司 张彪0006 马克西姆·克里坤 科林·切里 贝纳姆·尼沙布尔 奥汉·菲拉特 NMT中的数据缩放规律:噪声和建筑的影响。 2022 abs/2202.01994 CoRR公司 https://arxiv.org/abs/2202.01994 db/journals/corr/corr2202.html#abs-2202-01994
张彪0006 巴里·哈多 里科·森里奇 重温从头开始的端到端演讲到文本的翻译。 2022 abs/2206.04571 CoRR公司 https://doi.org/10.48550/arXiv.2206.04571 db/journals/corr/corr2206.html#abs-2206-04571
张彪0006 伊万·蒂托夫 里科·森里奇 用线性单位分散注意力。 2021 abs/2104.07012 CoRR公司 https://arxiv.org/abs/1204.07012 数据库/期刊/corr/corr2104.html#abs-2104-07012
张彪0006 安库尔·巴纳 梅尔文·约翰逊 阿里·达比莫加达姆 纳文·阿里瓦扎甘 奥汉·菲拉特 多语言文档级翻译支持句子到文档的零镜头转换。 2021 abs/2109.10341 CoRR公司 https://arxiv.org/abs/2109.10341 db/journals/corr/corr2109.html#abs-2109-10341
张彪0006 伊万·蒂托夫 里科·森里奇 序列对序列模型中的稀疏化编码器输出。 2020 abs/2004.11854 CoRR公司 https://arxiv.org/abs/2004.11854 db/journals/corr/corr2004.html#abs-2004-11854
张彪0006 菲利普·威廉姆斯 伊万·蒂托夫 里科·森里奇 改进大规模多语言神经机器翻译和零镜头翻译。 2020 abs/2004.11867 CoRR公司 https://arxiv.org/abs/2004.11867 db/journals/corr/corr2004.html#abs-2004-11867
张彪0006 伊万·蒂托夫 巴里·哈多 里科·森里奇 端到端语音翻译的自适应特征选择。 2020 2010年8月518日 CoRR公司 https://arxiv.org/abs/2010.08518 db/journals/corr/corr2010.html#abs-2010-08518
张彪0006 伊万·蒂托夫 里科·森里奇 快速交错双向序列生成。 2020 abs/2010.14481 CoRR公司 https://arxiv.org/abs/2010.14481 db/journals/corr/corr2010.html#abs-2010-14481
里科·森里奇 张彪0006 回顾低资源神经机器翻译:案例研究。 2019 abs/1905.11901 CoRR公司 http://arxiv.org/abs/1905.11901 db/journals/corr/corr1905.html#abs-1905-11901
张彪0006 里科·森里奇 用于序列建模的轻量级递归网络。 2019 abs/1905.13324 CoRR公司 http://arxiv.org/abs/1905.13324 db/journals/corr/corr1905.html#abs-1905-13324
张彪0006 伊万·蒂托夫 里科·森里奇 使用深度缩放初始化和合并注意力改进深度转换器。 2019 abs/1908.11365 CoRR公司 http://arxiv.org/abs/1908.11365 db/journals/corr/corr1908.html#abs-1908-1136
张彪0006 里科·森里奇 均方根层归一化。 2019 abs/1910.07467 CoRR公司 http://arxiv.org/abs/1910.07467 db/journals/corr/corr1910.html#abs-1910-07467