艾托·卢科维茨
人员信息
优化列表
2020年–今天
2023 [j1] Aakanksha Chowdhery公司 , 沙兰·纳朗 , 雅各布·德夫林 , 马尔滕·博斯马 , 高拉夫·米什拉 , 亚当·罗伯茨 , 保罗·巴勒姆 , Hyung Won Chung(亨元忠) , 查尔斯萨顿 , 塞巴斯蒂安·格尔曼 , 帕克·舒赫 , Kensen Shi先生 , 萨沙·茨瓦什琴科 , 约书亚·梅内斯 , Abhishek Rao公司 , 帕克·巴恩斯 , 易泰 , 萨泽尔 , 维诺德库马尔·普拉巴卡兰 , 艾米丽·雷夫 , 南都 , 本·哈钦森 , 雷纳尔·波普 , 詹姆斯·布拉德伯里 , 杰克·奥斯汀 , 迈克尔·伊萨德 , 盖·古尔·阿里 , 彭承印 , Toju Duke公司 , 安塞尔姆·列夫斯卡娅 , 格玛沃特 , Sunipa Dev公司 , Henryk Michalewski , 泽维尔·加西亚 , Vedant Misra公司 , 凯文·罗宾逊 , 利亚姆·费德斯 , 丹尼·周 , 达芙妮·伊波利托 , 大卫·卢安 , 林贤泽 , 巴雷特·佐夫 , 亚历山大·斯皮里多诺夫 , 瑞安·塞帕西 , 大卫·多恩 , 希瓦尼·阿格拉瓦尔 , 马克·奥默尼克 , 安德鲁·M·戴 , Thanumalayan Sankaranarayana Pillai先生 , 玛丽·佩拉特 , 艾托·卢科维茨 , 埃里卡·莫雷拉 , 重写子对象 , 奥列克桑德·波洛佐夫 , 凯瑟琳·李 , 周宗伟 , 王学智 , 布伦南·塞塔 , 马克·迪亚兹 , 奥汉·菲拉特 , 米歇尔·卡塔斯塔 , 华裔老板魏培宁 , 凯西·迈尔·赫尔斯特恩 , 道格拉斯·埃克 , 杰夫狄恩 , 斯拉夫·彼得罗夫 , 诺亚·菲德尔 :
PaLM:使用路径缩放语言建模。 J.马赫。 学习。 物件。 24 : 240:1-240:113 ( 2023 ) 2022 【c4】 维奈·文卡泰什·拉马塞什 , 艾托·卢科维茨 , 伊桑·戴尔 :
神经网络中尺度对灾难性遗忘的影响。 ICLR公司 2022 【c3】 水泥茴香 , 吴雨怀 , 安德斯·安德烈亚森 , 艾托·卢科维茨 , Vedant Misra公司 , 维奈·拉马塞什 , 安布罗斯·斯隆 , 盖·古尔·阿里 , 伊桑·戴尔 , 贝纳姆·尼沙布尔 :
探索大型语言模型中的长度泛化。 NeurIPS公司 2022 【c2】 艾托·卢科维茨 , 安德斯·安德烈亚森 , 大卫·多恩 , 伊桑·戴尔 , 亨利克·米查勒夫斯基 , 维奈·拉马塞什 , 安布罗斯·斯隆 , 水泥茴香 , 伊马诺·施拉格 , 西奥·古特曼·索洛 , 吴雨怀 , 贝纳姆·尼沙布尔 , 盖·古尔·阿里 , 韦丹特米斯拉 :
用语言模型解决定量推理问题。 NeurIPS公司 2022 [i10] 亚当·罗伯茨 , Hyung Won Chung(亨元忠) , 安塞尔姆·列夫斯卡亚 , 高拉夫·米什拉 , 詹姆斯·布拉德伯里 , 丹尼尔·安多 , 沙兰·纳朗 , 布莱恩·莱斯特 , 科林·加夫尼 , 非洲裔莫胡丁 , 柯蒂斯·霍桑 , 艾托·卢科维茨 , 亚历克斯·萨尔恰努 , 马克·范泽 , 杰克·奥斯汀 , 塞巴斯蒂安·古德曼 , 利维奥·巴尔迪尼·索尔斯 , 胡海棠 , 萨沙·茨瓦什琴科 , Aakanksha Chowdhery公司 , Jasmijn底座 , 詹妮斯·布利安 , 泽维尔·加西亚 , 倪剑墨 , 安德鲁·陈 , 凯萨琳·凯尼利 , 乔纳森·克拉克 , 斯蒂芬·李 , 丹·加勒特 , 詹姆斯·利·托普 , 科林·拉斐尔 , 萨泽尔 , 马文·里特 , 马尔滕·博斯马 , 亚历山大·帕索斯 , 杰里米·梅汀·谢泼德 , 诺亚·菲德尔 , 马克·奥默尼克 , 布伦南·塞塔 , 瑞安·塞帕西 , 亚历山大·斯皮里多诺夫 , 约书亚·纽兰 , 安德烈亚·格斯蒙多 :
使用t5x和seqio扩展模型和数据。 CoRR公司 abs/2203.17189 ( 2022 ) [第九章] Aakanksha Chowdhery公司 , 沙兰·纳朗 , 雅各布·德夫林 , 马尔滕·博斯马 , 高拉夫·米什拉 , 亚当·罗伯茨 , 保罗·巴勒姆 , Hyung Won Chung(亨元忠) , 查尔斯萨顿 , 塞巴斯蒂安·盖尔曼 , 帕克·舒赫 , Kensen Shi先生 , 萨沙·茨瓦什琴科 , 约书亚·梅内斯 , Abhishek Rao公司 , 帕克·巴恩斯 , 易泰 , 萨泽尔 , 维诺德库马尔·普拉巴卡兰 , 艾米丽·雷夫 , 南都 , 本·哈钦森 , 雷纳尔·波普 , 詹姆斯·布拉德伯里 , 杰克·奥斯汀 , 迈克尔·伊萨德 , 盖·古尔·阿里 , 彭承印 , Toju Duke公司 , 安塞尔姆·列夫斯卡娅 , 格玛沃特 , Sunipa Dev公司 , 亨利克·米查勒夫斯基 , 泽维尔·加西亚 , Vedant Misra公司 , 凯文·罗宾逊 , 利亚姆·费德斯 , 丹尼·周 , 达芙妮·伊波利托 , 大卫·卢安 , 林贤泽 , 巴雷特·佐夫 , 亚历山大·斯皮里多诺夫 , 瑞恩·塞帕西 , 大卫·多恩 , 希瓦尼·阿格拉瓦尔 , 马克·奥默尼克 , 安德鲁·M·戴 , Thanumalayan Sankaranarayana皮莱 , 玛丽·佩拉特 , 艾托·卢科维茨 , 埃里卡·莫雷拉 , 重写子对象 , 奥列克桑德尔·波洛佐夫 , 凯瑟琳·李 , 周宗伟 , 王学智 , 布伦南·塞塔 , 马克·迪亚兹 , 奥汉·菲拉特 , 米歇尔·卡塔斯塔 , 华裔老板魏培宁 , 凯西·迈尔·赫尔斯特恩 , 道格拉斯·埃克 , 杰夫狄恩 , 斯拉夫·彼得罗夫 , 诺亚·菲德尔 :
PaLM:使用路径缩放语言建模。 CoRR公司 abs/2204.02311 ( 2022 ) [i8] 阿罗希·斯利瓦斯塔瓦 , 阿比纳夫·拉斯托吉 , 阿布谢克·拉奥 , 阿布·阿瓦尔Md Shoeb , 阿布巴卡尔·阿比德 , 亚当·菲什 , 亚当·布朗 , 亚当·桑托罗 , 阿迪蒂亚·古普塔 , 阿德里亚·加里加·阿隆索 , 阿格涅斯卡·克鲁斯卡 , 艾托·卢科维茨 , 阿克沙特·阿加瓦尔 , 阿莱西亚·鲍尔 , 亚历克斯·雷 , 亚历克斯·沃斯塔特 , 亚历山大·科克里克 , 阿里·萨法亚 , 阿里·塔扎尔夫 , 艾丽斯·香 , 艾丽西娅·帕里什 , Allen Nie公司 , 阿曼·胡赛因 , 阿曼达·阿斯克尔 , 阿曼达·苏扎 , 阿梅特·拉哈内 , 阿南塔拉曼S.Iyer , 安德斯·安德烈亚森 , 安德烈亚·桑蒂利 , 安德烈亚斯·斯图尔穆勒 , 安德鲁·M·戴 , 安德鲁·拉 , 安德鲁·兰皮宁 , 安迪·邹 , 安吉拉·蒋 , Angelica Chen(陈安琪) , Anh Vuong公司 , 阿尼梅斯·古普塔 , 安娜·戈塔迪 , 安东尼奥·诺雷利 , Anu Venkatesh公司 , 阿拉什·戈拉马达武迪 , 阿尔法·塔巴瑟姆 , 阿鲁尔·梅内塞斯 , 阿伦·基鲁巴拉扬 , 阿谢尔·穆洛坎多夫 , 阿什什·萨巴瓦尔 , 奥斯汀·赫里克 , 阿维亚·埃弗拉特 , 艾库特·埃尔登 , 艾拉·卡拉卡斯 , 等人。 :
超越模仿游戏:量化和推断语言模型的能力。 CoRR公司 abs/2206.04615 ( 2022 ) [i7] 艾托·卢科维茨 , 安德斯·安德烈亚森 , 大卫·多恩 , 伊桑·戴尔 , 亨利克·米查勒夫斯基 , 维奈·拉马塞什 , 安布罗斯·斯隆 , 水泥茴香 , 伊马诺·施拉格 , 西奥·古特曼·索洛 , 吴雨怀 , 贝纳姆·尼沙布尔 , 盖·古尔·阿里 , Vedant Misra公司 :
用语言模型解决定量推理问题。 CoRR公司 abs/2206.14858 ( 2022 ) [i6] 水泥茴香 , 吴雨怀 , 安德斯·安德烈亚森 , 艾托·卢科维茨 , Vedant Misra公司 , 维奈·拉马塞什 , 安布罗斯·斯隆 , 盖·古尔·阿里 , 伊桑·戴尔 , 贝纳姆·尼沙布尔 :
探索大型语言模型中的长度泛化。 CoRR公司 abs/2207.04901 ( 2022 ) [i5] 大卫·多恩 , 温妮·徐 , 艾托·卢科维茨 , 杰克·奥斯汀 , 大卫·比伯 , 拉斐尔·冈蒂霍·洛佩斯 , 吴雨怀 , 亨利克·米查勒夫斯基 , 里夫·A·索罗斯 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , 凯文·墨菲 , 查尔斯萨顿 :
语言模型级联。 CoRR公司 abs/2207.10342 ( 2022 ) 2021 [i4] 艾托·卢科维茨 :
如何降低学习率。 CoRR公司 abs/2103.12682 ( 2021 ) [i3] 麦克斯韦·I.奈 , 安德斯·约翰安德烈亚森 , Guy Gur Ari先生 , 亨利克·米查勒夫斯基 , 杰克·奥斯汀 , 大卫·比伯 , 大卫·多恩 , 艾托·卢科维茨 , 马尔滕·博斯马 , 大卫·卢安 , 查尔斯萨顿 , 奥古斯塔斯·奥德纳 :
展示您的工作:使用语言模型进行中级计算的草稿。 CoRR公司 abs/2112.00114 ( 2021 ) 2020 【c1】 艾托·卢科维茨 , 盖·古尔·阿里 :
关于具有$L_2$正则化的深度网络的训练动力学。 NeurIPS公司 2020 [i2] 艾托·卢科维茨 , 亚萨曼·巴赫里 , 伊桑·戴尔 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , 盖·古尔·阿里 :
深度学习的高学习率阶段:弹射器机制。 CoRR公司 2003年2月218日 ( 2020 ) [i1] 艾托·卢科维茨 , 盖·古尔·阿里 :
基于L的深层网络训练动力学研究 2 正规化。 CoRR公司 腹肌/2006.08643 ( 2020 )