小乐超
人员信息
SPARQL查询
优化列表
2020年–今天
2024 [j1] 阿维·辛格 , John D.Co-Reyes公司 , 里沙布·阿加瓦尔 , 安克什·阿南德 , 皮尤什·帕蒂尔 , 泽维尔·加西亚 , 彼得·J·刘 , 哈里森 , 杰洪·李 , Kelvin Xu(徐开尔文) , 阿伦·帕里西 , 阿比谢克·库马尔 , 亚历山大·阿莱米 , 亚历克斯·里兹科夫斯基 , 新阿扎德 , 本·阿德拉姆 , 伯恩德·博内特 , Gamaleldin Fathy Elsayed公司 , 哈尼·塞吉 , 伊戈尔·莫达奇 , 伊莎贝拉·辛普森 , 伊泽丁·古尔 , 贾斯珀·斯诺克 , 杰弗里·彭宁顿 , 吉里·赫隆 , 凯萨琳·凯尼利 , 凯文·斯沃斯基 , Kshiteej Mahajan公司 , 劳拉·卡尔普 , 小乐超 , 麦克斯韦·L·比莱斯基 , 诺亚常数 , 罗曼·诺瓦克 , 罗珊·刘 , 特里斯·沃肯廷 , 钱云迪 , 亚米尼·班萨尔 , 伊桑·戴尔 , 贝纳姆·尼沙布尔 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , 诺亚·菲德尔 :
超越人类数据:用语言模型解决问题的自我训练。 事务处理。 机器。 学习。 物件。 2024 ( 2024 ) [第16条] 米切尔·沃茨曼 , 彼得·J·刘 , 小乐超 , 凯蒂·埃弗雷特 , 亚历山大·阿莱米 , 本·阿德拉姆 , John D.Co-Reyes公司 , 伊泽丁·古尔 , 阿比谢克·库马尔 , 罗曼·诺瓦克 , 杰弗里·彭宁顿 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , Kelvin Xu(徐开尔文) , 杰洪·李 , 贾斯汀·吉尔默 , 西蒙·科恩布利特 :
大规模变压器训练不稳定性的小规模代理。 ICLR公司 2024 [第15条] 凯蒂·埃弗雷特 , 小乐超 , 米切尔·沃茨曼 , 亚历山大·阿莱米 , 罗曼·诺瓦克 , 彼得·J·刘 , 伊泽丁·古尔 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , Leslie Pack Kaelbling公司 , 杰洪·李 , 杰弗里·彭宁顿 :
跨参数化和优化器缩放指数。 ICML公司 2024 [i20] 埃利奥特·帕奎特 , 考特尼·帕奎特 , 小乐超 , 杰弗里·彭宁顿 :
4+3阶段的计算优化神经尺度律。 CoRR公司 abs/2405.15074 ( 2024 ) [i19] 凯蒂·埃弗雷特 , 小乐超 , 米切尔·沃茨曼 , 亚历山大·阿莱米 , 罗曼·诺瓦克 , 彼得·J·刘 , 伊泽丁·古尔 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , Leslie Pack Kaelbling公司 , 杰洪·李 , 杰弗里·彭宁顿 :
在参数化和优化器之间缩放指数。 CoRR公司 abs/2407.05872 ( 2024 ) [i18] 吉里·赫隆 , 劳拉·卡尔普 , Gamaleldin F.Elsayed公司 , 罗珊·刘 , 本·阿德拉姆 , 麦克斯韦·L·比莱斯基 , 伯恩德·博内特 , JD眼睛 , 诺亚·菲德尔 , C.丹尼尔·弗里曼 , 伊泽丁·古尔 , 凯萨琳·凯尼利 , 杰洪·李 , 彼得·J·刘 , 高拉夫·米什拉 , 伊戈尔·莫达奇 , 新阿扎德 , 罗曼·诺瓦克 , 亚伦·帕里西 , 杰弗里·彭宁顿 , 亚历克斯·里兹科夫斯基 , 伊莎贝拉·辛普森 , 哈尼·塞吉 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , 凯文·斯沃斯基 , 莎拉·维克兰 , 特里斯·沃肯廷 , 小乐超 , Kelvin Xu(徐开尔文) , 贾斯珀·斯诺克 , 西蒙·科恩布利特 :
在知识图上训练语言模型:幻觉及其可检测性的见解。 CoRR公司 abs/2408.07852 ( 2024 ) 2023 [i17] 米切尔·沃茨曼 , 彼得·J·刘 , 小乐超 , 凯蒂·埃弗雷特 , 亚历克斯·阿勒米 , 本·阿德拉姆 , John D.Co-Reyes公司 , 伊泽丁·古尔 , 阿比谢克·库马尔 , 罗曼·诺瓦克 , 杰弗里·彭宁顿 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , Kelvin Xu(徐开尔文) , 杰洪·李 , 贾斯汀·吉尔默 , 西蒙·科恩布利特 :
大规模变压器训练不稳定性的小规模代理。 CoRR公司 abs/2309.14322 ( 2023 ) [i16] C.丹尼尔·弗里曼 , 劳拉·卡尔普 , 亚伦·帕里西 , 麦克斯韦·L·比莱斯基 , Gamaleldin F.Elsayed公司 , 亚历克斯·里兹科夫斯基 , 伊莎贝拉·辛普森 , 亚历克斯·阿勒米 , 新阿扎德 , 本·阿德拉姆 , 伯恩德·博内特 , 高拉夫·米什拉 , 哈尼·塞吉 , 伊戈尔·莫达奇 , 伊泽丁·古尔 , 杰洪·李 , John D.Co-Reyes公司 , 杰弗里·彭宁顿 , Kelvin Xu(徐开尔文) , 凯文·斯沃斯基 , Kshiteej Mahajan公司 , 小乐超 , 罗珊·刘 , 西蒙·科恩布利特 , 诺亚常数 , 彼得·J·刘 , 罗曼·诺瓦克 , 钱云迪 , 诺亚·菲德尔 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) :
前沿语言模型对对手算术不可靠,或“我需要说什么才能让你同意2+2=5?”? CoRR公司 abs/2311.07587 ( 2023 ) 【i15】 阿维·辛格 , John D.Co-Reyes公司 , 里沙布·阿加瓦尔 , 安克什·阿南德 , 皮尤什·帕蒂尔 , 泽维尔·加西亚 , 彼得·J·刘 , 哈里森 , 杰洪·李 , Kelvin Xu(徐开尔文) , 亚伦·帕里西 , 阿比谢克·库马尔 , 亚历克斯·阿勒米 , 亚历克斯·里兹科夫斯基 , 新阿扎德 , 本·阿德拉姆 , 伯恩德·博内特 , Gamaleldin F.Elsayed公司 , 哈尼·塞吉 , 伊戈尔·莫达奇 , 伊莎贝拉·辛普森 , 伊泽丁·古尔 , 贾斯珀·斯诺克 , 杰弗里·彭宁顿 , 吉里·赫隆 , 凯萨琳·凯尼利 , 凯文·斯沃斯基 , Kshiteej Mahajan公司 , 劳拉·卡尔普 , 小乐超 , 麦克斯韦·L·比莱斯基 , 诺亚常数 , 罗曼·诺瓦克 , 罗珊·刘 , 特里斯·沃肯廷 , 钱云迪 , 亚米尼·班萨尔 , 伊桑·戴尔 , 贝纳姆·尼沙布尔 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , 诺亚·菲德尔 :
超越人类数据:用语言模型解决问题的自我训练。 CoRR公司 abs/2312.06585 ( 2023 ) 2022 [第14条] 小乐超 :
特征空间重构:神经网络中的空间和频率原理。 COLT公司 2022 : 4888-4944 [第13条] 小乐超 , 杰弗里·彭宁顿 :
深度学习中的协同与对称:数据、模型和推理算法之间的交互。 ICML公司 2022 : 24347-24369 [c12] 因苏·韩 , 阿米尔·赞迪 , 杰洪·李 , 罗曼·诺瓦克 , 小乐超 , 阿明·卡巴西 :
用于一般激活的快速神经内核嵌入。 NeurIPS公司 2022 [第11条] 小乐超 , 洪湖 , 西奥多·米西亚基维奇 , 岳璐 , 杰弗里·彭宁顿 :
点产品核回归的精确学习曲线和高阶尺度。 NeurIPS公司 2022 [第14条] 小乐超 , 杰弗里·彭宁顿 :
点积核回归的精确学习曲线和高阶尺度极限。 CoRR公司 abs/2205.14846 ( 2022 ) [i13] 小乐超 , 杰弗里·彭宁顿 :
深度学习中的协同与对称:数据、模型和推理算法之间的交互。 CoRR公司 abs/2207.04612 ( 2022 ) [i12] 因苏·韩 , 阿米尔·赞迪 , 杰洪·李 , 罗曼·诺瓦克 , 小乐超 , 阿明·卡巴西 :
用于一般激活的快速神经内核嵌入。 CoRR公司 abs/2209.04121 ( 2022 ) 2021 [第10条] 本·阿德拉姆 , 杰洪·李 , 小乐超 , 杰弗里·彭宁顿 , 贾斯珀·斯诺克 :
探索神经网络隐式先验在无限宽度极限下的不确定性。 ICLR公司 2021 【c9】 蒂莫西·阮 , 罗曼·诺瓦克 , 小乐超 , 杰洪·李 :
无限宽卷积网络的数据集提取。 NeurIPS公司 2021 : 5186-5198 [i11] Timothy Nguyen(Timothy Nguyen) , 罗曼·诺瓦克 , 小乐超 , 杰洪·李 :
无限宽卷积网络的数据集提取。 CoRR公司 abs/2107.13034 ( 2021 ) [i10] 小乐超 :
特征空间重构:神经网络中的空间和频率原理。 CoRR公司 abs/2112.05611 ( 2021 ) 2020 【c8】 魏虎 , 小乐超 , 杰弗里·彭宁顿 :
正交初始化在优化深线性网络中的可证明优势。 ICLR公司 2020 【c7】 罗曼·诺瓦克 , 小乐超 , 吉里·赫隆 , 杰洪·李 , 亚历山大·阿莱米 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , 塞缪尔·肖恩霍尔茨 :
神经切线:快速简单的Python无限神经网络。 ICLR公司 2020 【c6】 小乐超 , 杰弗里·彭宁顿 , 塞缪尔·斯特恩·肖恩霍尔茨 :
深层神经网络中的分离可训练性和泛化。 ICML公司 2020 : 10462-10472 【c5】 魏虎 , 小乐超 , 本·阿德拉姆 , 杰弗里·彭宁顿 :
神经网络早期学习动力学的惊人简单性。 NeurIPS公司 2020 【c4】 杰洪·李 , 塞缪尔·肖恩霍尔茨 , 杰弗里·彭宁顿 , 本·阿德拉姆 , 小乐超 , 罗曼·诺瓦克 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) :
有限与无限神经网络:一项实证研究。 NeurIPS公司 2020 [第九章] 魏虎 , 小乐超 , 杰弗里·彭宁顿 :
正交初始化在优化深线性网络中的可证明优势。 CoRR公司 abs/2001.05992 ( 2020 ) [i8] 魏虎 , 小乐超 , 本·阿德拉姆 , 杰弗里·彭宁顿 :
神经网络早期学习动力学的惊人简单性。 CoRR公司 abs/2006.14599 ( 2020 ) [i7] 杰洪·李 , 塞缪尔·肖恩霍尔茨 , 杰弗里·彭宁顿 , 本·阿德拉姆 , 小乐超 , 罗曼·诺瓦克 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) :
有限与无限神经网络:一项实证研究。 CoRR公司 腹肌/2007.15801 ( 2020 ) [i6] 本·阿德拉姆 , 杰洪·李 , 小乐超 , 杰弗里·彭宁顿 , 贾斯珀·斯诺克 :
探索神经网络隐式先验在无限宽度极限下的不确定性。 CoRR公司 abs/2010.07355 ( 2020 )
2010 – 2019
2019 【c3】 罗曼·诺瓦克 , 小乐超 , 亚萨曼·巴赫里 , 杰洪·李 , 格雷格·杨 , 吉里·赫隆 , 丹尼尔·阿博拉菲亚 , 杰弗里·彭宁顿 , 贾斯查·索尔·迪克斯坦 :
多信道贝叶斯深卷积网络是高斯过程。 ICLR(海报) 2019 【c2】 杰洪·李 , 小乐超 , 塞缪尔·肖恩霍尔茨 , 亚萨曼·巴赫里 , 罗曼·诺瓦克 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , 杰弗里·彭宁顿 :
任意深度的宽神经网络在梯度下降下演化为线性模型。 NeurIPS公司 2019 : 8570-8581 [i5] 杰洪·李 , 小乐超 , 塞缪尔·肖恩霍尔茨 , 亚萨曼·巴赫里 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , 杰弗里·彭宁顿 :
任意深度的宽神经网络在梯度下降下演化为线性模型。 CoRR公司 abs/1902.06720 ( 2019 ) [i4] 罗曼·诺瓦克 , 小乐超 , 吉里·赫隆 , 杰洪·李 , 亚历山大·阿莱米 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , 塞缪尔·肖恩霍尔茨 :
神经切线:快速简单的Python无限神经网络。 CoRR公司 abs/1912.02803 ( 2019 ) [i3] 小乐超 , 杰弗里·彭宁顿 , 塞缪尔·肖恩霍尔茨 :
在深度学习中消除可训练性和泛化。 CoRR公司 abs/1912.13053 ( 2019 ) 2018 【c1】 小乐超 , 亚萨曼·巴赫里 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , 塞缪尔·肖恩霍尔茨 , 杰弗里·彭宁顿 :
CNN的动态等距和平均场理论:如何训练10000层香草卷积神经网络。 ICML公司 2018 : 5389-5398 [i2] 小乐超 , 亚萨曼·巴赫里 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , 塞缪尔·肖恩霍尔茨 , 杰弗里·彭宁顿 :
CNN的动态等距和平均场理论:如何训练10000层香草卷积神经网络。 CoRR公司 abs/1806.05393 ( 2018 ) [i1] 罗曼·诺瓦克 , 小乐超 , 杰洪·李 , 亚萨曼·巴赫里 , 丹尼尔·阿博拉菲亚 , 杰弗里·彭宁顿 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) :
多通道贝叶斯卷积神经网络是高斯过程。 CoRR公司 abs/1810.05148 ( 2018 )