弗雷德里克·库斯特纳
人员信息
SPARQL查询
优化列表
2020年–今天
2024 [第九章] 弗雷德里克·库斯特纳 , 罗宾·亚达夫 , 阿兰·米利根 , 马克·施密特 , 阿尔贝托·比埃蒂 :
重尾类失衡和为什么Adam在语言模型上表现优于梯度下降。 CoRR公司 abs/2402.19449 ( 2024 ) 2023 【c7】 弗雷德里克·昆斯特纳 , 雅克·陈 , 乔纳森·威尔德·拉文顿 , 马克·施密特 :
噪音不是《变形金刚》中Sgd和Adam之间差距的主要因素,但可能是符号下降。 ICLR公司 2023 【c6】 弗雷德里克·库斯特纳 , 维克托·桑切斯·波特拉 , 马克·施密特 , 尼古拉斯·J·A·哈维 :
使用多维回溯搜索最佳超协调步长。 NeurIPS公司 2023 [i8] 弗雷德里克·库斯特纳 , 雅克·陈 , 乔纳森·威尔德·拉文顿 , 马克·施密特 :
噪音不是《变形金刚》中SGD和Adam之间差距的主要因素,但可能是下降的迹象。 CoRR公司 abs/2304.13960 ( 2023 ) [i7] 弗雷德里克·库斯特纳 , 维克托·波特拉 , 马克·施密特 , 尼克·哈维 :
使用多维回溯搜索最佳超协调步长。 CoRR公司 腹肌/2306.02527 ( 2023 ) 2022 【c5】 弗雷德里克·库斯特纳 , 劳纳克·库马尔 , 马克·施密特 :
EM的同胚不变性:指数族通过镜像下降的KL发散中的非同态收敛(扩展抽象)。 国际JCAI 2022 : 5294-5298 2021 【c4】 弗雷德里克·昆斯特纳 , 劳纳克·库马尔 , 马克·施密特 :
EM的同胚不变性:指数族通过镜像下降在KL发散中的非同态收敛。 AISTATS公司 2021 : 3295-3303 [i6] 雷米·勒普利奥 , 弗雷德里克·库斯特纳 , 达米安·西厄尔 , 西蒙·拉科斯特-朱利安 :
指数族MAP和随机镜像下降的收敛速度——一个公开问题。 CoRR公司 abs/2111.06826 ( 2021 ) 2020 【c3】 费利克斯·丹格尔 , 弗雷德里克·昆斯特纳 , 菲利普·亨尼 :
BackPACK:将更多内容打包到Backprop中。 ICLR公司 2020 [i5] 莎兰·瓦斯瓦尼 , 弗雷德里克·库斯特纳 , 伊萨姆·拉拉吉 , 《四一梦》 , 马克·施密特 , 西蒙·拉科斯特-朱利安 :
自适应梯度方法通过过度参数化更快地收敛(您可以进行线性搜索)。 CoRR公司 abs/2006.06835 ( 2020 ) [i4] 弗雷德里克·库斯特纳 , 劳纳克·库马尔 , 马克·施密特 :
EM的同胚不变性:指数族通过镜像下降在KL发散中的非同态收敛。 CoRR公司 abs/2011.01170 ( 2020 )
2010 – 2019
2019 【c2】 弗雷德里克·库斯特纳 , 菲利普·亨尼 , 卢卡斯·巴莱斯 :
自然梯度下降的经验Fisher近似的局限性。 NeurIPS公司 2019 : 4158-4169 [i3] 弗雷德里克·库斯特纳 , 卢卡斯芭蕾舞团 , 菲利普·亨尼 :
经验Fisher近似的局限性。 CoRR公司 abs/1905.12558 ( 2019 ) [i2] 费利克斯·丹格尔 , 弗雷德里克·库斯特纳 , 菲利普·亨尼 :
背包:把更多的东西放进背包里。 CoRR公司 abs/1912.10985 ( 2019 ) 2018 【c1】 亚伦·米什金 , 弗雷德里克·库斯特纳 , 迪德里克·尼尔森 , 马克·施密特 , 穆罕默德·埃米提亚兹·汗 :
SLANG:具有自然梯度的贝叶斯深度学习的快速结构协方差近似。 NeurIPS公司 2018 : 6248-6258 [i1] 亚伦·米什金 , 弗雷德里克·库斯特纳 , 迪德里克·尼尔森 , 马克·施密特 , 穆罕默德·埃米提亚兹·汗 :
SLANG:具有自然梯度的贝叶斯深度学习的快速结构协方差近似。 CoRR公司 abs/1811.04504 ( 2018 )