劳伦特·奥尔索
人员信息
优化列表
2020年–今天
2024 [i25] 乔迪·格拉乌·莫亚 , Tim Genewein公司 , 马库斯·赫特 , 劳伦特·奥尔索 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 埃利奥特·卡特 , 阿尼安·鲁斯 , 李凯文文亮 , 克里斯托弗·马特恩 , 马修·艾奇森 , 乔尔·维内斯 :
学习通用预测。 CoRR公司 abs/2401.14953 ( 2024 ) 2023 [公元28年] 蒂姆·吉纳温 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 李凯文文亮 , 埃利奥特·卡特 , 文森特·杜托多尔 , 乔迪·格拉乌·莫亚 , 劳伦特·奥尔索 , 马库斯·赫特 , 乔尔·维内斯 :
基于非平稳分布的记忆元学习。 ICML公司 2023 : 11173-11195 [c27] 劳伦特·奥尔索 , 马库斯·哈特 , 列维·H·S·莱利斯 :
基于上下文模型的莱文树搜索。 国际JCAI 2023 : 5622-5630 【i24】 蒂姆·吉纳温 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 李凯文文亮 , 埃利奥特·卡特 , 文森特·杜托多尔 , 乔迪·格拉乌·莫亚 , 劳伦特·奥尔索 , 马库斯·赫特 , 乔尔·维内斯 :
基于非平稳分布的记忆元学习。 CoRR公司 abs/2302.03067 ( 2023 ) [第23条] 劳伦特·奥尔索 , 马库斯·赫特 , 列维·H·S·莱利斯 :
基于上下文模型的莱文树搜索。 CoRR公司 abs/2305.16945 ( 2023 ) [i22] 劳伦特·奥尔索 , 马库斯·哈特 :
凸极小化的线搜索。 CoRR公司 abs/2307.16560 ( 2023 ) [i21] 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 保尔·安布罗斯·杜昆 , 埃利奥特·卡特 , 蒂姆·吉纳温 , 克里斯托弗·马特恩 , 乔迪·格拉乌·莫亚 , 李凯文文亮 , 马修·艾奇森 , 劳伦特·奥尔索 , 马库斯·哈特 , 乔尔·维内斯 :
语言建模是压缩。 CoRR公司 abs/2309.10668 ( 2023 ) [i20] 阿巴斯·梅拉比安(Abbas Mehrabian) , 安基特·阿南德 , Hyunjik Kim先生 , 尼古拉斯·桑纳雷特 , 马特杰·巴洛格 , Gheorghe Comanici公司 , 都铎·贝拉鲁 , 安德鲁李 , 阿尼安·若斯 , 安娜·布拉诺娃 , 丹尼尔·富山 , 萨姆·布莱克威尔 , 贝纳迪诺·罗梅拉-佩雷斯 , 彼得·维利科维奇 , 劳伦特·奥尔索 , Joonkyung Lee(李俊京) , 阿努拉·穆尔蒂·纳雷德拉 , Doina Precup公司 , 亚当·兹索尔·瓦格纳 :
使用AlphaZero和Tabu搜索查找越来越大的极值图。 CoRR公司 abs/2311.03583 ( 2023 ) 2022 [公元26年] 埃塞尔·艾根 , 安基特·阿南德 , 劳伦特·奥尔索 , 泽维尔·格洛洛特 , 斯蒂芬·马库斯·麦卡勒 , 弗拉德·菲鲁 , Lei M.Zhang(张磊) , Doina Precup公司 , Shibl Mourad公司 :
使用增量学习和后视经验回放证明定理。 ICML公司 2022 : 1198-1210 2021 [公元25年] 劳伦特·奥尔索 , 列维·H·S·莱利斯 :
有保障的政策引导启发式搜索。 AAAI公司 2021 : 12382-12390 [i19] 弗拉德·菲鲁 , 埃塞尔·艾根 , 安基特·阿南德 , 扎法拉利·艾哈迈德 , 泽维尔·格洛洛特 , 劳伦特·奥尔索 , Lei M.Zhang(张磊) , Doina预备 , 希布尔·穆拉德 :
从合成数据训练一阶定理证明者。 CoRR公司 腹肌/2103.03798 ( 2021 ) [i18] 劳伦特·奥尔索 , 列维·H·S·莱利斯 :
有保障的政策引导启发式搜索。 CoRR公司 abs/2103.11505 ( 2021 ) [i17] 埃塞尔·艾根 , 劳伦特·奥尔索 , 安基特·阿南德 , 泽维尔·格洛洛特 , 弗拉德·菲鲁 , Lei M.Zhang(张磊) , Doina Precup公司 , 希布尔·穆拉德 :
使用增量学习和后视经验回放证明定理。 CoRR公司 abs/2112.10664 ( 2021 ) [i16] 劳伦特·奥尔索 , 马库斯·赫特 :
与应用程序保持一致,实现无标度在线学习。 CoRR公司 abs/2112.14586 ( 2021 ) 2020 [公元24年] 斯图尔特·阿姆斯特朗 , 简·雷克 , 劳伦特·奥尔索 , 谢恩·莱格 :
在线学习奖励功能的陷阱。 国际JCAI 2020 : 1592-1600 【c23】 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 理查德·恩戈(Richard Ngo) , Miljan Martic公司 , 谢恩·莱格 :
通过考虑未来任务避免副作用。 NeurIPS公司 2020 [公元22年] 劳伦特·奥尔索 , 马库斯·赫特 , 奥马尔·里瓦斯普拉塔 :
对数修剪就是你所需要的。 NeurIPS公司 2020 【i15】 斯图尔特·阿姆斯特朗 , 简·雷克 , 劳伦特·奥尔索 , 谢恩·莱格 :
在线学习奖励功能的陷阱。 CoRR公司 abs/2004.13654 ( 2020 ) [第14条] 埃塞尔·艾根 , 扎法拉利·艾哈迈德 , 安基特·阿南德 , 弗拉德·菲鲁 , 泽维尔·格罗特 , 劳伦特·奥尔索 , Doina Precup公司 , 希布尔·穆拉德 :
学习从合成定理证明。 CoRR公司 abs/2006.11259 ( 2020 ) [i13] 劳伦特·奥尔索 , 马库斯·赫特 , 奥马尔·里瓦斯普拉塔 :
对数修剪就是你所需要的。 CoRR公司 abs/2006.12156 ( 2020 ) [i12] 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 理查德·恩戈(Richard Ngo) , Miljan Martic公司 , Shane Legg公司 :
通过考虑未来任务避免副作用。 CoRR公司 abs/2010.07877 ( 2020 )
2010 – 2019
2019 【c21】 阿瑟·盖兹 , 梅赫迪·米尔扎 , 卡罗尔·格雷戈 , 里沙布·卡布拉 , 塞巴斯蒂安·拉卡尼埃 , 西奥芬妮·韦伯 , 大卫·拉波索 , 亚当·桑托罗 , 劳伦特·奥尔索 , 汤姆·埃克尔斯 , 格雷格·韦恩 , 大卫·西尔弗 , 蒂莫西·利利克拉普 :
无模型规划研究。 ICML公司 2019 : 2464-2473 [公元20年] 马尔特·赫尔默特 , 托拉蒂莫尔 , 列维·H·S·莱利斯 , 劳伦特·奥尔索 , 内森·斯特凡特 :
迭代预算指数搜索。 国际JCAI 2019 : 1249-1257 [第19条] 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , Miljan Martic公司 , 谢恩·莱格 :
使用逐步相对可达性惩罚副作用。 AIS安全@IJCAI 2019 [i11] 劳伦特·奥尔索 , 托尔·拉铁摩尔 , 谢恩·莱格 :
软贝叶斯(Soft-Bayes):为具有对数损失的专家组合设计。 CoRR公司 abs/1901.02230 ( 2019 ) [i10] 阿瑟·盖兹 , 迈赫迪·米尔扎 , 卡罗尔·格雷戈 , 里沙布·卡布拉 , 塞巴斯蒂安·拉卡尼埃 , 塞奥帕恩·韦伯(Théophane Weber) , 大卫·拉波索 , 亚当·桑托罗 , 劳伦特·奥尔索 , 汤姆·埃克尔斯 , 格雷格·韦恩 , 大卫·西尔弗 , 蒂莫西·利利克拉普 :
无模型规划研究。 CoRR公司 abs/1901.03559 ( 2019 ) [第九章] 劳伦特·奥尔索 , 列维·H·S·莱利斯 , 托拉蒂莫尔 :
小心缩放:保证节点扩展的线性内存启发式搜索。 CoRR公司 abs/1906.03242 ( 2019 ) [i8] 马尔特·赫尔默特 , 托拉蒂莫尔 , 列维·H·S·莱利斯 , 劳伦特·奥尔索 , 内森·斯特凡特 :
迭代预算指数搜索。 CoRR公司 abs/1907.13062 ( 2019 ) 2018 [第18条] 劳伦特·奥尔索 , 列维·莱利斯 , 托拉蒂莫尔 , 西奥芬妮·韦伯 :
具有担保的单代理策略树搜索。 NeurIPS公司 2018 : 3205-3215年 [i7] 劳伦特·奥尔索 , 西蒙·麦格雷戈·麦吉尔 , 谢恩·莱格 :
代理和设备:代理的相对定义。 CoRR公司 abs/1805.12387 ( 2018 ) [i6] 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , Miljan Martic公司 , 谢恩·莱格 :
使用相对可达性测量和避免副作用。 CoRR公司 abs/1806.01186 ( 2018 ) [i5] 劳伦特·奥尔索 , 列维·H·S·莱利斯 , 托拉蒂莫尔 , 塞奥帕恩·韦伯(Théophane Weber) :
具有担保的单代理策略树搜索。 CoRR公司 abs/1811.10928 ( 2018 ) 2017 [第17条] 劳伦特·奥尔索 , 托拉蒂莫尔 , 谢恩·莱格 :
软贝叶斯(Soft-Bayes):为具有对数损失的专家组合设计。 中高音 2017 : 372-399 [第16条] 汤姆·艾唯瑞特 , 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 谢恩·莱格 :
通过腐败的奖励渠道强化学习。 国际JCAI 2017 : 4705-4713 [第15条] 简·雷克 , 托拉蒂莫尔 , 劳伦特·奥尔索 , 马库斯·赫特 :
关于汤普森抽样和渐近最优性。 国际JCAI 2017 : 4889-4893 [i4] 汤姆·艾唯瑞特 , 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 马库斯·赫特 , Shane Legg公司 :
通过腐败的奖励渠道强化学习。 CoRR公司 abs/1705.08417 ( 2017 ) [i3] 简·雷克 , Miljan Martic公司 , 维多利亚·克拉科夫纳 , 佩德罗·奥尔特加 , 汤姆·艾唯瑞特 , 安德鲁·勒弗朗克 , 劳伦特·奥尔索 , 谢恩·莱格 :
AI安全网格世界。 CoRR公司 abs/1711.09883 ( 2017 ) 2016 [c14] 简·雷克 , 托拉蒂莫尔 , 劳伦特·奥尔索 , 马库斯·赫特 :
汤普森抽样在一般环境下是渐近最优的。 阿拉伯联合酋长国 2016 [第13条] 劳伦特·奥尔索 , 斯图尔特·阿姆斯特朗 :
安全可中断代理。 阿拉伯联合酋长国 2016 [i2] 简·雷克 , 托拉蒂莫尔 , 劳伦特·奥尔索 , 马库斯·赫特 :
汤普森抽样在一般环境下是渐近最优的。 CoRR公司 abs/1602.07905 ( 2016 ) 2015 [第12条] 乔尔·维内斯 , 马库斯·赫特 , 劳伦特·奥尔索 , 马克·贝勒马尔 :
k-CNF布尔函数的在线学习。 国际JCAI 2015 : 3865-3873 2014 [注2] 劳伦特·奥尔索 :
通用知识搜索代理。 西奥。 计算。 科学。 519 : 127-139 ( 2014 ) [第11条] 劳伦特·奥尔索 :
多时隙框架:多个可复制AI的形式化模型。 AGI公司 2014 : 97-108 [第10条] 劳伦特·奥尔索 :
传送通用智能代理。 AGI公司 2014 : 109-120 [电子1] 戈泽尔 , 劳伦特·奥尔索 , 哈维尔·斯奈德 :
2014年8月1日至4日,加拿大魁北克省魁北克市,第七届人工智能国际会议,AGI 2014。 诉讼程序。 计算机科学课堂讲稿 8598, 施普林格 2014 ,国际标准图书编号 978-3-319-09273-7 [目录] 2013 [j1] 劳伦特·奥尔索 :
具有可计算时域函数的通用代理的渐近不可学习性。 西奥。 计算。 科学。 473 : 149-156 ( 2013 ) 【c9】 劳伦特·奥尔索 , 托拉蒂莫尔 , 马库斯·哈特 :
用于随机环境的通用知识搜索代理。 中高音 2013 : 158-172 [i1] 彼得·奥尔 , 马库斯·赫特 , 劳伦特·奥尔索 :
强化学习(达格斯图尔研讨会13321)。 达格斯图尔报告 三 ( 8 ) : 1-26 ( 2013 ) 2012 【c8】 劳伦特·奥尔索 , 标记B.环 :
时空嵌入式智能。 AGI公司 2012 : 209-218 【c7】 劳伦特·奥尔索 , 标记B.环 :
智能代理的内存问题。 AGI公司 2012 : 219-231 2011 【c6】 劳伦特·奥尔索 , 标记B.环 :
人工药物中的自我修饰和死亡率。 AGI公司 2011 : 1-10 [c5] 标记B.环 , 劳伦特·奥尔索 :
错觉、生存和智能代理。 AGI公司 2011 : 11-20 【c4】 劳伦特·奥尔索 :
通用知识搜索代理。 中高音 2011 : 353-367 2010 【c3】 劳伦特·奥尔索 :
具有静态先验的通用贪婪代理的最优性问题。 中高音 2010 : 345-359
2000 – 2009
2007 【b1】 劳伦特·奥尔索 :
模拟算法:附加信息增加序列。 (算法模拟:序列的在线增量学习)。 法国雷恩第一大学, 2007 【c2】 劳伦特·奥尔索 :
通过模拟思考学习计数。 国际JCAI 2007 : 1005-1010 2005 【c1】 劳伦特·奥尔索 :
短期记忆和强迫知识的再利用以实现泛化。 伊康(2) 2005 : 39-44