dblp:Laurent Orseau（劳伦特·奥尔索）

dblp:Laurent Orseau（劳伦特·奥尔索） https://dblp.org/pid/79/1040.html dblp个人页面RSS提要 2024年4月25日星期四01:11:02+0200 en-美国每日的 1 根据CC0 1.0许可证发布 dblp@dagstuhl.de（dblp团队） dblp@dagstuhl.de（dblp团队）计算机/计算机科学/出版物/书目 http://www.rssboard.org/rss-specification网站 https://dblp.org/img/logo.144x51.png网址资料来源：Laurent Orseauhttps://dblp.org/pid/79/1040.html14451 学习通用预测工具。https://doi.org/10.44850/arXiv.2401.144953乔迪·格拉乌·莫亚,蒂姆·吉纳温,马库斯·赫特,劳伦特·奥尔索,格雷戈伊尔·德雷唐（Grégoire Delétang）,埃利奥特·卡特,阿尼安·鲁斯,李凯文文亮,克里斯托弗·马特恩,马修·艾奇森,乔尔·维内斯:
学习通用预测工具。 CoRR公司 abs/2401.14953(2024)]]>https://dblp.org/rec/journals/corr/abs-2401-149532024年1月1日星期一00:00:00+0100 基于非平稳分布的记忆元学习。https://proceedings.mlr.press/v202/genewein23a.html蒂姆·吉纳温,格雷戈伊尔·德雷唐（Grégoire Delétang）,阿尼安·鲁斯,李凯文文亮,埃利奥特·卡特,文森特·杜托多尔,乔迪·格劳·莫亚,劳伦特·奥尔索,马库斯·赫特,乔尔·维内斯:
基于非平稳分布的记忆元学习。 ICML公司 2023:11173-11195]]>https://dblp.org/rec/conf/icml/GeneweinDRWCDGO232023年1月1日，星期日00:00:00+0100 基于上下文模型的莱文树搜索。https://doi.org/10.24963/ijcai.2023/624劳伦特·奥尔索,马库斯·赫特,列维·H·S·莱利斯:
基于上下文模型的莱文树搜索。国际JCAI 2023:5622-5630]]>https://dblp.org/rec/conf/ijcai/OrseauHL232023年1月1日，星期日00:00:00+0100 基于非平稳分布的记忆元学习。https://doi.org/10.48550/arXiv.2302.03067蒂姆·吉纳温,格雷戈伊尔·德雷唐（Grégoire Delétang）,阿尼安·鲁斯,李凯文文亮,埃利奥特·卡特,文森特·杜托多尔,乔迪·格拉乌·莫亚,劳伦特·奥尔索,马库斯·赫特,乔尔·维内斯:
基于非平稳分布的记忆元学习。 CoRR公司 abs/2302.03067(2023)]]>https://dblp.org/rec/journals/corr/abs-2302-030672023年1月1日，星期日00:00:00+0100 基于上下文模型的莱文树搜索。https://doi.org/10.48550/arXiv.2305.16945劳伦特·奥尔索,马库斯·赫特,列维·H·S·莱利斯:
基于上下文模型的莱文树搜索。 CoRR公司 abs/2305.16945(2023)]]>https://dblp.org/rec/journals/corr/abs-2305-169452023年1月1日星期日00:00:00+0100 凸极小化的线搜索。https://doi.org/10.48550/arXiv.2307.16560劳伦特·奥尔索,马库斯·赫特:
凸极小化的线搜索。 CoRR公司 abs/2307.16560(2023)]]>https://dblp.org/rec/journals/corr/abs-2307-165602023年1月1日，星期日00:00:00+0100 语言建模是压缩。https://doi.org/10.48550/arXiv.2309.10668格雷戈伊尔·德雷唐（Grégoire Delétang）,阿尼安·鲁斯,保尔·安布罗斯·杜昆,埃利奥特·卡特,蒂姆·吉纳温,克里斯托弗·马特恩,乔迪·格拉乌·莫亚,李凯文文亮,马修·艾奇森,劳伦特·奥尔索,马库斯·赫特,乔尔·维内斯:
语言建模是压缩。 CoRR公司 abs/2309.10668(2023)]]>https://dblp.org/rec/journals/corr/abs-2309-106682023年1月1日，星期日00:00:00+0100 使用AlphaZero和Tabu搜索寻找越来越大的极值图。https://doi.org/10.48550/arXiv.2311.03583阿巴斯·迈赫拉比安,安基特·阿南德,Hyunjik Kim先生,尼古拉斯·桑纳雷特,马特杰·巴洛格,Gheorghe Comanici公司,都铎·贝拉鲁,安德鲁李,阿尼安·鲁斯,安娜·布拉诺娃,丹尼尔·富山,山姆·布莱克威尔,贝纳迪诺·罗梅拉-佩雷斯,彼得·维利科维奇,劳伦特·奥尔索,Joonkyung Lee（李俊京）,Anurag Murty Naredla公司,Doina Precup公司,亚当·兹索尔·瓦格纳:
使用AlphaZero和Tabu搜索查找越来越大的极值图。 CoRR公司腹肌/2311.03583(2023)]]>https://dblp.org/rec/journals/corr/abs-2311-035832023年1月1日，星期日00:00:00+0100 使用增量学习和后视经验回放证明定理。https://proceedings.mlr.press/v162/aygun22a.html埃塞尔·艾根,安基特·阿南德,劳伦特·奥尔索,泽维尔·格洛洛特

,斯蒂芬·马库斯·麦卡勒,弗拉德·菲鲁,Lei M.Zhang（张磊）,Doina Precup公司,希布尔·穆拉德:
使用增量学习和后视经验回放证明定理。 ICML公司 2022:1198-1210]]>https://dblp.org/rec/conf/icml/AygunAOGMFZPM222022年1月1日星期六00:00:00+0100 有保障的政策引导启发式搜索。https://doi.org/10.1609/aaai.v35i14.17469劳伦特·奥尔索,列维·H·S·莱利斯:
有保障的政策引导启发式搜索。 AAAI公司 2021:12382-12390]]>https://dblp.org/rec/conf/aaai/OrseauL212021年1月1日，星期五00:00:00+0100 从合成数据训练一阶定理证明者。https://arxiv.org/abs/20103.03798弗拉德·菲鲁,埃塞尔·艾根,安基特·阿南德,扎法拉利·艾哈迈德,泽维尔·格洛洛特,劳伦特·奥尔索,Lei M.Zhang（张磊）,Doina Precup公司,希布尔·穆拉德:
从合成数据训练一阶定理证明者。 CoRR公司 abs/2103.03798(2021)]]>https://dblp.org/rec/journals/corr/abs-2103-037982021年1月1日星期五00:00:00+0100 有保障的政策引导启发式搜索。https://arxiv.org/abs/203.11505劳伦特·奥尔索,列维·H·S·莱利斯:
有保障的政策引导启发式搜索。 CoRR公司 abs/2103.11505(2021)]]>https://dblp.org/rec/journals/corr/abs-2103-115052021年1月1日，星期五00:00:00+0100 使用增量学习和后视经验回放证明定理。https://arxiv.org/abs/2112.10664埃塞尔·艾根,劳伦特·奥尔索,安基特·阿南德,泽维尔·格洛洛特,弗拉德·菲鲁,Lei M.Zhang（张磊）,Doina Precup公司,希布尔·穆拉德:
使用增量学习和后视经验回放证明定理。 CoRR公司 abs/2112.10664(2021)]]>https://dblp.org/rec/journals/corr/abs-2112-106642021年1月1日，星期五00:00:00+0100 与应用程序保持一致，实现无标度在线学习。https://arxiv.org/abs/2112.14586劳伦特·奥尔索,马库斯·赫特:
与应用程序保持一致，实现无标度在线学习。 CoRR公司 abs/2112.14586(2021)]]>https://dblp.org/rec/journals/corr/abs-2112-145862021年1月1日星期五00:00:00+0100 在线学习奖励功能的陷阱。https://doi.org/10.24963/ijcai.2020/221斯图尔特·阿姆斯特朗,简·雷克,劳伦特·奥尔索,谢恩·莱格:
在线学习奖励功能的陷阱。国际JCAI 2020:1592-1600]]>https://dblp.org/rec/conf/ijcai/ArmstrongLOL202020年1月1日，星期三00:00:00+0100 通过考虑未来任务避免副作用。https://proceedings.neurips.cc/paper/2020/hash/dc1913d422398c25c5f0b81cab94cc87-Abstract.html维多利亚·克拉科夫纳,劳伦特·奥尔索,理查德·恩戈（Richard Ngo）,Miljan Martic公司,谢恩·莱格:
通过考虑未来任务避免副作用。 NeurIPS公司 2020]]>https://dblp.org/rec/conf/nips/KrakovnaONML202020年1月1日，星期三00:00:00+0100 对数修剪就是你所需要的。https://proceedings.neurips.cc/paper/2020/hash/1e9491470749d5b0e361ce4f0b24d037-Abstract.html劳伦特·奥尔索,马库斯·赫特,奥马尔·里瓦斯普拉塔:
对数修剪就是你所需要的。 NeurIPS公司 2020]]>https://dblp.org/rec/conf/nips/OrseauHR202020年1月1日，星期三00:00:00+0100 在线学习奖励功能的陷阱。https://arxiv.org/abs/2004.13654斯图尔特·阿姆斯特朗,简·雷克,劳伦特·奥尔索,谢恩·莱格:
在线学习奖励功能的陷阱。 CoRR公司 abs/2004.13654(2020)]]>https://dblp.org/rec/journals/corr/abs-2004-136542020年1月1日星期三00:00:00+0100 学习从合成定理证明。https://arxiv.org/abs/2006.11259埃塞尔·艾根,扎法拉利·艾哈迈德,安基特·阿南德,弗拉德·菲鲁,泽维尔·格洛洛特,劳伦特·奥尔索,Doina预备,希布尔·穆拉德:
学习从合成定理证明。 CoRR公司 abs/2006.11259(2020)]]>https://dblp.org/rec/journals/corr/abs-2006-112592020年1月1日，星期三00:00:00+0100 对数修剪就是你所需要的。https://arxiv.org/abs/2006.12156劳伦特·奥尔索,马库斯·赫特,奥马尔·里瓦斯普拉塔:
对数修剪就是你所需要的。 CoRR公司 abs/2006.12156(2020)]]>https://dblp.org/rec/journals/corr/abs-2006-121562020年1月1日星期三00:00:00+0100 通过考虑未来任务避免副作用。https://arxiv.org/abs/2010.07877维多利亚·克拉科夫纳,劳伦特·奥尔索,理查德·恩戈（Richard Ngo）,Miljan Martic公司,谢恩·莱格:
通过考虑未来任务避免副作用。 CoRR公司 abs/2010.07877(2020)]]>https://dblp.org/rec/journals/corr/abs-2010-078772020年1月1日，星期三00:00:00+0100 无模型规划研究。http://proceedings.mlr.press/v97/guez19a.html亚瑟·盖兹,梅赫迪·米尔扎,卡罗尔·格雷戈,里沙布·卡布拉,塞巴斯蒂安·拉卡尼埃,西奥芬妮·韦伯,大卫·拉波索,亚当·桑托罗,劳伦特·奥尔索,汤姆·埃克尔斯,格雷格·韦恩,大卫·西尔弗,蒂莫西·利利克拉普:
无模型规划研究。 ICML公司 2019:2464-2473]]>https://dblp.org/rec/conf/icml/GuezMGKRWRSOEWS192019年1月1日，星期二00:00:00+0100 迭代预算指数搜索。https://doi.org/10.24963/ijcai.2019/174马尔特·赫尔默特,托拉蒂莫尔,列维·H·S·莱利斯,劳伦特·奥尔索,内森·斯特凡特:
迭代预算指数搜索。国际JCAI 2019:1249-1257]]>https://dblp.org/rec/conf/ijcai/HelmertLLOS192019年1月1日星期二00:00:00+0100 使用逐步相对可达性惩罚副作用。https://ceur-ws.org/Vol-2419/paper_1.pdf维多利亚·克拉科夫纳,劳伦特·奥尔索,Miljan Martic公司,谢恩·莱格:
使用逐步相对可达性惩罚副作用。 AIS安全@IJCAI 2019]]>https://dblp.org/rec/conf/ijcai/KrakovnaOML192019年1月1日星期二00:00:00+0100 软贝叶斯（Soft-Bayes）：为具有对数损失的专家组合设计。http://arxiv.org/abs/1901.02230劳伦特·奥尔索,托拉蒂莫尔,谢恩·莱格:
软贝叶斯（Soft-Bayes）：为具有对数损失的专家组合设计。 CoRR公司 abs/1901.02230(2019)]]>https://dblp.org/rec/journals/corr/abs-1901-022302019年1月1日星期二00:00:00+0100 无模型规划研究。http://arxiv.org/abs/1901.03559阿瑟·盖兹,迈赫迪·米尔扎,卡罗尔·格雷戈,里沙布·卡布拉,塞巴斯蒂安·拉卡尼埃,塞奥帕恩·韦伯（Théophane Weber）,大卫·拉波索,亚当·桑托罗,劳伦特·奥尔索,汤姆·埃克尔斯,格雷格·韦恩,大卫·西尔弗,蒂莫西·利利克拉普:
无模型规划研究。 CoRR公司 abs/1901.03559(2019)]]>https://dblp.org/rec/journals/corr/abs-1901-035592019年1月1日星期二00:00:00+0100 小心缩放：保证节点扩展的线性内存启发式搜索。http://arxiv.org/abs/1906.03242劳伦特·奥尔索,列维·H·S·莱利斯,托拉蒂莫尔:
小心缩放：保证节点扩展的线性内存启发式搜索。 CoRR公司 abs/1906.03242(2019)]]>https://dblp.org/rec/journals/corr/abs-1906-032422019年1月1日星期二00:00:00+0100 迭代预算指数搜索。http://arxiv.org/abs/1907.13062马尔特·赫尔默特,托拉蒂莫尔,列维·H·S·莱利斯,劳伦特·奥尔索,内森·斯特凡特:
迭代预算指数搜索。 CoRR公司 abs/1907.13062(2019)]]>https://dblp.org/rec/journals/corr/abs-1907-130622019年1月1日星期二00:00:00+0100 具有担保的单代理策略树搜索。https://proceedings.neurips.cc/paper/2018/hash/52c5189391854c93e8a0e1326e56c14f-Abstract.html劳伦特·奥尔索,列维·莱利斯,托拉蒂莫尔,西奥芬·韦伯:
具有担保的单代理策略树搜索。 NeurIPS公司 2018:3205-3215]]>https://dblp.org/rec/conf/nips/OrseauLLW182018年1月1日星期一00:00:00+0100 代理和设备：代理的相对定义。http://arxiv.org/abs/1805.12387劳伦特·奥尔索,西蒙·麦格雷戈·麦吉尔,谢恩·莱格:
代理和设备：代理的相对定义。 CoRR公司 abs/1805.12387(2018)]]>https://dblp.org/rec/journals/corr/abs-1805-123872018年1月1日星期一00:00:00+0100 使用相对可达性测量和避免副作用。http://arxiv.org/abs/1806.01186维多利亚·克拉科夫纳,劳伦特·奥尔索,米尔扬·马蒂奇,谢恩·莱格:
使用相对可达性测量和避免副作用。 CoRR公司 abs/1806.01186(2018)]]>https://dblp.org/rec/journals/corr/abs-1806-011862018年1月1日星期一00:00:00+0100 具有担保的单代理策略树搜索。http://arxiv.org/abs/1811.10928劳伦特·奥尔索,列维·H·S·莱利斯,托拉蒂莫尔,塞奥帕恩·韦伯（Théophane Weber）:
具有担保的单代理策略树搜索。 CoRR公司 abs/1811.10928(2018)]]>https://dblp.org/rec/journals/corr/abs-1811-109282018年1月1日星期一00:00:00+0100 软贝叶斯（Soft-Bayes）：为具有对数损失的专家组合设计。http://proceedings.mlr.press/v76/orseu17a.html劳伦特·奥尔索,托拉蒂莫尔,谢恩·莱格:
软贝叶斯（Soft-Bayes）：为具有对数损失的专家组合设计。中高音 2017:372-399]]>https://dblp.org/rec/conf/alt/OrseauLL172017年1月1日，星期日00:00:00+0100 通过腐败的奖励渠道强化学习。https://doi.org/10.24963/ijcai.2017/656汤姆·艾唯瑞特,维多利亚·克拉科夫纳,劳伦特·奥尔索,谢恩·莱格:
通过腐败的奖励渠道强化学习。国际JCAI 2017:4705-4713]]>https://dblp.org/rec/conf/ijcai/EverittKOL172017年1月1日，星期日00:00:00+0100 关于汤普森抽样和渐近最优性。https://doi.org/10.24963/ijcai.2017/688简·雷克,托拉蒂莫尔,劳伦特·奥尔索,马库斯·赫特:
关于汤普森抽样和渐近最优性。国际JCAI 2017:4889-4893]]>https://dblp.org/rec/conf/ijcai/LeikeLOH172017年1月1日星期日00:00:00+0100 通过腐败的奖励渠道强化学习。http://arxiv.org/abs/1705.08417汤姆·艾唯瑞特

,维多利亚·克拉科夫纳,劳伦特·奥尔索,马库斯·赫特,谢恩·莱格:
通过腐败的奖励渠道强化学习。 CoRR公司 abs/1705.08417(2017)]]>https://dblp.org/rec/journals/corr/EverittKOHL172017年1月1日，星期日00:00:00+0100 AI安全网格世界。网址：http://arxiv.org/abs/1111.09883简·雷克,Miljan Martic公司,维多利亚·克拉科夫纳,佩德罗·奥尔特加,汤姆·艾唯瑞特,安德鲁·勒弗朗克,劳伦特·奥尔索,谢恩·莱格:
AI安全网格世界。 CoRR公司 abs/1711.09883(2017)]]>https://dblp.org/rec/journals/corr/abs-1711-098832017年1月1日，星期日00:00:00+0100 汤普森抽样在一般环境下是渐近最优的。http://auai.org/uai2016/proceedings/papers/20.pdf简·雷克,托拉蒂莫尔,劳伦特·奥尔索,马库斯·赫特:
汤普森抽样在一般环境下是渐近最优的。阿联酋 2016]]>https://dblp.org/rec/conf/uai/LeikeLOH162016年1月1日，星期五00:00:00+0100 安全可中断代理。http://auai.org/uai2016/proceedings/papers/68.pdf劳伦特·奥尔索,斯图尔特·阿姆斯特朗:
安全可中断代理。阿联酋 2016]]>https://dblp.org/rec/conf/uai/OrseauA162016年1月1日，星期五00:00:00+0100 汤普森抽样在一般环境下是渐近最优的。http://arxiv.org/abs/1602.07905简·雷克,托拉蒂莫尔,劳伦特·奥尔索,马库斯·赫特:
汤普森抽样在一般环境下是渐近最优的。 CoRR公司 abs/1602.07905(2016)]]>https://dblp.org/rec/journals/corr/LeikeLOH162016年1月1日，星期五00:00:00+0100 k-CNF布尔函数的在线学习。http://ijcai.org/Abstract/15/543乔尔·维内斯,马库斯·赫特,劳伦特·奥尔索,马克·贝勒马尔:
k-CNF布尔函数的在线学习。国际JCAI 2015:3865-3873]]>https://dblp.org/rec/conf/ijcai/WenessHOB15网址2015年1月1日星期四00:00:00+0100 通用知识搜索代理。https://doi.org/10.1016/j.tcs.2013.09.025劳伦特·奥尔索:
通用知识搜索代理。西奥。计算。科学。 519:127-139(2014)]]>https://dblp.org/rec/journals/tcs/Orseau142014年1月1日星期三00:00:00+0100 多时隙框架：多个可复制AI的形式化模型。https://doi.org/10.1007/978-3-319-09274-4_10劳伦特·奥尔索:
多时隙框架：多个可复制AI的形式化模型。 AGI公司 2014:97-108]]>https://dblp.org/rec/conf/agi/Orseau142014年1月1日星期三00:00:00+0100 电信通用智能代理。https://doi.org/10.1007/978-3-319-09274-4_11劳伦特·奥尔索:
传送通用智能代理。 AGI公司 2014:109-120]]>https://dblp.org/rec/conf/agi/Orseau14a2014年1月1日星期三00:00:00+0100 2014年8月1日至4日，加拿大魁北克省魁北克市，第七届人工智能国际会议，AGI 2014。诉讼程序。https://doi.org/10.1007/978-3-319-09274-4戈泽尔,劳伦特·奥尔索,哈维尔·斯奈德:
2014年8月1日至4日，加拿大魁北克省魁北克市，第七届人工智能国际会议，AGI 2014。诉讼程序。计算机科学课堂讲稿8598中，施普林格 2014，国际标准图书编号978-3-319-09273-7 [目录]]]>https://dblp.org/rec/conf/agi/20142014年1月1日星期三00:00:00+0100 具有可计算时域函数的通用代理的渐近不可学习性。https://doi.org/10.1016/j.tcs.2012.10.014劳伦特·奥尔索:
具有可计算时域函数的通用代理的渐近不可学习性。西奥。计算。科学。 473:149-156(2013)]]>https://dblp.org/rec/journals/tcs/Orseau132013年1月1日星期二00:00:00+0100 用于随机环境的通用知识搜索代理。https://doi.org/10.1007/978-3-642-40935-6_12劳伦特·奥尔索,托拉蒂莫尔,马库斯·赫特

:
用于随机环境的通用知识搜索代理。中高音 2013:158-172]]>https://dblp.org/rec/conf/alt/OrseauLH132013年1月1日星期二00:00:00+0100 强化学习（Dagstuhl研讨会13321）。https://doi.org/10.4230/DagRep.3.8.1彼得·奥尔,马库斯·赫特

,劳伦特·奥尔索:
强化学习（达格斯图尔研讨会13321）。达格斯图尔报告三(8):1-26(2013)]]>https://dblp.org/rec/journals/dagstuhl-reports/AuerHO132013年1月1日星期二00:00:00+0100 时空嵌入式智能。https://doi.org/10.1007/978-3-642-35506-6_22劳伦特·奥尔索,标记B.环:
时空嵌入式智能。 AGI公司 2012:209-218]]>https://dblp.org/rec/conf/agi/OrseauR122012年1月1日，星期日00:00:00+0100 智能代理的内存问题。https://doi.org/10.1007/978-3-642-35506-6_23劳伦特·奥尔索,标记B.环:
智能代理的内存问题。 AGI公司 2012:219-231]]>https://dblp.org/rec/conf/agi/OrseauR12a2012年1月1日，星期日00:00:00+0100 人工药物中的自我修饰和死亡率。https://doi.org/10.1007/978-3-642-22887-2_1劳伦特·奥尔索,标记B.环:
人工智能体的自我修饰与死亡。 AGI公司 2011:1-10]]>https://dblp.org/rec/conf/agi/OrseauR112011年1月1日星期六00:00:00+0100 错觉、生存和智能代理。https://doi.org/10.1007/978-3-642-22887-2_2标记B.环,劳伦特·奥尔索:
错觉、生存和智能代理。 AGI公司 2011:11月20日]]>https://dblp.org/rec/conf/agi/RingO112011年1月1日星期六00:00:00+0100 通用知识搜索代理。https://doi.org/10.1007/978-3-642-24412-4_28劳伦特·奥尔索:
通用知识搜索代理。中高音 2011:353-367]]>https://dblp.org/rec/conf/alt/Orseau112011年1月1日星期六00:00:00+0100 具有静态先验的通用贪婪代理的最优性问题。https://doi.org/10.1007/978-3-642-16108-7_28劳伦特·奥尔索:
具有静态先验的通用贪婪代理的最优性问题。中高音 2010:345-359]]>https://dblp.org/rec/conf/alt/Orseau10网址2010年1月1日，星期五00:00:00+0100 模拟算法：附加信息增加序列。（算法模拟：序列的在线增量学习）。https://hal.archives-ouvertes.fr/tel-0282025劳伦特·奥尔索:
模拟算法：附加信息增加序列。（算法模拟：序列的在线增量学习）。法国雷恩1大学，2007]]>https://dblp.org/rec/phd/hal/Orseau072007年1月1日星期一00:00:00+0100 通过模拟思考学习计数。http://ijcai.org/Processings/07/Papers/162.pdf劳伦特·奥尔索:
通过模拟思考学习计数。国际JCAI 2007:1005-1010]]>https://dblp.org/rec/conf/ijcai/Orseau07网址2007年1月1日星期一00:00:00+0100 短期记忆和强迫知识的再利用以实现泛化。https://doi.org/10.1007/11550907_7劳伦特·奥尔索:
短期记忆和强迫知识的再利用以实现泛化。 ICANN（2） 2005:39至44]]>https://dblp.org/rec/conf/icann/Orseau052005年1月1日星期六00:00:00+0100