乔迪·格拉乌·莫亚
人员信息
优化列表
2020年–今天
2024 【i21】 乔迪·格拉乌·莫亚 , 蒂姆·吉纳温 , 马库斯·赫特 , 劳伦特·奥尔索 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 埃利奥特·卡特 , 阿尼安·鲁斯 , 李凯文文亮 , 克里斯托弗·马特恩 , 马修·艾奇森 , 乔尔·维内斯 :
学习通用预测工具。 CoRR公司 abs/2401.14953 ( 2024 ) [i20] 阿尼安·鲁斯 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , Sourabh Medapati公司 , 乔迪·格拉乌·莫亚 , 李凯文文亮 , 埃利奥特·卡特 , 约翰·里德 , 蒂姆·吉纳温 :
大师级无搜索国际象棋。 CoRR公司 abs/2402.04494 ( 2024 ) 2023 [第10条] 阿尼安·鲁斯 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 蒂姆·吉纳温 , 乔迪·格拉乌·莫亚 , 罗贝尔·索尔达斯 , 本纳尼 , 谢恩·莱格 , 乔尔·维内斯 :
随机位置编码增强变压器的长度泛化。 ACL(2) 2023 : 1889-1903 【c9】 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 乔迪·格拉乌·莫亚 , 蒂姆·吉纳温 , 李凯文文亮 , 埃利奥特·卡特 , 克里斯·库迪 , 马库斯·赫特 , 谢恩·莱格 , 乔尔·维内斯 , 佩德罗·奥尔特加 :
神经网络和乔姆斯基层次结构。 ICLR公司 2023 【c8】 蒂姆·吉纳温 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 李凯文文亮 , 埃利奥特·卡特 , 文森特·杜托多尔 , 乔迪·格拉乌·莫亚 , 劳伦特·奥尔索 , 马库斯·赫特 , 乔尔·维内斯 :
基于非平稳分布的记忆元学习。 ICML公司 2023 : 11173-11195 【c7】 埃利奥特·卡特 , 乔迪·格拉乌·莫亚 , 马库斯·赫特 , 马修·艾奇森 , 蒂姆·吉纳温 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 李凯文(Kevin Li) , 乔尔·维内斯 :
自我预测通用人工智能。 NeurIPS公司 2023 [i19] 蒂姆·吉纳温 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 李凯文文亮 , 埃利奥特·卡特 , 文森特·杜托多尔 , 乔迪·格拉乌·莫亚 , 劳伦特·奥尔索 , 马库斯·赫特 , 乔尔·维内斯 :
基于非平稳分布的记忆元学习。 CoRR公司 abs/2302.03067 ( 2023 ) [i18] 阿尼安·鲁斯 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 蒂姆·吉纳温 , 乔迪·格拉乌·莫亚 , 罗贝尔·索尔达斯 , 本纳尼 , 谢恩·莱格 , 乔尔·维内斯 :
随机位置编码促进了变压器的长度泛化。 CoRR公司 abs/2305.16843 ( 2023 ) [i17] 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 保尔·安布罗斯·杜昆 , 埃利奥特·卡特 , 蒂姆·吉纳温 , 克里斯托弗·马特恩 , 乔迪·格拉乌·莫亚 , 李凯文文亮 , 马修·艾奇森 , 劳伦特·奥尔索 , 马库斯·赫特 , 乔尔·维内斯 :
语言建模是压缩。 CoRR公司 abs/2309.10668 ( 2023 ) 2022 [j5] 罗伯·布雷克尔曼斯 , 蒂姆·吉纳温 , 乔迪·格拉乌·莫亚 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 马库斯·库内什 , 谢恩·莱格 , 佩德罗·奥尔特加 :
你的政策规划者是一个秘密的对手。 事务处理。 机器。 学习。 物件。 2022 ( 2022 ) [i16] 罗伯·布雷克尔曼斯 , 蒂姆·吉纳温 , 乔迪·格拉乌·莫亚 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 马库斯·库内什 , 谢恩·莱格 , 佩德罗·奥尔特加 :
你的政策规划者是一个秘密的对手。 CoRR公司 abs/2203.12592 ( 2022 ) 【i15】 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 乔迪·格拉乌·莫亚 , 蒂姆·吉纳温 , 李凯文文亮 , 埃利奥特·卡特 , 马库斯·赫特 , 谢恩·莱格 , 佩德罗·奥尔特加 :
神经网络和乔姆斯基层次结构。 CoRR公司 abs/2207.02098 ( 2022 ) [第14条] 乔迪·格拉乌·莫亚 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 马库斯·库内什 , 蒂姆·吉纳温 , 埃利奥特·卡特 , 李凯文 , 阿尼安·鲁斯 , 克里斯·库迪 , 乔尔·维内斯 , 简·X·王 , 马库斯·赫特 , 克里斯托弗·萨默菲尔德 , 谢恩·莱格 , 佩德罗·奥尔特加 :
超越贝叶斯优化:元学习你知道你不知道的东西。 CoRR公司 腹肌/2209.15618 ( 2022 ) 2021 [i13] 格雷戈伊尔·德雷唐(Grégoire Delétang) , 乔迪·格拉乌·莫亚 , Miljan Martic公司 , 蒂姆·吉纳温 , 汤姆·麦格拉斯 , 弗拉基米尔·米库利克 , 马库斯·库内什 , 谢恩·莱格 , 佩德罗·奥尔特加 :
人工智能安全代理行为的因果分析。 CoRR公司 abs/2103.03938 ( 2021 ) [i12] 约翰·麦克里奥德 , Hrvoje Stojic公司 , 文森特·亚当 , 金东浩(Dongho Kim) , 乔迪·格拉乌·莫亚 , 彼得·弗兰克斯 , 费利克斯·雷布弗里德 :
Bellman:TensorFlow中基于模型的强化学习工具箱。 CoRR公司 abs/2103.14407 ( 2021 ) [i11] 佩德罗·奥尔特加 , 马库斯·库内什 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 蒂姆·吉纳温 , 乔迪·格拉乌·莫亚 , 乔尔·维内斯 , 乔纳斯·布赫利 , 乔纳斯·迪格雷夫 , 比拉尔·皮奥 , 朱利安·佩罗拉 , 汤姆·艾唯瑞特 , 科伦蒂·塔莱克 , 埃米利奥·帕里索托 , 汤姆·埃雷斯 , 陈玉田 , 斯科特·里德 , 马库斯·赫特 , 南多·德·弗雷塔斯 , 谢恩·莱格 :
动摇基础:交互和控制序列模型中的错觉。 CoRR公司 abs/2110.10819 ( 2021 ) [i10] 格雷戈伊尔·德雷唐(Grégoire Delétang) , 乔迪·格拉乌·莫亚 , 马库斯·库内什 , 蒂姆·吉纳温 , 罗伯·布雷克尔曼斯 , 谢恩·莱格 , 佩德罗·奥尔特加 :
无模型风险敏感强化学习。 CoRR公司 abs/2111.02907 ( 2021 )
2010 – 2019
2019 【c6】 费利克斯·雷布弗里德 , 乔迪·格拉乌·莫亚 :
马尔可夫决策过程中的互信息正则化和行为批判性学习。 CoRL公司 2019 : 360-373 【c5】 乔迪·格拉乌·莫亚 , 费利克斯·雷布弗里德 , 彼得·弗兰克斯 :
基于互信息正则化的软Q学习。 ICLR(海报) 2019 【c4】 费利克斯·雷布弗里德 , 塞尔吉奥·帕斯科尔·迪亚兹 , 乔迪·格拉乌·莫亚 :
结合奖励最大化和授权的统一Bellman最优原则。 NeurIPS公司 2019 : 7867-7878 [第九章] Janith C.Petangoda公司 , 塞尔吉奥·帕斯科尔·迪亚兹 , 文森特·亚当 , 彼得·弗兰克斯 , 乔迪·格拉乌·莫亚 :
用于强化学习的分离技能嵌入。 CoRR公司 abs/1906.09223 ( 2019 ) [i8] 费利克斯·雷布弗里德 , 塞尔吉奥·帕斯科尔·迪亚兹 , 乔迪·格拉乌·莫亚 :
结合奖励最大化和授权的统一Bellman最优原则。 CoRR公司 abs/1907.12392 ( 2019 ) [i7] 费利克斯·雷布弗里德 , 乔迪·格拉乌·莫亚 :
马尔可夫决策过程中的互信息正则化和行为批判性学习。 CoRR公司 abs/1909.05950 ( 2019 ) 2018 【j4】 乔迪·格拉乌·莫亚 , 马蒂亚斯·克鲁格 , 丹尼尔·布劳恩 :
变化环境中有界理性决策的非均衡关系。 熵 20 ( 1 ) : 1 ( 2018 ) 【c3】 乔迪·格拉乌·莫亚 , 费利克斯·雷布弗里德 , 海塔姆·布阿马尔 :
用软Q学习平衡双人随机游戏。 国际JCAI 2018 : 268-274 [i6] 乔迪·格拉乌·莫亚 , 费利克斯·雷布弗里德 , 海塔姆·布阿马尔 :
用软Q学习平衡双人随机游戏。 CoRR公司 abs/1802.03216 ( 2018 ) 2017 【b1】 乔迪·格拉乌·莫亚 :
有限理性和模型不确定性下的决策:信息论方法。 德国图宾根大学, 2017 [i5] 费利克斯·雷布弗里德 , 乔迪·格拉乌·莫亚 , 海塔姆·布阿马尔 :
深度强化学习的信息论最优性原理。 CoRR公司 abs/1708.01867 ( 2017 ) 2016 【c2】 乔迪·格拉乌·莫亚 , 费利克斯·雷布弗里德 , 蒂姆·吉纳温 , 丹尼尔·A·布劳恩 :
马尔可夫决策过程中具有信息处理约束和模型不确定性的规划。 ECML/PKDD(2) 2016 : 475-491 [i4] 乔迪·格拉乌·莫亚 , 费利克斯·雷布弗里德 , 蒂姆·吉纳温 , 丹尼尔·布劳恩 :
马尔可夫决策过程中具有信息处理约束和模型不确定性的规划。 CoRR公司 abs/1604.02080 ( 2016 ) 2015 [j3] 蒂姆·吉纳温 , 费利克斯·雷布弗里德 , 乔迪·格拉乌·莫亚 , 丹尼尔·亚历山大·布劳恩 :
有限理性、抽象和层次决策:信息论的最优化原则。 前沿机器人AI 2 : 27 ( 2015 ) [i3] 乔迪·格拉乌·莫亚 , 丹尼尔·布劳恩 :
具有参数先验的自适应信息理论有界理性决策。 CoRR公司 abs/1511.01710 ( 2015 ) 2013 [i2] 乔迪·格拉乌·莫亚 , 丹尼尔·布劳恩 :
变化环境中的有限理性决策。 CoRR公司 abs/1312.6726 ( 2013 ) 2012 [注2] 乔迪·格拉乌·莫亚 , 安东尼奥·邦斯·里韦罗 , 乔迪·加西亚·奥贾尔沃 :
无标度神经元网络中噪声诱导的上/下动力学。 国际法学分会。 混乱 22 ( 7 ) ( 2012 ) [j1] 乔迪·格拉乌·莫亚 , 佩德罗·奥尔特加 , 丹尼尔·布劳恩 :
贝叶斯感觉运动整合的风险敏感性。 公共科学图书馆计算。 生物。 8 ( 9 ) ( 2012 ) 【c1】 佩德罗·奥尔特加 , 乔迪·格拉乌·莫亚 , 蒂姆·吉纳温 , 大卫·巴尔杜齐 , 丹尼尔·布劳恩 :
噪声函数最大变元的非参数共轭先验分布。 NIPS公司 2012 : 2022年3月30日 [i1] 佩德罗·奥尔特加 , 乔迪·格拉乌·莫亚 , 蒂姆·吉纳温 , 大卫·巴尔杜齐 , 丹尼尔·布劳恩 :
噪声函数最大变元的非参数共轭先验分布。 CoRR公司 abs/1206.1898 ( 2012 )