乔尔·维内斯
人员信息
SPARQL查询
优化列表
书籍和论文
2011 【b1】 乔尔·维内斯 :
近似通用的人工智能和游戏自学。 澳大利亚悉尼新南威尔士大学, 2011
期刊文章
2018 【j4】 马洛斯·马查多 , 马克·贝勒马尔 , 埃里克·塔尔维蒂 , 乔尔·维内斯 , 马修·霍斯克内克 , 迈克尔·鲍林 :
重温街机学习环境:普通代理的评估协议和开放问题。 J.阿蒂夫。 智力。 物件。 61 : 523-562 ( 2018 ) 2015 [j3] 沃洛德米尔·姆尼赫 , Koray Kavukcuoglu公司 , 大卫·西尔弗 , 安德烈·鲁苏 , 乔尔·维内斯 , 马克·贝勒马尔 , 亚历克斯·格拉夫斯 , 马丁·里德米勒 , 安德烈亚斯·菲德杰兰 , 乔治·奥斯特罗夫斯基 , 斯蒂格·彼得森 , 查尔斯·比蒂 , 阿米尔·萨迪克 , Ioannis Antonoglou公司 , 海伦·金 , 达山库马兰 , Daan Wierstra公司 , 谢恩·莱格 , 哈萨比斯 :
通过深度强化学习进行人性化控制。 国家。 518 ( 7540 ) : 529-533 ( 2015 ) 2013 [注2] 马克·贝勒马尔 , 雅瓦·纳达夫 , 乔尔·维内斯 , 迈克尔·鲍林 :
街机学习环境:通用代理的评估平台。 J.阿蒂夫。 智力。 物件。 47 : 253-279 ( 2013 ) 2011 [j1] 乔尔·维内斯 , Kee Siong Ng先生 , 马库斯·赫特 , 威廉·T·B·乌瑟尔 , 大卫·西尔弗 :
蒙特卡罗AIXI近似。 J.阿蒂夫。 智力。 物件。 40 : 95-142 ( 2011 )
会议和研讨会文件
2024 [公元30年] 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 保尔·安布罗斯·杜昆 , 埃利奥特·卡特 , 蒂姆·吉纳温 , 克里斯托弗·马特恩 , 乔迪·格拉乌·莫亚 , 李凯文文亮 , 马修·艾奇森 , 劳伦特·奥尔索 , 马库斯·赫特 , 乔尔·维内斯 :
语言建模是压缩。 ICLR公司 2024 [公元29年] 乔迪·格拉乌·莫亚 , 蒂姆·吉纳温 , 马库斯·赫特 , 劳伦特·奥尔索 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 埃利奥特·卡特 , 阿尼安·鲁斯 , 李凯文文亮 , 克里斯托弗·马特恩 , 马修·艾奇森 , 乔尔·维内斯 :
学习通用预测工具。 ICML公司 2024 2023 [公元28年] 阿尼安·鲁斯 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 蒂姆·吉纳温 , 乔迪·格拉乌·莫亚 , 罗贝尔·索尔达斯 , 本纳尼 , 谢恩·莱格 , 乔尔·维内斯 :
随机位置编码促进了变压器的长度泛化。 ACL(2) 2023 : 1889-1903 [公元27年] 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 乔迪·格拉乌·莫亚 , 蒂姆·吉纳温 , 李凯文文亮 , 埃利奥特·卡特 , 克里斯·库迪 , 马库斯·赫特 , 谢恩·莱格 , 乔尔·维内斯 , 佩德罗·奥尔特加 :
神经网络和乔姆斯基层次结构。 ICLR公司 2023 [公元26年] 蒂姆·吉纳温 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 李凯文文亮 , 埃利奥特·卡特 , 文森特·杜托多尔 , 乔迪·格拉乌·莫亚 , 劳伦特·奥尔索 , 马库斯·赫特 , 乔尔·维内斯 :
基于非平稳分布的记忆元学习。 ICML公司 2023 : 11173-11195 [公元25年] 埃利奥特·卡特 , 乔迪·格拉乌·莫亚 , 马库斯·赫特 , 马修·艾奇森 , 蒂姆·吉纳温 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 李凯文(Kevin Li) , 乔尔·维内斯 :
自我预测通用人工智能。 NeurIPS公司 2023 2022 [公元24年] 埃利奥特·卡特 , 马库斯·赫特 , 乔尔·维内斯 :
信息理论驱动下的强化学习。 AGI公司 2022 : 188-198 2021 [c23] 乔尔·维内斯 , 托拉蒂莫尔 , 大卫·布登 , 阿维什卡尔·博普昌德 , 克里斯托弗·马特恩 , 阿格尼什卡·格拉布斯卡·巴文斯卡 , 埃伦·塞泽纳 , 王建安 , 彼得·托斯 , 西蒙·施密特 , 马库斯·赫特 :
门控线性网络。 AAAI公司 2021 : 10015-10023 2020 [公元22年] 大卫·布登 , 亚当·H·大理石 , 埃伦·塞泽纳 , 托拉蒂莫尔 , 格雷戈里·韦恩 , 乔尔·维内斯 :
高斯门线性网络。 NeurIPS公司 2020 【c21】 埃伦·塞泽纳 , 马库斯·赫特 , 大卫·布登 , 王建安 , 乔尔·维内斯 :
使用门控线性网络在上下文强盗中进行在线学习。 NeurIPS公司 2020 [公元20年] 王建安 , 埃伦·塞泽纳 , 大卫·布登 , 马库斯·赫特 , 乔尔·维内斯 :
转移学习的组合观。 NeurIPS公司 2020 2018 [第19条] 马洛斯·马查多 , 马克·贝勒马尔 , 埃里克·塔尔维蒂 , 乔尔·维内斯 , 马修·霍斯克内克 , 迈克尔·鲍林 :
重温街机学习环境:通用代理的评估协议和开放问题(扩展摘要)。 国际JCAI 2018 : 5573-5577 2016 [第18条] 基兰米兰 , 乔尔·维内斯 , 詹姆斯·柯克帕特里克 , 迈克尔·H·鲍林 , 安娜·库普 , 哈萨比斯 :
勿忘我的过程。 NIPS公司 2016 : 3702-3710 2015 [第17条] 乔尔·维内斯 , 马克·贝勒马尔 , 马库斯·赫特 , 阿尔文·蔡 , 纪尧姆·德斯贾丁斯 :
压缩和控制。 AAAI公司 2015 : 3016-3023 [第16条] 乔尔·维内斯 , 马库斯·赫特 , 劳伦特·奥尔索 , 马克·贝勒马尔 :
k-CNF布尔函数的在线学习。 国际JCAI 2015 : 3865-3873 [第15条] 马克·贝勒马尔 , 雅瓦·纳达夫 , 乔尔·维内斯 , 迈克尔·鲍林 :
街机学习环境:通用代理评估平台(扩展摘要)。 国际JCAI 2015 : 4148-4152 2014 [第14条] 马克·贝勒马尔 , 乔尔·维内斯 , 埃里克·塔尔维蒂 :
跳过上下文树切换。 ICML公司 2014 : 1458-1466 2013 [第13条] 乔尔·维内斯 , 马莎怀特 , 迈克尔·鲍林 , 安德烈斯·吉尔吉 :
分区树权重。 DCC公司 2013 : 321-330 [第12条] 马克·贝勒马尔 , 乔尔·维内斯 , 迈克尔·鲍林 :
递归因子环境的贝叶斯学习。 ICML(3) 2013 : 1211-1219 [第11条] 马克·兰科特 , 阿卜杜拉·萨菲丁 , 乔尔·维内斯 , 克里斯托弗·阿奇博尔德 , 马克·H·M·温兰德斯 :
蒙特卡洛*-Minimax搜索。 国际JCAI 2013 : 580-586 2012 [c10] 马克·贝勒马尔 , 乔尔·维内斯 , 迈克尔·鲍林 :
使用Atari 2600游戏调查应急意识。 AAAI公司 2012 : 864-871 【c9】 乔尔·维内斯 , 彼得·苏尼哈格 , 马库斯·赫特 :
关于AIXI逼近的集合技术。 AGI公司 2012 : 341-351 【c8】 乔尔·维内斯 , Kee Siong Ng先生 , 马库斯·赫特 , 迈克尔·H·鲍林 :
上下文树切换。 DCC公司 2012 : 327-336 【c7】 马克·贝勒马尔 , 乔尔·维内斯 , 迈克尔·鲍林 :
基于草图的线性值函数近似。 NIPS公司 2012 : 2222-2230 2011 【c6】 谢恩·莱格 , 乔尔·维内斯 :
通用智能测度的近似值。 算法概率与朋友 2011 : 236-249 【c5】 乔尔·维内斯 , 马克·兰科特 , 迈克尔·H·鲍林 :
蒙特卡罗树搜索中的方差减少。 NIPS公司 2011 : 1836-1844 2010 【c4】 乔尔·维内斯 , Kee Siong Ng先生 , 马库斯·赫特 , 大卫·西尔弗 :
通过AIXI近似进行强化学习。 AAAI公司 2010 : 605-611 【c3】 大卫·西尔弗 , 乔尔·维内斯 :
大型POMDP中的蒙特卡洛规划。 NIPS公司 2010 : 2164-2172 2009 【c2】 乔尔·维内斯 , 大卫·西尔弗 , 威廉·T·B·乌瑟尔 , 阿兰·布莱尔 :
从游戏树搜索引导。 NIPS公司 2009 : 1937-1945 2007 【c1】 乔尔·维内斯 , 阿兰·布莱尔 :
换位表在随机博弈树搜索中的有效应用。 CIG公司 2007 : 112-116
编辑职位
非正式出版物和其他出版物
2024 [i25] 乔迪·格拉乌·莫亚 , 蒂姆·吉纳温 , 马库斯·赫特 , 劳伦特·奥尔索 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 埃利奥特·卡特 , 阿尼安·鲁斯 , 李凯文文亮 , 克里斯托弗·马特恩 , 马修·艾奇森 , 乔尔·维内斯 :
学习通用预测工具。 CoRR公司 abs/2401.14953 ( 2024 ) 2023 【i24】 蒂姆·吉纳温 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 李凯文文亮 , 埃利奥特·卡特 , 文森特·杜托多尔 , 乔迪·格拉乌·莫亚 , 劳伦特·奥尔索 , 马库斯·赫特 , 乔尔·维内斯 :
基于非平稳分布的记忆元学习。 CoRR公司 abs/2302.03067 ( 2023 ) [第23条] 阿尼安·鲁斯 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 蒂姆·吉纳温 , 乔迪·格拉乌·莫亚 , 罗贝尔·索尔达斯 , 本纳尼 , 谢恩·莱格 , 乔尔·维内斯 :
随机位置编码促进了变压器的长度泛化。 CoRR公司 abs/2305.16843 ( 2023 ) [i22] 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 保尔·安布罗斯·杜昆 , 埃利奥特·卡特 , 蒂姆·吉纳温 , 克里斯托弗·马特恩 , 乔迪·格拉乌·莫亚 , 李凯文文亮 , 马修·艾奇森 , 劳伦特·奥尔索 , 马库斯·赫特 , 乔尔·维内斯 :
语言建模是压缩。 CoRR公司 abs/2309.10668 ( 2023 ) 2022 【i21】 乔迪·格拉乌·莫亚 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 马库斯·库内什 , 蒂姆·吉纳温 , 埃利奥特·卡特 , 李凯文(Kevin Li) , 阿尼安·鲁斯 , 克里斯·库迪 , 乔尔·维内斯 , 简·X·王 , 马库斯·赫特 , 克里斯托弗·萨默菲尔德 , 谢恩·莱格 , 佩德罗·奥尔特加 :
超越贝叶斯最优性:元学习你知道你不知道的东西。 CoRR公司 abs/2209.15618 ( 2022 ) 2021 [i20] 埃利奥特·卡特 , 马库斯·赫特 , 乔尔·维内斯 :
信息理论驱动下的强化学习。 CoRR公司 abs/2109.15147 ( 2021 ) [i19] 佩德罗·奥尔特加 , 马库斯·库内什 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 蒂姆·吉纳温 , 乔迪·格拉乌·莫亚 , 乔尔·维内斯 , 乔纳斯·布赫利 , 乔纳斯·迪格雷夫 , 比拉尔·皮奥 , 朱利安·佩罗拉 , 汤姆·艾唯瑞特 , 科伦廷·塔莱克 , 埃米利奥·帕里索托 , 汤姆·埃雷斯 , 陈玉田 , 斯科特·里德 , 马库斯·赫特 , 南多·德·弗雷塔斯 , 谢恩·莱格 :
动摇基础:交互和控制序列模型中的错觉。 CoRR公司 abs/2110.10819 ( 2021 ) 2020 [i18] 埃伦·塞泽纳 , 马库斯·赫特 , 大卫·布登 , 王建安 , 乔尔·维内斯 :
使用门控线性网络在上下文强盗中进行在线学习。 CoRR公司 abs/2002.11611 ( 2020 ) [i17] 大卫·布登 , 亚当·H·大理石 , 埃伦·塞泽纳 , 托拉蒂莫尔 , 格雷格·韦恩 , 乔尔·维内斯 :
高斯门线性网络。 CoRR公司 abs/2006.05964 ( 2020 ) [i16] 王建安 , 埃伦·塞泽纳 , 大卫·布登 , 马库斯·赫特 , 乔尔·维内斯 :
转移学习的组合观。 CoRR公司 abs/2010.12268 ( 2020 ) 2019 【i15】 佩德罗·奥尔特加 , 简·X·王 , 马克·罗兰 , 蒂姆·吉纳温 , 泽布·库思·内尔森 , 拉兹万·帕斯卡努 , 尼古拉斯·希斯 , 乔尔·维内斯 , 亚历山大·普里策 , 巴勃罗·斯普雷希曼 , Siddhant M.Jayakumar先生 , 汤姆·麦格拉思 , 凯文·米勒 , 穆罕默德·盖什拉希·阿扎尔 , 伊恩·奥斯班德 , 尼尔·C·拉比诺维茨 , 安德烈斯·吉尔吉 , 西尔维娅·齐亚帕 , 西蒙·奥斯宾多 , 叶惠德 , 哈多·范·哈塞尔特 , 南多·德·弗雷塔斯 , 马修·博特维尼克 , 谢恩·莱格 :
序列策略的元学习。 CoRR公司 腹肌/1905.03030 ( 2019 ) [第14条] 乔尔·维内斯 , 托拉蒂莫尔 , 阿维什卡尔·博普昌德 , 大卫·布登 , 克里斯托弗·马特恩 , 阿格尼什卡·格拉布斯卡·巴文斯卡 , 彼得·托斯 , 西蒙·施密特 , 马库斯·赫特 :
门控线性网络。 CoRR公司 abs/1910.01526 ( 2019 ) 2017 [i13] 马洛斯·马查多 , 马克·贝勒马尔 , 埃里克·塔尔维蒂 , 乔尔·维内斯 , 马修·霍斯克内克 , 迈克尔·鲍林 :
重温街机学习环境:普通代理的评估协议和开放问题。 CoRR公司 abs/1709.06009 ( 2017 ) [i12] 乔尔·维内斯 , 托拉蒂莫尔 , 阿维什卡尔·博普昌德 , 阿格尼什卡·格拉布斯卡·巴文斯卡 , 克里斯托弗·马特恩 , 彼得·托斯 :
使用门控线性网络进行在线学习。 CoRR公司 腹肌/1712.01897 ( 2017 ) 2016 [i11] 詹姆斯·柯克帕特里克 , 拉兹万·帕斯卡努 , 尼尔·C·拉比诺维茨 , 乔尔·维内斯 , 纪尧姆·德斯贾丁斯 , 安德烈·鲁苏 , 基兰米兰 , 约翰·泉 , 蒂亚戈·拉马略 , 阿格尼什卡·格拉布斯卡·巴文斯卡 , 哈萨比斯 , 克劳迪娅·克洛帕特 , 达山库马兰 , Raia Hadsell公司 :
克服神经网络中的灾难性遗忘。 CoRR公司 abs/1612.00796 ( 2016 ) 2014 [i10] 乔尔·维内斯 , 马库斯·赫特 :
k-CNF布尔函数的在线学习。 CoRR公司 abs/1403.6863 ( 2014 ) [第九章] 乔尔·维内斯 , 马克·贝勒马尔 , 马库斯·赫特 , 阿尔文·蔡 , 纪尧姆·德斯贾丁斯 :
压缩和控制。 CoRR公司 abs/1411.5326 ( 2014 ) 2013 [i8] 马克·兰科特 , 阿卜杜拉·萨菲丁 , 乔尔·维内斯 , 克里斯托弗·阿奇博尔德 , 马克·H·M·温兰德斯 :
蒙特卡洛*-Minimax搜索。 CoRR公司 abs/1304.6057 ( 2013 ) 2012 [i7] 乔尔·维内斯 , 马库斯·赫特 :
稀疏顺序Dirichlet编码。 CoRR公司 abs/1206.3618 ( 2012 ) [i6] 马克·贝勒马尔 , 雅瓦·纳达夫 , 乔尔·维内斯 , 迈克尔·鲍林 :
街机学习环境:通用代理的评估平台。 CoRR公司 腹肌/1207.4708 ( 2012 ) [i5] 乔尔·维内斯 , 马莎怀特 , 迈克尔·鲍林 , 安德烈斯·吉尔吉 :
分区树权重。 CoRR公司 abs/1211.0587 ( 2012 ) 2011 [i4] 谢恩·莱格 , 乔尔·维内斯 :
通用智能测度的近似值。 CoRR公司 abs/1109.5951 ( 2011 ) [i3] 乔尔·维内斯 , Kee Siong Ng先生 , 马库斯·赫特 , 迈克尔·H·鲍林 :
上下文树切换。 CoRR公司 abs/1111.3182 ( 2011 ) 2010 [i2] 乔尔·维内斯 , Kee Siong Ng先生 , 马库斯·赫特 , 大卫·西尔弗 :
通过AIXI近似进行强化学习。 CoRR公司 abs/1007.2049 ( 2010 ) 2009 [i1] 乔尔·维内斯 , Kee Siong Ng先生 , 马库斯·赫特 , 大卫·西尔弗 :
蒙特卡罗AIXI近似。 CoRR公司 abs/0909.0801 ( 2009 )