Miljan Martic公司
人员信息
优化列表
2020年–今天
2021 [第九章] 格雷戈雷·德莱唐 , 乔迪·格拉乌·莫亚 , Miljan Martic公司 , 蒂姆·吉纳温 , 汤姆·麦格拉思 , 弗拉基米尔·米库利克 , 马库斯·库内什 , 谢恩·莱格 , 佩德罗·奥尔特加 :
人工智能安全代理行为的因果分析。 CoRR公司 abs/2103.03938 ( 2021 ) 2020 【c4】 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 理查德·恩戈(Richard Ngo) , Miljan Martic公司 , 谢恩·莱格 :
通过考虑未来任务避免副作用。 NeurIPS公司 2020 【c3】 弗拉基米尔·米库利克 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 汤姆·麦格拉思 , 蒂姆·吉纳温 , Miljan Martic公司 , 谢恩·莱格 , 佩德罗·奥尔特加 :
元训练代理实现贝叶斯优化代理。 NeurIPS公司 2020 [i8] 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 理查德·恩戈(Richard Ngo) , Miljan Martic公司 , 谢恩·莱格 :
通过考虑未来任务避免副作用。 CoRR公司 腹肌/2010.07877 ( 2020 ) [i7] 弗拉基米尔·米库利克 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 汤姆·麦格拉思 , 蒂姆·吉纳温 , Miljan Martic公司 , 谢恩·莱格 , 佩德罗·奥尔特加 :
元训练代理实现贝叶斯优化代理。 CoRR公司 abs/2010.11223 ( 2020 ) [i6] 蒂姆·吉纳温 , 汤姆·麦格拉思 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 弗拉基米尔·米库利克 , Miljan Martic公司 , 谢恩·莱格 , 佩德罗·奥尔特加 :
概率树因果推理算法。 CoRR公司 腹肌/2010.12237 ( 2020 )
2010 – 2019
2019 【c2】 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , Miljan Martic公司 , 谢恩·莱格 :
使用逐步相对可达性惩罚副作用。 AIS安全@IJCAI 2019 2018 [i5] 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , Miljan Martic公司 , 谢恩·莱格 :
使用相对可达性测量和避免副作用。 CoRR公司 abs/1806.01186 ( 2018 ) [i4] 简·雷克 , 大卫·克鲁格 , 汤姆·艾唯瑞特 , Miljan Martic公司 , 维沙尔·梅尼 , 谢恩·莱格 :
通过奖励建模实现可伸缩的代理对齐:一个研究方向。 CoRR公司 abs/1811.07871 ( 2018 ) [i3] Miljan Martic公司 , 简·雷克 , 安德鲁·特拉斯克 , 马特奥·赫塞尔 , 谢恩·莱格 , Pushmet Kohli公司 :
通过模型拆分扩展共享模型治理。 CoRR公司 abs/1812.05979 ( 2018 ) 2017 【c1】 保罗·F·克里斯蒂亚诺 , 简·雷克 , 汤姆·B·布朗 , Miljan Martic公司 , 谢恩·莱格 , 达里奥·阿莫迪 :
从人类偏好中深度强化学习。 NIPS公司 2017 : 4299-4307 [i2] 保罗·F·克里斯蒂亚诺 , 简·雷克 , 汤姆·B·布朗 , Miljan Martic公司 , 谢恩·莱格 , 达里奥·阿莫迪 :
从人类偏好中进行深度强化学习。 CoRR公司 abs/1706.03741 ( 2017 ) [i1] 简·雷克 , Miljan Martic公司 , 维多利亚·克拉科夫纳 , 佩德罗·奥尔特加 , 汤姆·艾唯瑞特 , 安德鲁·勒弗朗克 , 劳伦特·奥尔索 , 谢恩·莱格 :
AI安全网格世界。 CoRR公司 abs/1711.09883 ( 2017 )