Bad Universal Priors and Notions of Optimality

Jan Leike; Marcus Hutter

坏的普适先验和最优性概念

简·雷克（Jan Leike）、马库斯·赫特（Marcus Hutter）

第28届学习理论大会论文集2015年，PMLR 40:1244-1259。

摘要

算法信息理论的一个大问题是通用图灵机（UTM）的选择。对于Kolmogorov复杂性和Solomonoff归纳法，我们有不变性定理：UTM的选择只改变一个常数的边界。对于通用智能代理AIXI（Hutter，2005），不变性定理未知。我们的结果是完全否定的：我们讨论了UTM的不幸或对抗性选择导致AIXI严重行为不端的情况。我们证明了Legg-Hutter智能和平衡的Pareto最优性是完全主观的，并且在所有可计算环境中，每个策略都是Pareto最佳的。这破坏了AIXI的所有现有优化属性。虽然AIXI可能仍然是人工智能的金标准，但我们的结果表明，AIXI是一个相对的理论，取决于UTM的选择。

引用本文

BibTeX公司

@会议记录{pmlr-v40-Leike15，title={错误的普遍先验和最优概念}，author={Leike，Jan和Hutter，Marcus}，booktitle={第28届学习理论会议论文集}，页数={1244--1259}，年份={2015年}，editor={Grünwald，Peter和Hazan，Elad和Kale，Satyen}，体积={40}，series={机器学习研究论文集}，address={法国巴黎}，月={03年7月6日}，发布者＝{PMLR}，pdf={http://proceedings.mlr.press/v40/Leike15.pdf},url={https://proceedings.mlr.press/v40/Leike15.html},abstract={算法信息理论的一个重大开放性问题是通用图灵机（UTM）的选择。对于Kolmogorov复杂性和Solomonoff归纳法，我们有不变性定理：UTM的选择只受一个常数的限制。对于通用智能代理AIXI（Hutter，2005）不变性定理是未知的。我们的结果完全是负面的：我们讨论了UTM的不幸或对抗性选择导致AIXI严重不当行为的案例。我们证明了Legg-Hutter智能和平衡的Pareto最优性是完全主观的，并且在所有可计算环境中，每个策略都是Pareto最佳的。这破坏了AIXI的所有现有优化属性。虽然AIXI可能仍然是人工智能的金标准，但我们的结果表明，AIXI是一个相关理论，取决于UTM的选择。}}

尾注

%0会议论文%T坏的普适先验和最优性概念%A Jan Leike（简·雷克）%马库斯·赫特%第28届学习理论会议论文集%C机器学习研究进展%D 2015年%E Peter Grünwald先生%E Elad Hazan公司%E Satyen羽衣甘蓝%F pmlr-v40-Leike15型%我PMLR%电话1244-1259%单位https://proceedings.mlr.press/v40/Leike15.html%第40版%X算法信息理论的一个大问题是通用图灵机（UTM）的选择。对于Kolmogorov复杂性和Solomonoff归纳法，我们有不变性定理：UTM的选择只改变一个常数的边界。对于通用智能代理AIXI（Hutter，2005），不变性定理未知。我们的结果完全是负面的：我们讨论了UTM的不幸或对抗性选择导致AIXI严重不当行为的案例。我们证明了Legg-Hutter智能和平衡的Pareto最优性是完全主观的，并且在所有可计算环境中，每个策略都是Pareto最佳的。这破坏了AIXI的所有现有优化属性。虽然AIXI可能仍然是人工智能的金标准，但我们的结果表明，AIXI是一个相对的理论，取决于UTM的选择。

RIS公司

TY-CPAPER公司TI-坏的普遍先验和最优概念澳大利亚-Jan Leike澳大利亚-马库斯·赫特BT-第28届学习理论会议记录DA-2015年6月26日ED-彼得·格伦瓦尔德ED-Elad Hazan公司ED-Satyen羽衣甘蓝ID-pmlr-v40-Leike15PB-PMLRDP-机器学习研究进展VL-40SP-1244EP-1259第一层-http://proceedings.mlr.press/v40/Leike15.pdfUR-（欧元）https://proceedings.mlr.press/v40/Leike15.htmlAB-算法信息理论的一个大问题是通用图灵机（UTM）的选择。对于Kolmogorov复杂性和Solomonoff归纳法，我们有不变性定理：UTM的选择只改变一个常数的边界。对于通用智能代理AIXI（Hutter，2005），不变性定理未知。我们的结果完全是负面的：我们讨论了UTM的不幸或对抗性选择导致AIXI严重不当行为的案例。我们证明了Legg-Hutter智能和平衡的Pareto最优性是完全主观的，并且在所有可计算环境中，每个策略都是Pareto最佳的。这破坏了AIXI的所有现有优化属性。虽然AIXI可能仍然是人工智能的金标准，但我们的结果表明，AIXI是一个相对的理论，取决于UTM的选择。呃-

亚太地区

Leike，J.和Hutter，M.（2015年）。坏的普遍先验和最优概念。第28届学习理论会议记录，英寸机器学习研究进展40:1244-1259网址：https://proceedings.mlr.press/v40/Leike15.html。

坏的普适先验和最优性概念

摘要

引用本文

相关材料