坏的普适先验和最优性概念

简·雷克(Jan Leike)、马库斯·赫特(Marcus Hutter)
第28届学习理论大会论文集2015年,PMLR 40:1244-1259。

摘要

算法信息理论的一个大问题是通用图灵机(UTM)的选择。对于Kolmogorov复杂性和Solomonoff归纳法,我们有不变性定理:UTM的选择只改变一个常数的边界。对于通用智能代理AIXI(Hutter,2005),不变性定理未知。我们的结果是完全否定的:我们讨论了UTM的不幸或对抗性选择导致AIXI严重行为不端的情况。我们证明了Legg-Hutter智能和平衡的Pareto最优性是完全主观的,并且在所有可计算环境中,每个策略都是Pareto最佳的。这破坏了AIXI的所有现有优化属性。虽然AIXI可能仍然是人工智能的金标准,但我们的结果表明,AIXI是一个相对的理论,取决于UTM的选择。

引用本文


BibTeX公司
@会议记录{pmlr-v40-Leike15,title={错误的普遍先验和最优概念},author={Leike,Jan和Hutter,Marcus},booktitle={第28届学习理论会议论文集},页数={1244--1259},年份={2015年},editor={Grünwald,Peter和Hazan,Elad和Kale,Satyen},体积={40},series={机器学习研究论文集},address={法国巴黎},月={03年7月6日},发布者={PMLR},pdf={http://proceedings.mlr.press/v40/Leike15.pdf},url={https://proceedings.mlr.press/v40/Leike15.html},abstract={算法信息理论的一个重大开放性问题是通用图灵机(UTM)的选择。对于Kolmogorov复杂性和Solomonoff归纳法,我们有不变性定理:UTM的选择只受一个常数的限制。对于通用智能代理AIXI(Hutter,2005)不变性定理是未知的。我们的结果完全是负面的:我们讨论了UTM的不幸或对抗性选择导致AIXI严重不当行为的案例。我们证明了Legg-Hutter智能和平衡的Pareto最优性是完全主观的,并且在所有可计算环境中,每个策略都是Pareto最佳的。这破坏了AIXI的所有现有优化属性。虽然AIXI可能仍然是人工智能的金标准,但我们的结果表明,AIXI是一个相关理论,取决于UTM的选择。}}
尾注
%0会议论文%T坏的普适先验和最优性概念%A Jan Leike(简·雷克)%马库斯·赫特%第28届学习理论会议论文集%C机器学习研究进展%D 2015年%E Peter Grünwald先生%E Elad Hazan公司%E Satyen羽衣甘蓝%F pmlr-v40-Leike15型%我PMLR%电话1244-1259%单位https://proceedings.mlr.press/v40/Leike15.html%第40版%X算法信息理论的一个大问题是通用图灵机(UTM)的选择。对于Kolmogorov复杂性和Solomonoff归纳法,我们有不变性定理:UTM的选择只改变一个常数的边界。对于通用智能代理AIXI(Hutter,2005),不变性定理未知。我们的结果完全是负面的:我们讨论了UTM的不幸或对抗性选择导致AIXI严重不当行为的案例。我们证明了Legg-Hutter智能和平衡的Pareto最优性是完全主观的,并且在所有可计算环境中,每个策略都是Pareto最佳的。这破坏了AIXI的所有现有优化属性。虽然AIXI可能仍然是人工智能的金标准,但我们的结果表明,AIXI是一个相对的理论,取决于UTM的选择。
RIS公司
TY-CPAPER公司TI-坏的普遍先验和最优概念澳大利亚-Jan Leike澳大利亚-马库斯·赫特BT-第28届学习理论会议记录DA-2015年6月26日ED-彼得·格伦瓦尔德ED-Elad Hazan公司ED-Satyen羽衣甘蓝ID-pmlr-v40-Leike15PB-PMLRDP-机器学习研究进展VL-40SP-1244EP-1259第一层-http://proceedings.mlr.press/v40/Leike15.pdfUR-(欧元)https://proceedings.mlr.press/v40/Leike15.htmlAB-算法信息理论的一个大问题是通用图灵机(UTM)的选择。对于Kolmogorov复杂性和Solomonoff归纳法,我们有不变性定理:UTM的选择只改变一个常数的边界。对于通用智能代理AIXI(Hutter,2005),不变性定理未知。我们的结果完全是负面的:我们讨论了UTM的不幸或对抗性选择导致AIXI严重不当行为的案例。我们证明了Legg-Hutter智能和平衡的Pareto最优性是完全主观的,并且在所有可计算环境中,每个策略都是Pareto最佳的。这破坏了AIXI的所有现有优化属性。虽然AIXI可能仍然是人工智能的金标准,但我们的结果表明,AIXI是一个相对的理论,取决于UTM的选择。呃-
亚太地区
Leike,J.和Hutter,M.(2015年)。坏的普遍先验和最优概念。第28届学习理论会议记录,英寸机器学习研究进展40:1244-1259网址:https://proceedings.mlr.press/v40/Leike15.html。

相关材料