坏的普适先验和最优性概念
简·雷克(Jan Leike)、马库斯·赫特(Marcus Hutter)
第28届学习理论大会论文集2015年,PMLR 40:1244-1259。
摘要
算法信息理论的一个大问题是通用图灵机(UTM)的选择。对于Kolmogorov复杂性和Solomonoff归纳法,我们有不变性定理:UTM的选择只改变一个常数的边界。对于通用智能代理AIXI(Hutter,2005),不变性定理未知。我们的结果是完全否定的:我们讨论了UTM的不幸或对抗性选择导致AIXI严重行为不端的情况。我们证明了Legg-Hutter智能和平衡的Pareto最优性是完全主观的,并且在所有可计算环境中,每个策略都是Pareto最佳的。这破坏了AIXI的所有现有优化属性。虽然AIXI可能仍然是人工智能的金标准,但我们的结果表明,AIXI是一个相对的理论,取决于UTM的选择。
引用本文
相关材料