有限二人决定博弈公平游戏尼姆伯斯丹尼·斯莱特安德鲁的飞跃,2000我们讨论的游戏:2人完美信息交替移动每个状态下的移动次数有限长度有限有时被称为“树游戏”,因为你可以画一棵树。示例:tic-tac-toe公司连接-4奥塞罗尼姆新芽取胜-1-2-3(一排12场比赛,你可以取胜在你的移动中离开1、2或3。目标是最后一场比赛。)国际象棋(必须假设50步或50步时宣布平局重复发生)两名球员将是白人和黑人(白人优先)例子。。。。。游戏的“自然结果”是最好的结果怀特(第一个球员)如果总是尽可能最好的行动。很容易看出如何计算游戏的自然结果。只是向树上传播价值观。叶子上贴着结果(白色获胜、平局或黑色获胜时说W、D、B)。在节点上,其中移动时为白色,节点标有下面最好的节点从怀特的角度来看。同样适用于黑色。公平的游戏讨论的一些游戏具有移动集的特性位置的可用性不取决于它是谁的移动,并且胜利者是做出最后一步行动的人。尼姆、芽苗菜和取而代之的1-2-3是这样的。像这样的游戏叫做公正游戏。(所有这些游戏都有“Mise's”版本,如果目标是坚持最后一步。优雅的理论以下开发的不适用于这些游戏。)你可以把一个公正的游戏简单地看作一个集合。这组是依次进行的集合的集合,其中每个内部集合只是游戏结果第一个玩家的一个动作。所有这些集合都是有限的。让@表示没有移动的游戏。或者,你可以把一个公正的游戏想象成一棵树。我们说如果两个游戏的树是同构的。也就是说,你可以画这两棵树,让它们看起来通过重新排序每个节点的子节点,可以实现完全相同的效果。[以下一些定义和定理来自讲义由Dana Scott编写。]游戏a的等级,用|a|表示,就是:|A|=1+最大值|b|和|@|=0A中的b排名只是游戏中可以发生的最大移动数。(也许秩用于某些归纳证明……)游戏的值,表示为||a||,定义如下:||A||=最大值-||b||和||@||=-1A中的b因此,亏损头寸的价值是-1,而获胜的价值是为1。两个游戏A和B的结合是一个新游戏。它表示为A*B(Dana使用A圆圈+B)。直观定义如下。一个动作在A*B中,通过选择A或B中的一个并在其中移动游戏。例如,如果玩家在a中移动,留下一个,那么在加入的游戏中移动后产生的游戏是*B。下面是一个更正式的定义:A*B=A}联合中的{A*B|A{B}中的A*B|BA*@=A@*B=B以下定理很容易证明:定理:A*B=B*A定理:A*(B*C)=(A*B)*C我们开发的理论的主要目标之一是描述关于两个博弈的连接的有用性质两场比赛。我们从一些显而易见的事情开始:定理:(1)如果||A||=-1和||B||=-1,则||A*B||=-1(2) 如果||A||=1且||B||=-1,则||A*B|=1(3) 如果||A||=-1且||B||=1,则||A*B||=1证明:(1)。我们试图证明加入游戏A*B的第二个玩家。我们可以通过以下方式证明这一点游戏排名归纳(i,j)。假设我们展示了第(1)部分对于所有对(i',j'),其中i'0.在这种情况下,我们展示第一个玩家的获胜策略。这个策略是仅仅是为了做出一个移动,从而得到一个零的位置。这是当然可能(因为所有的数字都小于位置是可以实现的,包括0)。所以在移动之后位置值为-1(感应)。这就完成了定理。按季度计算。正如我前面提到的,结果是[A*B]=f([A],[B])。也就是说,两个游戏的结合次数只是这两部分的长度。这对于从计算的角度来看,因为这意味着如果你可以拆分进行博弈并评估每个部分的灵活性,您可以计算整个游戏的速度(以及价值)。目的理论就是要证明关于尼伯斯的这个事实。引理:[A]=[B]当且仅当||A*B||=-1证明:假设[A]=[B]。考虑A*B。无论第一步是什么玩家制造,结果是两局比赛的结合具有不同的灵活性。该位置的值为(感应)因此1。类似地,如果[A]!=[B] ,然后第一个玩家可以移动在游戏中使用最大的敏捷并将其敏捷减少为等于另一场比赛的敏捷。通过归纳,这是一个失去的位置。这个引理的另一个公式是:[A]=[B]iff[A*B]=0。我们将游戏的等价性定义如下。A~B(A相当于B)如果所有游戏X都保持以下状态:||A*X||=||B*X||事实证明,数允许我们确定等价性。定理:A~B当且仅当[A]=[B]证明:首先证明A~B表示[A]=[B]。选择X=A。然后我们有:|A*A||=|B*A||。根据引理,它的左边是-1。根据引理,右边是-1意味着[A]=[B]。另一个方向是因为引理告诉我们游戏a*X只取决于a和X的数量。因此,如果[a]=[B],那么对于所有的X.Q.E.D,A*X和B*X的值是相同的。我们仍然需要做的关键事情是确定从两场比赛中选出的两场比赛的结合。首先,甚至还不清楚连接的数量是否是的函数两场比赛的节奏。接下来我们将证明这一点。定理:[A*B]只是[A]和[B]的函数。证明:首先我们需要一点符号。表示nim游戏有一行k个匹配项。如上所述[]=k,对于任何k>=0。所以这是一个具有特定敏捷度的简单特定游戏。显然是为了这些游戏,定理成立。因为有一种独特的游戏这节课有一个给定的灵活性。所以有一些函数f(.,.)满足以下要求:[*]=f(i,j)对于所有游戏A和B,我们都想表明:[A*B]=f([A],[B])考虑这个数量:[(A*B)*(<[A]>*<[B]>)]如果我们能证明这是0,那么我们就知道:[A*B]=[<[A]>*<[B]>]=f([A],[B])让我们这样做。[(A*B)*(<[A]>*<[B]>)]==[A*B*<[A]>*<[B]>]=[(A*<[A]>)*(B*<[B]>)]现在[A]=[<[A]>]。所以左边的数字是0。右边的部分类似于0。因此,此连接的数目为也为0。这就完成了证明。按季度计算。仍需计算f(i,j)。我们的最后一个定理告诉我们如何做到这一点。定理:[*]=f(i,j)=i^j,其中“^”表示按位独占或操作。证明:为了通过归纳法证明这一点,有必要证明以下几点断言:对于任何i,j,最小非负整数NOT in集合{0^i,1^i,2^i…(j-1)^i,j^0,j^1,…,j^(i-1)}是i^j。(这里^表示xor)。首先,很明显,i^j不在这个集合中。让我们展示一下数字k小于i^j在集合中。事实上,k<i ^j意味着k和i^j不同的第一个地方是在i^j为1的某个位上k为0。因为在这个位置,i^j是1,所以在那个位置,要么i是1位置或j是。WLOG,假设1在i中。现在我们要将i减小到一个新的数字i',使该位变为0。我可以这样,下面的位可以是我们想要的任何东西。特别是,我们可以选择它们,以便i'^j获得所需的值,即k.Q.E.D。注:我们不得不经历这些复杂的事情的原因是因为上述结构对任意游戏不起作用。仅适用于简单的nim桩,例如一般来说,在游戏a中可以进行小于[A]的任何移动,但总的来说,也有可能采取更灵活的行动大于[A]。这会导致任何类似于最后一个失败的证据。至少这是导致这个论点。