×

进化博弈论。 (英语) 兹比尔0879.90206

马萨诸塞州剑桥:麻省理工学院出版社。xv,第265页(1995年)。
这本书是对进化博弈论核心要素的论述。它以一章开始,以战略形式简明扼要地阐述了非合作游戏的关键要素,包括有限数量的玩家和有限组纯策略。讨论了纳什均衡的各种合理性概念及其精化。这本书的一个非常有用的特点是,在本书的早期章节中开发的几个双人游戏示例,如囚犯困境、进入阻止、协调游戏等,在书的其余部分中反复使用,提供了一个连续的线索。
后续章节的大部分分析都集中在对称双人游戏上,即两个玩家的支付矩阵是彼此的换位。一些分析仅限于双重对称博弈,即一种对称的两人博弈,其中支付矩阵是对称的。本书的大部分内容涉及稳定战略的概念,无论是基于明确的动态模型还是间接基于静态战略考虑,这些概念的主要动机来自本质上具有生物学解释的游戏问题。这是第2章和第3章中的情况,分别阐述了进化稳定策略(ESS)和复制者动力学的概念。
第2章集中讨论对称的两人游戏,在这种游戏中,从大量人口中随机抽取个人来玩游戏。它们的成对相互作用产生了回报,这被认为是从相互作用中获得的生物适应性或生殖价值。如果一个策略最初由所有人口成员玩,如果在一小部分人口玩另一个策略偏离该策略时,当前策略优先于偏离策略,则称为进化稳定策略,即:,对于小的“突变”,ESS的选择是稳健的。更正式地说,让\(K)是纯策略的个数,\(Delta)是\(R^K)的单位单纯形。(Delta)中的点是纯策略集上的概率分布,构成混合策略。当(z)和(w)分别是玩家1和玩家2的策略时,让(u(z,w)代表玩家1的收益。(Delta)中的策略(x)是一个ESS(请参阅第2.1.1节),如果对于每个策略(y\neq x),在((0,1)中都存在一些(varepsilon_y),因此对于((0,varepsilen_y)中的所有策略(varepsi lon),我们都有\(x)是ESS,当且仅当(x)为对其自身的最佳回复,并且如果(y)是对(x)的另一个最佳回复,则(x)比(y)本身对(y)的更好回复,即(u(y,x)\leq u(x,x)\)代表所有\(y),并且(u(y,x)=u(x)\。ESS集是有限的,但可以是空的,就像在石头剪刀纸游戏中一样。如果ESS\(x)严格为正,即位于\(Delta)的内部,则它是唯一的。
ESS对于偏差策略的出现是稳健的,只要这些偏差一次发生一个,并且在足够小的人口比例中发生,即所谓的“入侵屏障”(varepsilon_y),实际上可以被视为统一的,即独立于(y)。ESS也可以被描述为“本地优势”战略\如果(x\)具有邻域\(U\),使得对于\(U\)中的所有\(y\),\(U(x,y)>U(y,y)\)(见第2.2.2节),则(x\)是局部优的。ESS具有各种合理性属性。它是对称纳什均衡(NE),即策略对((x,x))是对称两人博弈的纳什均衡;事实上,它的要求比NE概念的许多改进要严格一些。没有弱支配策略是ESS(见第2.1.4节)。然而,ESS(x)不是必要的“社会效率”;可能还有另一种策略(y),如果它是所有人群的标准,那么每个参与者的回报都会更大,即,(y)使得(u(y,y)>u(x,x))。但是,在双对称博弈中,ESS(x)是“局部严格有效的”;也就是说,存在一个邻域\(U),使得\(U(x,x)>U(y,y)\)表示\(U \)中的所有\(y \),从而\(y\neq x \)。实际上,局部严格效率是ESS的特征(见第2.5节)。
第2章还研究了ESS概念的变化,例如仅对偏差策略(y)的鲁棒性要求较弱,偏差策略本身在后入口种群中是最优的;进化稳定性的集值概念等。一些注意力集中在涉及预演沟通的游戏及其对实现社会效率的影响,以及策略选择可能取决于玩家位置的游戏。
第3章的主题是“复制者动态”,它着重于选择机制的作用。这种治疗限制了人们对一个框架的关注,在这个框架中,群体中的每个个体都执行一种纯粹的策略,这是个体的特征,并且是由后代继承的。因此,对于每个纯策略(i),总人口可以被视为由分数(x_i)组成,代表倾向于只玩策略(i”)的个体的分数。因此,向量(x=(x_1,dots,x_k))表示任何个体在随机配对匹配中面临的混合策略,该混合策略与他自己的纯策略(e^i)一起决定了回报(u(e^i,x),代表适应度或后代数量,以及这与当前人口平均回报之间的差异,即,\(u(x,x)=\ Sigma_i x_i u(e^i,x)\)决定了第\(i)组的生长速率。因此,动力学由一个常微分方程表示,\[(d/dt)x_i=x_i[u(e ^i,x)-u(x,x)]。\标记{1}\]让\(xi(t,x^0)\)表示(1)从初始状态\(x^0 \)的解。虽然复制因子动力学并没有明确地基于个体在选择个体策略方面的任何理性(他们被编程为执行策略),但渐进行为可以是“理性的”或协调,因为在当前的混合策略或人口状态(x)中,执行策略的人口部分的增长或衰退取决于策略的成功,就回报而言。从长远来看,当\(i\)是严格(或迭代严格)支配的纯策略时,严格支配的纯策略不能生存,即\(\xi_i(t,x^0)\ to 0\)as \(t\ to \infty\),对于\(\Delta\)内部的任何\(x^0\)。弱主导战略可能生存下来;然而,类似但较弱的属性可能也适用于此类策略(参见第3.2节)。
(对称)NE是(1)的稳态。相反,内部平稳状态是NE。此外,非NE的平稳状态甚至不是Lyapunov稳定的,因此对于初始混合策略的小扰动(相当于偏差策略出现的概念和ESS的概念)不具有鲁棒性。内部静止状态为NE;实际上,如果\(x^0\in\text{int}(\Delta)\),则动力学(1)的极限点为NE。NE的动态稳定性比NE的各种改进更具限制性;即,满足这些静态细化要求的NE甚至可能不是Lyapunov稳定(见第3.3节)。
每个ESS都是局部渐近稳定的,内部ESS(x)在(xi_i(t,x^0)到x)if(x^0in\text{int}(Delta))的意义上是“几乎”全局稳定的(参见第3.5.1和3.5.2节)。这里的稳定性分析以及在后面的一些部分中,涉及到从这里的分析中应用熵测度,以及在后面一些部分中涉及到从信息论中应用熵度量来构造合适的Lyapunov函数。如前一章所述,我们考虑了各种扩展,包括进化稳定集,双对称博弈的特殊情况(其中平均收益(u(x,x))确实随时间增加,即所谓的自然选择基本定理和(x)是一个ESS当且仅当它在复制子动力学中局部渐近稳定时),并且是策略子集特征的扩展,这些策略子集在长期内生存。
第4章研究了一些替代的动力学模型。在本章的前半部分,对前一章生物复制模型的变化,如离散时间公式、重叠世代等进行了一些关注。本章后半部分(第3节和第4节)重点关注在大量相互作用的个体中策略的非生物复制模型,这是经济学等社会科学中感兴趣的模型。因此,这一章具有异质性,给人的印象是,与起源于进化生物学的问题相比,社会科学更直接感兴趣的问题受到了冷落,这可能反映了博弈论这一分支的进化和现状。前两部分似乎自然属于前一章的补充材料,最好从社会科学的角度单独处理进化博弈问题的表述。
第4章第3节为考虑动态模型奠定了基础,其中通过模仿和成功行为的实施而不是通过生物繁殖进行复制更为合适,它考虑了一类一般的动力学,其中包括作为特例的复制者动力学:\[(d/dt)x_i=g_i(x)x_i.\标签{2}\]为了在非合作博弈中获得动态特性和合理性准则之间的联系,当然需要对增长率函数(g:Delta到R^K)(其坐标函数是g_is)有一些限制,该函数体现了增长率和收益之间的关系。研究了三种关系,即“单调支付”、“正支付”和弱正支付:
(a) 如果对于(Delta)中的所有\(x),\(u(e^i,x)>u(e ^i,x)\)iff\(g_i(x)>g_j(x)\),即较高的支付策略具有较高的增长率,则\(g)为单调支付。
(b) 如果(Delta)中的所有\(x)和每个纯策略\(i),\(\text{sign}[g_i(x)]=\text{sign}[u(e^i-x,x)]\),则(g)为正回报。也就是说,收益高于平均回报的策略会增长,反之亦然。
(c) 如果对于(Delta)中的所有\(x),\(B(x)neq\emptyset)暗示\(g_i(x)>0\)对于\(B(x)\)中的某些\(i),其中集合\(B ff,如果有这样的策略,具有正增长率。
Replicator Dynamics的一些基本属性扩展到了更通用的类。值得注意的是,从长远来看,严格控制的战略可能不会完全消除,尽管那些由纯战略控制的战略是(见第4.3.2节)
第4章第4节提供了一些行为的社会进化的正式模型,这些行为在战略互动的主体群体中产生了第3节中讨论的那种动态。这些模型在代理审查其策略选择的时间速率和审查代理的“选择概率”的规范上有所不同,即使用策略的代理将切换到策略的概率。提出了三个模型,其中一个涉及“纯模仿”,即代理切换到它随机遇到的任何策略,即\(p_i^j(x)=x_j\)。
另外两种涉及更直接的模拟,其中切换的概率取决于两种策略之间观察到的(带有一些噪声)回报差异,或者取决于当前人口状态下替代策略的使用程度(受欢迎程度)以及该策略的回报(见第4.4.2和4.4.3节).
第5章研究了进化稳定策略的早期概念、选择机制、它们的动力学性质以及与非合作均衡的关系,从2人对称博弈扩展到不一定对称的(n)人博弈。从不同人群中随机抽取的个体,每个玩家位置一个,重复玩游戏。许多结果可以扩展,但确实会出现重大差异。对于ESS标准的适当扩展缺乏共识。与单种群设置不同,变种策略不可能与自身对抗,因为任何一个种群的玩家都会与其他种群的玩家对抗。因此,一个接受替代性最佳回答的NE很容易受到涉及这些替代品之一的突变的影响。只有严格的NE才能满足多群体ESS的建议标准,即每个玩家位置都有唯一的纯策略作为最佳回答(因此,NE中不涉及随机化)(见第5.1.1节)。
第3章的复制者动力学有两个多种群扩展,其中一个扩展的增长率(每个子组的增长率,以其纯策略为特征,在每个种群中)等于超额回报(超过玩家来自的种群的平均回报),而在另一个扩展中,它取决于超额收益占平均收益的比例(对于该人群),在这种情况下,假设收益为正。第四章的仿真模型以及更一般的动力系统的扩展是可能的。单一种群动态的结果在很大程度上延续了下来。特别是,动态稳定性和内部收敛意味着总体NE行为和由纯策略主导的策略无法沿着解决路径生存(见第5.3至5.6.2节)。
许多这些动力学模型(标准复制因子动力学或更广泛类别的一阶近似)的一个值得注意的特征是,如果人们寻求局部渐近稳定性意义上的平衡点的稳健性,那么将消除所有混合策略。如果\(Theta\)代表混合策略空间\(X_{i\ in i}\Delta_i\),其中\(i\)是参与者的索引集,\(Delta_i \)的点是参与者\(i\)的混合策略的单纯形,那么位于\(Theta \)的某个面的相对内部的\(Theata\)的任何闭子集\(X\)都不是渐近稳定的。值得注意的是,在所有支付正选择动力学中,(Theta)的面要么是渐近稳定的,要么是不稳定的(参见第5.7节)。因此,这种动力学的细节是无关紧要的,因此,对人脸的预测是非常可靠的。
上一段提到的混合策略剖面的渐近不稳定性定理使用了Liouville公式。在最后一章中,我们将对动力系统章节中使用的常微分方程理论的这一方面和其他更标准的方面进行阐述。就像第一章一样,这是一个清晰而恰当的处理方式。
总之,这是一本写得好、读起来好的书。每个主要章节的导言部分都将问题放在了角度上,并在整个论文中提供了一个连续的线索。它们简明扼要地说明了问题的性质、主要结果以及所面临的困难,并使读者对要点有了相当清晰的认识。对细节感兴趣的读者可以钻研每章的正文。技术讨论很清楚,但有些东西需要想象。
任何有兴趣了解进化博弈论的人都会发现这是一个吸引人且信息丰富的介绍。

MSC公司:

91A40型 其他游戏理论模型
91A15型 随机博弈,随机微分博弈
91A05型 2人游戏
91A10号 非合作游戏
91-01 与博弈论、经济学和金融相关的介绍性说明(教科书、教程论文等)
91A20型 多阶段重复游戏
PDF格式BibTeX公司 XML格式引用