跳过1简介部分 1 简介 多智能体系统的设计和控制对应于对智能体之间的交互进行建模的游戏中获胜策略的综合。 游戏在一个图形上进行,该图形的路径对应于系统的计算。 我们在这里研究的设置中,每个玩家都可以控制系统的不同部分。 因此,游戏是 以回转为基础的 :从初始顶点开始,玩家共同生成 玩 即图中的一条路径,当游戏到达她控制的顶点时,每个玩家决定后继顶点。 游戏中玩家的目标是指他们产生的无限游戏。 每个目标都是一个Borel集合 \上Cantor拓扑中的(\alpha\) \(V ^\omega)[ 44 ],其中 V(V) 是图的顶点集。 在某些设置中 \(\alpha\)是 结构的 :它被指定为 \(\omega\)-常规条件 V(V) (例如,Büchi或parity)。 在其他设置中 \(\alpha\)是 行为 :中的顶点 V(V) 按集合的赋值进行标记 AP公司 原子命题的定义,以及 \(\alpha\)是一种由无限单词组成的语言 \((2^{AP})^\omega\)。
A类 策略 对于玩家来说,指导她如何继续达到顶点的游戏。 我们区分 确定性 (又名。 纯净的 )选择后续顶点的策略,以及 随机化的 策略,选择后继顶点的概率分布[ 20 ]. 我们还将游戏与 全能见度 ,其中策略可能取决于游戏的完整历史,以及与 局部可见性 战略只取决于历史的可见部分。 部分可见性的传统方法假设 纵向不确定性 ,其中在所有顶点中,参与者只观察到原子命题的可观察子集的赋值[ 5 , 16 , 18 , 37 , 50 ]. 具有纵向不确定性(又名。 基于观测 不确定性),我们对系统进行建模,其中每个底层组件只能查看和控制系统变量的子集。 例如,使用私有变量与用户交互的程序。 在那里,参与者的策略无法区分可观察原子命题以相同方式表现的不同路径。
我们介绍和学习 透视游戏 ,哪个型号 横向不确定性 -一种新型的局部能见度。 与标准的基于回合的游戏一样,游戏图的顶点在玩家之间进行划分,玩家共同生成计算结果。 在透视游戏中,每个玩家的可见性仅限于其顶点。 因此,玩家的透视策略无法区分访问其他玩家所拥有顶点的不同历史。 透视游戏捕获多代理系统,其中代理只能查看其控制的系统部分。 例如,一种通信网络,在该网络中,拥有部分路由器的公司必须仅根据有关访问其路由器的信息作出路由决定[ 1 ],复合反应系统中不观察环境与其他组件相互作用的组件[ 42 ]和交换系统,其中组件由调度器激活,并且在关闭时不知道系统的演变[ 40 , 43 ]. 再举一个例子,考虑一个由几个客户端组成的系统,这些客户端轮流使用服务器。 每个客户端都可以在使用服务器时观察服务器的当前状态,但不能在其他客户端使用服务器时监视服务器。因此,每个客户端都具有透视可见性。 透视游戏不同于迄今为止研究的所有部分可见性模型。 事实上,在透视游戏中,两个玩家都可以完全看到他们控制的系统部分,而对他们不控制的部分则没有可见性(特别是,甚至没有关于转换次数的信息)。 因此,虽然在具有纵向不确定性的游戏中,玩家观察到所有顶点,但在透视游戏中,可见性和可见性的缺乏是部分的 横向 -有些顶点玩家根本看不到,有些则完全看到。
透视策略与 无记忆的 策略,仅取决于游戏的当前顶点。 显然,每一个无记忆的策略都是视角。 实际上,控制顶点的玩家可以看到当前顶点。 视角策略也与 口吃不变策略 在里面 异步 游戏[ 27 , 29 ]. 在这些游戏中,玩家不知道他们的步骤之间经过的时间(以及其他组件完成的步骤数)。 由于这些游戏中的策略是无记忆的,所以设置比透视游戏更简单。 最接近透视游戏的模型是[ 49 ],它在异步设置中考虑具有部分可见性的游戏。 在那里,对玩家没有可见效果的动作对该玩家是隐藏的。 换句话说,每当一个游戏从顶点穿过一条边时 v(v) 到顶点 \(v^{\prime}\),则遍历仅对能够区分 v(v) 和 \(v^{prime}\)。 因此,透视游戏是[ 49 ]. 与透视游戏不同,在[ 49 ]是纵向的。 如所示[ 49 ]决定玩家是否有获胜策略的问题是可以判定的,但所描述的算法的复杂性并不严格。 另一个相关模型是[ 42 ]控制流量成分。 受软件和web服务系统的激励,作者研究了由组件库组成的系统。 组件获得并放弃对计算的控制,其行为与计算历史无关。 类似的设置是在计算过程中打开和关闭的切换系统的设置[ 23 ]. 超越可见性模型中的差异(例如[ 42 ]组件没有关于历史记录的信息,包括之前对其自身的调用,以及[ 23 ]区分活动和休眠切换系统,取决于组件在关闭时对环境的感知)[ 23 , 42 ]是不同的,并且涉及从协作组件合成系统。 相反,我们研究的是一个游戏环境,其中组件具有零和目标。
我们首先研究透视游戏的一些理论方面。 我们考虑具有获胜条件的两层博弈 L(左) 要么是结构性的,即 \(L\subseteq V^\omega),或行为,即 \(L\subseteq(2^{AP})^\omega\)。 玩家1 目标是一部计算在 L(左) ,因此是一个成功的战略 玩家1 是一个保证生成的播放 L(左) 不管怎样 玩家2 收益。 我们表明,在确定性环境中,透视策略( P(P) -策略)弱于完全可见的策略( F类 -战略)。 因此,有些游戏 玩家1 用一个 F类 -战略还没有赢得 P(P) -战略。 的弱点 P(P) -策略应用; 然而,仅适用于 玩家1 因此, 玩家1 有一个 P(P) -战胜所有人的战略 P(P) -的策略 玩家2 若(iff) 玩家1 有一个 P(P) -战胜所有人的战略 F类 -的策略 玩家2 在概率设置中, P(P) -双方的策略都较弱。 最后,在确定性和概率性设置中,透视游戏都是不确定的。 因此,有些游戏 玩家1 没有获胜机会(或者在概率设置中几乎没有获胜机会) P(P) -战略 L(左) 也不是 玩家2 赢了 P(P) 补充战略 L(左) 虽然建立上述结果所需的证明和示例是新颖的,但所获得的图片与其他研究的部分能见度模型的已知图片相似[ 16 , 18 ].
推理游戏的首要问题是决定玩家是否有获胜策略。 在这里,透视游戏和其他部分可见性模型之间的差异变得非常显著:处理纵向不确定性通常涉及将游戏图进行一些类似于子结构的转换,转换为具有完全可见性的指数大小的游戏图。 因此,具有纵向不确定性的决策博弈在图中是EXPTIME完全的[ 5 , 11 , 16 , 18 ]. 在透视游戏中,我们可以避免图形大小的指数放大,并在获胜条件下(通常要小得多)将其与指数放大进行交换! 本质上,虽然在纵向设置中,我们对图的当前位置存在不确定性,这会导致图中出现指数放大,但横向设置会导致获胜条件下自动机当前位置的不确定性,从而导致获胜条件出现指数放大。 从技术上讲,我们的算法构造了一个交替树自动机,它完全接受描述获胜的所有树 P(P) -战略 玩家1 .树枝对应于以下可能的选择 玩家1 ,自动机向每个分支发送由 玩家2 我们分析了我们的算法对于由确定性或泛co-Büchi或奇偶自动机以及LTL公式给出的行为获胜条件的复杂性,并表明该问题对于所有上述类型的自动机都是EXPTIME-完全的,对于LTL是2EXPTIME完全的。 在所有情况下,图的复杂性都是多项式的。 关于下界,我们证明了对于固定大小的图和有限字上确定性自动机给出的获胜条件,该问题已经是EXPTIME困难的。 我们的下限证明是由线性空间中的一个约简得到的 交替图灵机 ,它使用部分可见性来强制 玩家1 生成接受计算,以尊重图灵机在配置的所有位置的转换函数。 实际上,获胜条件检查的位置取决于 玩家2 在游戏的序言中 玩家1 没有观察到。 总而言之,虽然求解透视游戏比求解全可见性游戏要困难得多,但指数放大只是在获胜的条件下。 透视游戏的图形复杂性与无不确定性游戏的图形复杂度一致,并且比具有纵向不确定性的游戏图形复杂度指数低。
在概率设置中,我们证明了部分可观测性使玩家能够随机均匀地绘制数字。 本质上,通过让 玩家 j个 选择一个数字 \(x_j\in\lbrace 0,\dots,n-1\rbrace),我们得到了 \(x_1+x_2\mod{n}\)均匀分布在 \(\l痕迹0,\dots,n-1\r痕迹)。 这使得具有确定性co-Büchi自动机指定的获胜条件的透视游戏能够为概率co-Búchi自动机的空性问题建模。 由于后一个问题无法确定[ 7 , 17 ],决定是否 玩家1 具有随机 P(P) -策略几乎肯定会赢得相应的透视游戏。
具有行为获胜条件的决策游戏与ATL密切相关 ⋆ 模型检查[ 5 ]. 时序逻辑ATL ⋆ 在多代理系统中提供对计算的选择性量化。 具体来说,路径量词 \(\langle\!\langle-A\rangle\!\rangle),对于集合 A类 玩家的范围,涵盖玩家的计算集 A类 可以强制系统进入。 特别是游戏的初始顶点 克 满足 \(\langle\!\langle\mbox{PLAYER~1}\rangle\!\rangle\psi\)iff 玩家1 在比赛中有获胜的策略 克 具有获胜条件 \(磅/平方英寸)。 路径量词 \(\langle\!\langle\rangle\!\rangle\)假设 F类 -战略。 ATL的一般扩展 ⋆ 对于具有部分可见性的多代理系统是不可确定的,因为它允许异步进行的参与者之间的合作[ 46 , 48 ]. 已经研究了许多可判定的设置[ 5 , 6 , 9 , 10 , 12 , 45 ]. 与游戏一样,不确定性是纵向的,导致模型检查算法的图形复杂度指数高于ATL ⋆ 没有不确定性。
我们介绍 观点 -ATL公司 ⋆ ,它扩展了ATL ⋆ 使用两个新的路径量词, \(语言\!语言A\等级\!等级_P\)和 \(\langle\!\langleA\rangle\!\rangle_M\),该范围涵盖玩家在 A类 可以强制系统分别使用透视和无记忆策略。 我们解决了以下的模型检查问题 观点 -ATL公司 ⋆ 有两名球员,并表明它是2EXPTIME-完成的,就像ATL的一样 ⋆ 。对于仅使用 \(语言\!语言A\等级\!等级\)和 \(\langle\!\langle-A\rangle\!\rangle_P\)路径量词,我们算法的图形复杂度仅为多项式。 因此,处理横向不确定性比处理纵向不确定性容易得多。 另一方面,使用路径量词对固定大小公式进行模型检查 \(\langle\!\langle-A\rangle\!\rangle_M\)是NP-hard,这使得图的复杂性 观点 -ATL公司 ⋆ NP和co-NP都很难。从积极的方面来看,我们表明 观点 -ATL通过透视和无记忆路径量化扩展了ATL,模型检查在系统和规范中都是多项式的。 从本质上讲,这是因为满足ATL目标所需的策略是无记忆的,因此是透视的,等等 \(语言\!语言A\等级\!等级_P\)和 \(\langle\!\langle A\langle\!\langle_M\)与 \(\langle\!\langle\rangle\!\rangle\)。 这个 \(\langle\!\langle-A\rangle\!\rangle_M\)路径量词可以看作是回忆不完全的路径量词的特例,即当玩家 A类 没有不确定性,但记忆有限[ 52 ].
最后,我们研究了具有结构性获胜条件的视角博弈。 由于无记忆策略是透视图,因此具有允许无记忆策略的获胜条件的游戏的决策程序适用于透视图游戏。 这包括比奇、平价和拉宾条件。 对于不允许无记忆策略的广义Büchi和Streett条件,我们研究了 P(P) -策略并表明,虽然广义Büchi获胜条件并不总是允许无记忆策略,但它确实允许透视策略。 因此,具有广义Büchi条件的透视对策的解相当于求解具有完全可见性的对策。 另一方面,斯特雷特获胜的条件不允许采用透视策略。 尽管如此,我们仍然能够描述一种算法,该算法用于确定透视Streett游戏,其复杂性在Streett条件下成对数量上是指数的,并且在图中是多项式的。 我们使用允许透视策略的结构性获胜条件的特征,以指向在行为透视游戏中允许此类策略的LTL片段。
跳过2个人游戏部分 2 前瞻性游戏 A类 游戏图 是元组 \(G=langle AP,V_{1},V_}2},V_0,E,tau\rangle),其中 AP公司 是一组有限的原子命题, \(V_{1}\)和 \(V{2})是不相交的顶点集,由 玩家1 和 玩家2 ,然后我们让 \(V=V{1}\杯V{2}\)。 然后, \(v0\在v{1}\中)是一个初始顶点,我们假设它属于 玩家1 、和 \(E\subseteq V\乘以V\)是一个总边关系,因此对于每个 \(v\ in v\)有 \(v^{prime}\ in v\)这样 \(E中的v,v^{prime})。 功能 \(tau:V\rightarrow 2^{AP})将每个顶点映射到一组原子命题 大小 \第(|G|\)页,共页 克 是 \(|E|\),即其中的边数。在游戏开始时,在 \(v_0\)。 然后,在每一回合中,拥有代币所在顶点的玩家选择一个后续顶点并将代币移动到那里。 A类 玩 \(\rho=v_0,v_1,\ldots\)英寸 克 ,是中的无限路径 克 开始于 \(v0\); 因此 \(\langle v_i,v_{i+1}\langle\在E\中) \(第0页)。 这出戏 \(\rho\)引发 计算 \(τ(\rho)=τ(v_0),τ(v_1),在(2^{AP})^\omega\)中。 A类 游戏 是一对 \({\mathcal{G}}=langle G,L\rangle\),其中 克 是一个游戏图,并且 \(L\subseteq(2^{AP})^\omega\)是一个 行为获胜条件 ,即 \(\omega \)-原子命题上的正则语言,由LTL公式或自动机给出。 1 直觉上, 玩家1 目标是一部计算量很大的戏剧 L(左) ,同时 玩家2 目标是一部计算在 \({\it-comp}(L)=(2^{AP})^\omega\set-nuse-L\)。 从形式上讲,我们区分了不同类别的战略和参与者的目标,定义如下。 有时我们也指带有 构造获胜条件 .在那里, \(L\subseteq V^\omega)由 \(\omega)-常规获胜条件(例如,Büchi或平价)超过 V(V) 相应地,图表 克 可能不会被原子命题标记。
2.1 确定性设置 让 \({\sf-Prefs}(G)\)是 克 .对于序列 \顶点的(\rho=v_0,\ldots,v_n),让 \({\sf Last}(\rho)=v_n\)。 对于 \(j\in\lbrace 1,2\rbrace),让 \({\sf Prefs}_{j}(G)=\lbrace\rho\ in{\sf Prefs}(G):{\sf Last}(\rho)\ in V_j\rbrace\)。 因此, \({\sf Prefs}_{j}(G)\)是 \({\sf-Prefs}(G)\)由最后一个顶点位于 \(V_j\)。 A类 策略 对于 玩家 j个 是一个函数 \(f_j:{\sf Prefs}_{j}(G)\rightarrow V\)这样对于每个 \(在{\sf-Prefs}_{j}(G)中),我们有 \(\langle{\sf Last}(\rho),f_j(\rho)\rangle\ in E\)。 也就是说 玩家 j个 映射以顶点结束的播放的前缀 v(v) 她继承了 v(v) 。为了技术方便,我们添加了 \(\ε\)到 \({\sf Prefs}_{1}(G)\)并且需要所有策略 \第(f1)页,共页 玩家1 拥有 \(f1(epsilon)=v_0)。 因此,所有重头戏都以 玩家1 将令牌放置在 \(v_0\)。 这个 结果 两种策略 \(f1)和 \第(f_2\)页,共页 玩家1 和 玩家2 分别是当玩家遵循策略时获得的游戏 \(f1)和 \(第2页)。 正式地, \({\sf结果}(f1,f2)=v_0,v_1,\ldots\)是这样的 \(i \ge 0),如果 \(v_i\在v_j\中),然后 \(v{i+1}=f_j(v0,\ldots,v_i))。
上述定义假设双方都能充分了解其策略所产生的游戏。 我们现在考虑一个设置,其中 玩家 j个 仅限于她拥有的顶点。 请注意,自 玩家 j个 决定这些顶点中的继承者,她也知道对继承者的访问,即使她没有继承者。 形式上,对于前缀 \(\rho=v_0,\ldots,v_i\ in{\sf Prefs}(G)\)和 \(第1、2、2种族), 视角 玩家 j个 在 \(\rho\) ,表示 \({\sf-Persp}_j(\rho)\),是 \(\rho\)到顶点 \(v_j中的v_i)。 我们表示 玩家 j个 关于中的前缀 \({\sf前缀}_{j}(G)\)由 \({\sf PPrefs}_{j}(G))。 形式上, \({\sf PPrefs}_{j}(G)=\lbrace{\sf Persp}_j(\rho):\rho\在{\sf Prefs}_{j}(G)\rbrace中)。 请注意 \({\sf PPrefs}_{j}(G)\substeq V_j^*\)。 A类 透视策略 对于 玩家 j个 然后是一个函数 \(f_j:{\sf PPrefs}_{j}(G)\rightarrow V\)以便 \(在{\sf-PPrefs}_{j}(G)中),我们有 \(\langle{\sf Last}(\rho),f_j(\rho)\rangle\ in E\)。 也就是说,针对 玩家 j个 绘制她对以顶点结尾的剧本前缀的透视图 v(v) 她继承了 v(v) .视角策略的一个众所周知的特例是无记忆的:策略 \(f_j\)是 无记忆的 如果每个 \(\rho\in{\sf PPrefs}_{j}(G)\),我们有 \(f_j(\rho)\)仅取决于 \({\sf Last}(\rho)\)。 也就是说,如果不区分到达同一顶点的剧本的前缀,则策略是无记忆的。 请注意 玩家 j个 可以视为一个函数 \(f_j:V_j\右箭头V\)。
我们使用 F类 和 P(P) 指出策略的可见性类型,即它们是否已满( F类 )或观点( P(P) ). 考虑一个游戏 \({mathcal{G}}=langle G,Lrangle)。 对于 \(α,β在F种族,P种族),我们说 玩家1 \((\alpha,\beta)\)-获胜 \({\mathcal{G}}\) 如果有 \(阿尔法)-策略 \(f1)用于 玩家1 这样,对于每一个 \(测试版)-策略 \(f2)用于 玩家2 ,我们有 \(L中的tau({\sf结果}(f_1,f_2))。 同样, 玩家2 \((\alpha,\beta)\)-获胜 \({\mathcal{G}}\) 如果有 \(阿尔法)-策略 \(f2)用于 玩家2 这样,对于每一个 \(β)-策略 \(f1)用于 玩家1 ,我们有 \(L中的tau({\sf结果}(f_1,f_2)))。
示例1。 考虑游戏图 \(G_{mathit {m} 匹配 }\)出现在图中 1 .让 \({\mathcal{G}}=langle G_{\mathit {m} 匹配 },\varphi\rangle\)与 \(\varphi=\Box\,\Diamond\,((p\wedget\circ\circ p)\vee(q\wedged\circ q))。 因此, 玩家1 旨在计算包含无限多次窗体窗口出现的次数 \(p\cdot{\bf true}\cdot p\)或 \(q\cdot{\bf true}\cdot q\)。 很容易看出这一点 玩家1 \((F,F)\)-获胜 \({\mathcal{G}}\)。 的确,考虑一个策略 \(f1)用于 玩家1 她选择从 \(v_\#\)到 \(v_p\)每次访问 \(v_\#\)之前访问了 \(u_p\),并选择继续 \(v_q\)每次访问 \(v_\#\)之前访问了 \(u_q\)。 然后,对于每个策略 \第(f2)页,共页 玩家2 、计算 \(τ({\sf结果}(f1,f2))满足 \(\psi=\Box\,(((\$\wedge\circ p)\rightarrow\circ\circp)\wedge(\$\ wedge\circ q)\right arrow\ circ \(\varphi\)。 事实上, 玩家1 也 \((P,F)\)-获胜 \({\mathcal{G}}\)。 要了解这一点,请考虑一个策略 \(f^{\prime}_1\)用于 玩家1 她从中获利 \(v_\#\)到 \(v_p\)和 \(v_q\)交替。 也就是说,在对顶点的奇数访问中 \(v_\#\)她选择 \(v_p\),甚至在访问 \她选择了 \(v_q\)。 然后,对于每个策略 \(f^{\prime}_2\)用于 玩家2 、计算 \({\sf结果}(f^{prime}_1,f^{prime}_2) \(v_p\)后跟 \(u_\$,u_p\)或 \(u_\$,u_q,v_\#,v_q\),以及中的每次访问 \(v_q\)后跟 \(u_\$,u_q\)或 \(u_\$,u_p,v_\#,v_p),保证 \(\varphi\)满足要求。
图1。 游戏图\(G_{mathit {m} 匹配 }\)超过\(AP=\lbrace p,q,\#,\$\rbrace\)。 玩家1的顶点是圆,玩家2的顶点是方形。 初始顶点是\(v_{#}\)。
的获胜策略 玩家1 在示例中 1 假设完全可见 玩家2 。以下定理表明 玩家2 没关系。
定理2。 每一场比赛 \({\mathcal{G}}\),我们有 玩家1 \((F,F)\)-获胜 \({\mathcal{G}}\)iff 玩家1 \((F,P)\)-获胜 \({\mathcal{G}}\),以及 玩家1 \((P,F)\)-获胜 \({\mathcal{G}}\)iff 玩家1 \((P,P)\)-获胜 \({\mathcal{G}}\)。
证明。 让 \({\mathcal{G}}=\langle G,L\langle)。 首先,考虑 F类 或 P(P) 策略 \第(f1)页,共页 玩家1 ,并假设 \对于每一个 F类 -战略 \第(f2)页,共页 玩家2 显然, \对于每一个 P(P) -战略 \(f_2\)用于 玩家2 .
对于另一个方向,考虑 F类 或 P(P) 策略 \第(f1)页,共页 玩家1 ,并假设我们 \(tau({\sf结果}(f_1,f_2))不在L中) F类 -战略 \第(f2)页,共页 玩家2 .让 \(\rho={\sf结果}(f1,f2))。 我们定义了一个 P(P) -战略 \(f^{\prime}_2\)用于 玩家2 这样,对于每个前缀 \的(\rho^{\prime}\) \(\rho\)与 \({\sf Last}(\rho^{prime})在V_{2}中有 \(f^{prime}_2({\sf-Persp}_{2}(\rho^{prime}))=f2(\rho ^{primer})。 注意,对于每两个不同的前缀 \(\rho^{\prime},\rho_{\primes}\),共 \(\rho\)与 \({\sf最后}(\rho^{\prime})\), \({\sf Last}(\rho^{prime\prime})\在V_{2}\)中 \({\sf-Persp}_{2}(\rho^{prime})和 \({\sf-Persp}{2}(\rho^{prime\prime}))不同,因此 \(f^{prime}_2)是很好定义的。 现在,作为 \({\sf结果}(f_1,f^{prime}_2)={\sf成果}(f1,f_2) \(\tau({\sf结果}(f_1,f^{\prime}_2)),而不是在L\中),我们完成了。□
由于可见性类型为 玩家2 没关系,我们可以从符号中省略它。 即,针对 \(\alpha\in\lbrace F,P\rbrace\),我们说 玩家1 \(\alpha\)-获胜 \({\mathcal{G}}\)如果存在 \(阿尔法)-策略 \(f1)用于 玩家1 这样,对于每个策略 \(f2)用于 玩家2 (或 F类 或 P(P) ),我们有 \(\tau({\sf结果}(f_1,f_2))\在L\中)。
另一方面 玩家1 真的很重要。 那就是, F类 -战略 玩家1 严格来说比 P(P) -战略。 正式而言,我们有以下几点:
定理3。 有一个游戏 \({\mathcal{G}}\)这样 玩家1 F类 -获胜 \({\mathcal{G}}\)还没有 玩家1 不会 P(P) -获胜 \({\mathcal{G}}\)。
证明。 让 \({\mathcal{G}}=langle G_{\mathit {m} 匹配 },\psi\rangle\),带 \(\psi=\Box\,(((\$\wedget\circ p)\rightarrow\circ\circ p)\wedge(\$\ wedget\circ q)\right arrow\ circ\circ q))\)。 因此, \(\psi\)需要 玩家1 继续 \访问后(v_p\) \(u_p\)并继续 \访问后(v_q\) \(u_q\)。 在示例中 1 ,我们展示了 玩家1 F类 -获胜 \({\mathcal{G}}\)。 另一方面, 玩家1 不会 P(P) -获胜 \({\mathcal{G}})。 事实上,当 玩家1 具有洞察力,她可以在 \(v_p\)和 \(v_q)独立于 玩家2 因此,对于每个 P(P) -战略 \第(f1)页,共页 玩家1 ,有一个策略 \第(f2)页,共页 玩家2 这样的话 \(\psi\)在中不满足 \(τ({\sf结果}(f1,f2))。□
具有全可见性的游戏 已确定 也就是说,每场比赛 \({mathcal{G}}=langleG,Lrangle),或者 玩家1 拥有确保满足 L(左) ,或 玩家2 拥有确保满足 \({\it comp}(L)\)[ 18 , 44 ]. 在游戏中从定理的证明 三 、战略 \第(f2)页,共页 玩家2 不是赢,而是阻止 \(f1)获胜。 事实上,没有 玩家2 正在获胜。 正式而言,我们有以下几点:
证明。 考虑游戏图 \(G_{mathit {m} 匹配 }\),并让 \(\psi=\Box\,(((\$\wedget\circ p)\rightarrow\circ\circ p)\wedge(\$\ wedget\circ q)\right arrow\ circ\circ q))\)。 如上所述, 玩家1 不会 P(P) -获胜 \(语言G_ {m} 匹配 },\psi\rangle\)。 此外,作为 玩家1 做 F类 -获胜 \(语言G_ {m} 匹配 },\psi\rangle),我们有 玩家2 不会 P(P) -获胜 \(语言G_{mathit {m} 匹配 },我们完成了。□
2.2 概率设置 现在,我们将设置扩展为概率设置。 有限集上的概率分布 A类 是一个函数 \(\kappa:A\rightarrow[0,1]\)这样 \(a}\kappa(a)=1\中的sum_{a\)。 这个 支持 属于 \(\kappa\)是集合 \({\sf-Supp}(\kappa)=\lbrace a\ in a:\kappo(a)\gt 0\rbrace)。 我们表示为 \(mathcal{D}(A))上的概率分布集 A类 .A型 随机策略 对于 玩家 j个 是一个函数 \(g_j:{\sf Prefs}_{j}(g)\rightarrow\mathcal{D}(V)\)这样对于每个 \({\sf前缀}_{j}(G)中的\rho\) \(v\在{\sf-Supp}(g_j(\rho))中,我们有 \(\langle{\sf Last}(\rho),v\rangle\ in E\)。 透视随机策略 定义类似,如 \(g_j:{\sf PPrefs}_{j}(g)\rightarrow\mathcal{D}(V)\)。 安 事件 是一个可测量的集合 \计算的(L\substeq(2^{AP})^\omega\)。 给定(可能是透视)随机策略 \(g_1)和 \在两个参与者中,事件的概率是唯一定义的[ 32 ]. 直觉上,事件的概率 L(左) 是获得计算在 L(左) 。我们表示为 \(Pr_{g_1,g_2}(L)\)的概率 L(左) 当随机策略 \(g_1)和 \使用(g_2\)。 我们还使用 \(Pr_{g_1,g_2}(\psi)),对于LTL公式 \(\psi\),指事件 \(L(\psi)=\L滚道w:w\型号\psi\滚道\)。 众所周知 \(ω)-正则语言,因此也是LTL公式,是可测量的[ 55 ].
对于随机策略 \第(g_1\)页,共页 玩家1 ,我们这么说 \(g_1\)是一个 几乎获胜的战略 如果 \每个随机策略的(Pr_{g_1,g_2}(L)=1\) \第(g_2)页,共页 玩家2 与确定性情况一样,我们使用 F类 和 P(P) 指出随机策略是否具有全面或前瞻性可见性,并讨论 \((alpha,beta)-几乎赢了,因为 \(第F、P种族中的α、β)。
在双方球员都能看到的比赛中,众所周知 玩家1 如果她有获胜(确定性)策略[ 44 ]. 这不再适用于透视游戏:
定理5。 有一个游戏 \({\mathcal{G}}\)这样 玩家1 \((P,F)\)-几乎获胜 \({\mathcal{G}}\)还没有 玩家1 不会 P(P) -获胜 \({\mathcal{G}}\)。
证明。 让 \({\mathcal{G}}=langle G_{\mathit {m} 匹配 },θ_\#\rangle\),用于 \(\theta_\#=\Diamond\,((p\wedget\circ\#\wedged\circ\circ p)\vee(q\wedge\circ\#\wedge\ circ q))。 考虑随机 P(P) -战略 \第(g_1\)页,共页 玩家1 每当她访问顶点时 \(v_\#\),她移到继任者 \具有概率的(v_p\) \(\frac{1}{2}\)和继任者 \(v_q\)具有概率 \(\压裂{1}{2}\)。 很容易看出这一点 \(g_1\)是一个 \((P,F)\)-在 \({\mathcal{G}})。 然而,对于每个 P(P) -战略 \(f1)用于 玩家1 ,有一个策略 \(f2)用于 玩家2 这样的话 \(\rho({\sf结果}(f_1,f_2)))不满足 \(θ_\#\),因此 玩家1 不会 P(P) -获胜 \({\mathcal{G}})。□
在定理中 2 ,我们证明了在确定性博弈中 玩家2 没关系。 在概率设置中,这确实很重要。
定理6。 有一个游戏 \({\mathcal{G}}\)这样 玩家1 \((P,P)\)-几乎获胜 \({\mathcal{G}}\)还没有 玩家1 不会 \((P,F)\)-几乎获胜 \({\mathcal{G}}\)。
证明。 让 \({\mathcal{G}}=langle G_{\mathit {m} 匹配 },\theta_\$\rangle\),用于 \(\theta_\$=\Diamond\,((p\wedget\circ\$\wedged\circ\circ p)\vee(q\wedge\circ\$\wedge\ circ q))\)。 考虑战略 \定理证明中描述的(g_1) 5 。请注意 \(g_1\)是一个 \((P,P)\)-在 \({\mathcal{G}}\)。 事实上,对于每一个随机 P(P) -战略 \第(g_2)页,共页 玩家2 ,我们有 \(Pr_{g_1,g_2}(θ_\$)=1)。 另一方面,对于每一个随机 P(P) -策略 \(g^{\prime}_1\),共 玩家1 ,有一个 F类 -战略 \的(g^{\prime}_2\) 玩家2 这样的话 \(Pr_{g^{prime}_1,g^{prime}_2}(θ_\$)=0\)。 因此, 玩家1 没有 \((P,F)\)-在 \({\mathcal{G}})。□
最后,在确定性的情况下,可能没有玩家几乎赢了给定的透视游戏:
证明。 考虑游戏图 \(G_{mathit {m} 匹配 }\),然后让 \(\psi=\circ\circ\ circ((p\rightarrow\circ\scirc p)\楔形(q\right箭头\circ q))\)。 很容易看出这两者都不是 玩家1 几乎 P(P) -获胜 \(语言G_{mathit {m} 匹配 },\psi\rangle\)或 玩家2 几乎 P(P) -获胜 \(语言G_{mathit {m} 匹配 },范围)。□
2.3 透视交替时序逻辑 逻辑ATL ⋆ 为多代理系统中的计算提供选择性量化[ 5 ]. ATL中有两种类型的公式 ⋆ : 状态公式 ,其满意度与系统建模游戏中的特定顶点有关,以及 路径公式 ,其满意度与特定计算有关。 正式地说,是ATL ⋆ 状态公式是以下公式之一:
(S1)
第页 ,用于 \(AP中为p\)。
(S2)
\(\lnot\varphi _1)或 \(\varphi_1\vee\varphi_2\),其中 \(\varphi_1\)和 \(\varphi 2\)为ATL ⋆ 状态公式。
(S3)
\(\langle\!\langle A\langle\!\langle\psi\),其中 \(A\subseteq\lbrace\mbox{PLAYER~1},\mbox{PAYER~2}\rbrace\)是一组玩家和 \(\psi\)是ATL ⋆ 路径公式。
一个ATL ⋆ 路径公式是以下公式之一:
(第1页)
一个ATL ⋆ 状态公式。
(第2页)
\(\lnot\psi_1)或 \(\psi _1\vee\psi _2\),其中 \(psi 1)和 \(psi 2\)为ATL ⋆ 路径公式。
(第3页)
\(\circ\psi_1)或 \(\psi_1{\mathcal{U}}\psi_2\),其中 \(psi 1)和 \(psi 2\)为ATL ⋆ 路径公式。
逻辑ATL ⋆ 由规则生成的一组状态公式组成(S1–3)。 其他布尔连接词和时态运算符定义自 \(\不\), \(\版本\), \(\circ\),和 \({\mathcal{U}}\)以通常的方式; 特别地, \(\Diamond\,\psi\,=\,{\bf true}{\mathcal{U}}\psi\)和 \(\Box\,\psi\,=\,\lnot\Diamond\,\lnot \psi\.)。 同样,CTL是CTL的一部分 ⋆ ,逻辑ATL是ATL的片段 ⋆ 它由所有公式组成,其中每个时态操作符前面都紧接着一个路径限定符。 逻辑LTL由应用上述规则P1-3获得的路径公式组成,其中P1仅包含原子命题。
ATL的语义 ⋆ 是根据游戏图定义的 \(G=\langle AP,V_{1}\), \(V_{2}\), \(v_0\), \(E,tau\rangle)。 在定义语义之前,我们需要一些符号。 回想一下,给出了两种策略 \(f1)和 \第(f2)页,共页 玩家1 和 玩家2 分别定义 \({\sf结果}(f_1,f_2))作为通过出租获得的游戏 玩家1 和 玩家2 跟随 \(f1)和 \(f2)从初始状态 克 在这里,我们调整结果函数,以获得游戏开始的顶点和一组两个策略,每个玩家一个策略作为参数。 因此,给定一个顶点 v(v) 和一套 \({\mathcal{F}}=\l种族f1,f2种族),共 玩家1 和 玩家2 战略,我们定义 \({\sf结果}(v,{\mathcal{F}})=v^0,v^1,\ldots\),其中 \(v^0=v\)和所有 \(第1、2、2种族)和 \(i \ge 0),如果 \(v_j中的v^i\),然后 \(v^{i+1}=f_j(v^0,\ldots,v^i))。
我们写作 \(v\models\varphi)表示顶点 v(v) 满足状态公式 \(\varphi\)并写入 \(\rho\models\psi\)以指示该重头戏 \(\rho=\rho_0,\rho_1,\ldots\)满足路径公式 \(磅/平方英寸)。 对于 \(i \ge 0),让 \(\rho^i)表示后缀 \从位置(\rho\) 我 因此, \(\rho^i=\rho_i,\rho{i+1},\rho{i+2},\ ldots\)。 满意度关系 \为所有顶点定义了(\models\) v(v) 和游戏 \第(\rho\)页,共页 克 ,归纳如下:
(S1)
\(v\models p\),用于 \(AP中为p\),iff \(p\in\tau(v)\)。
(S2)
\(v\models\lnot\varphi_1)iff \(v\not\models\varphi_1),以及 \(v\models\varphi_1\vee\varphi_2)iff \(v\models\varphi_1)或 \(v\models\varphi 2\)。
(S3)
\(v\models\langle\!\langle A\rangle\!\rangle\psi\)如果存在集合 \({\mathcal{F}})策略,每个玩家一个 A类 ,对于所有集合 \策略的(tilde{{mathcal{F}}),每个不在 A类 以及所有剧本 \(在({\sf结果}(v,{{mathcal{F}}}\cup\tilde{{mathcal{F{}}))中,我们有 \(\rho\models\psi\)。
(第1页)
\状态公式的(\rho\models\varphi) \(\varphi\)iff \(\rho_0\models\varphi\)。
(第2页)
\(\rho\models\lnot\psi_1)iff \(型号),以及 \(\rho\models\psi_1\vee\psi_2)iff \(\rho\models\psi_1)或 \(\rho\型号\psi 2\)。
(第3页)
\(\rho\models\circ\psi_1)iff \(型号),以及 \(\rho\models\psi_1{\mathcal{U}}\psi_2)如果存在位置 \(i \ge 0)这样 \(\rho^i\models\psi_2)和所有位置 \(0\le j\lt i\),我们有 \(\rho^j\models\psi_1)。
例如,ATL ⋆ 公式 \(\langle\!\langle\mbox{PLAYER~1}\rangle\!\rangle((\Diamond\,\Box\,\lnot{\it-req})\vee(\Box\、\Diamone\,{\it-grant}))断言 玩家1 有一个强制计算的策略,其中要么只发送有限多个请求,要么提供无限多个授权。
逻辑 观点 -自动变速器 ⋆ 扩展ATL ⋆ 通过增强 \(\langle\!\langle-A\rangle\!\rangle)路径量词 A类 (根据定理 2 ,不在 A类 并不重要)。 除了 \(\langle\!\langle-A\rangle\!\rangle)对应于完全可见性,我们有路径限定符 \(语言\!语言A\等级\!等级_P\)和 \(\langle\!\langle-A\rangle\!\rangle_M\),其中策略分别是透视和无记忆的。 正式而言,我们有以下几点:
—
\(v\models\langle\!\langle A\rangle\!\rangle_P\psi\)如果存在集合 \的({\mathcal{F}}\) P(P) -策略,每个玩家一个 A类 ,对于所有集合 \(\波浪线{{\mathcal{F}}}\),共( F类 或 P(P) )策略,每个不在 A类 以及所有剧本 \(在({\sf结果}(v,{{mathcal{F}}}\cup\tilde{{mathcal{F{}}))中,我们有 \(\rho\models\psi\)。
—
\(v\models\langle\!\langle A\rangle\!\rangle_M\psi\)如果存在集合 \({\mathcal{F}}\)无记忆策略,每个玩家一个 A类 ,对于所有集合 \(\波浪线{{\mathcal{F}}}\),共 F类 -策略,每个不在 A类 以及所有剧本 \(在({\sf结果}(v,{{mathcal{F}}}\cup\tilde{{mathcal{F{}}))中,我们有 \(\rho\models\psi\)。
在 模型检验问题 对于 观点 -ATL公司 ⋆ ,我们得到了一个游戏图 克 和a 观点 -ATL公司 ⋆ 公式 \(\psi\),我们必须决定是否 \(v_0\型号\psi\)。
我们还考虑 观点 -ATL,它通过透视和无记忆路径量化扩展了ATL。
跳过3AUTOMATA节 三 AUTOMATA公司 给定一个集合 D类 方向,a D类 -树 是一套 \(T\subseteq D^{*}\)这样,如果 \(x\cdot c\ in T\),其中 \(D^{*}中的x\)和 \(D\中的c\),然后也 \(T\中的x\)。 的元素 T型 被称为 节点 和空单词 \(\varepsilon\)是 根 属于 T型 。对于每个 \(T\中的x\),节点 \(x\cdot c\),用于 \(c在D中),是 继承人 属于 x个 。调用没有后续节点的节点 叶子 .A型 路径 \树的(\pi\) T型 是一套 \(\pi\subseteq T\),以便 \(\varepsilon\in\pi\)和 \(x\in\pi\),或者 x个 是一片叶子还是有一个独特的 \(c在D中)这样 \(x\cdot c\in\pi\)。 给定一个字母表 \(\西格玛\),a \(\Sigma\)-标记 D类 -树 是一对 \(langle T,tau rangle)其中 T型 是一棵树 \(\tau:T\rightarrow\Sigma\)映射 T型 到中的一封信 \(\西格玛\)。
对于一组 X(X) ,让 \({{\mathcal{B}}}^{+}(X)\)是上的正布尔公式集 X(X) (即,从中的元素构建的布尔公式 X(X) 使用 \(\楔子\)和 \(\vee\)),其中我们还允许公式 \({\bf true}\)和 \({\bf false}\)。 对于一组 \(Y\substeq X\)和一个公式 \(在{{mathcal{B}}^{+}(X)中的θ),我们说 年 满足 \(θ)iff赋值 \({\bf true}\)到中的元素 年 并分配 \({\bf false}\)到中的元素 \(X\设置减去Y\)使 \(θ)为真。 安 交替树自动机 是 \({\mathcal{A}}=\langle\Sigma,D,Q,Q_{in},\delta,\alpha\langle\),其中 \(\Sigma\)是输入字母, D类 是一组方向, 问 是一组有限的状态, \(delta:Q\times\Sigma\rightarrow{{mathcal{B}}^+(D\timesQ))是一个转换函数, \(q_{in}\ in q\)是初始状态,并且 \(\alpha\)指定验收条件(定义 \(Q^\omega\); 我们在下面定义了几种验收条件)。 对于一个州 \(q\在q\中),我们使用 \({\mathcal{A}}^q\)表示从 \({\mathcal{A}}\),方法是将初始状态设置为 q个 . The大小 属于 \({\mathcal{A}}\),表示 \(|{\mathcal{A}}|\),是出现在 \(\增量\)。
交替自动机 \({\mathcal{A}}\)运行于 \(\西格玛\)-标记 D类 -树木。 A类 运行 属于 \上的({\mathcal{A}}\) \(\Sigma\)-标记 D类 -树 \(langle T,taurangle)是一个 \((T\倍Q)\)-标记 \(\box{I$\!$N}\)-树 \(\langle T_r,r)。 的每个节点 \(T_r)对应于的节点 T型 .中的节点 \(T_r),标记为 \((x,q)\),描述读取节点的自动机的副本 x个 属于 T型 并访问该州 q个 。请注意 \(T_r)可以对应于 T型 。节点及其后续节点的标签必须满足转换函数。 正式地, \(\langle T_r,r\rangle\)满足以下条件:
(1)
\(r(\varepsilon)=\langle\varepsilon,q_{in}\langle\)。
(2)
让 \(y\在T_r中) \(r(y)=langle x,q rangle)和 \(δ(q,τ(x))=θ)。 然后有一个(可能是空的)集合 \(S=\l种族(c0,q_0),(c1,q_1)\), \(\ldots\), \(((c_{n-1},q_{n-1})\rbrace\substeq D\times q\),这样 S公司 满足 \(θ),以及所有 \(0\lei\len-1),我们有 \(y\cdot i\ in T_r)和 \(r(y\cdot i)=\langle x\cdot c_i,q_i\rangle\)。
例如,如果 \(langle T,taurangle)是一个 \(\lbrace 0,1\rbrace)-树 \(\tau(\varepsilon)=a)和 \(delta(q{in},a)=((0,q_1)\vee(0,q _2))\wedge((0、q_3)\ve(1,q_2)),然后在级别1上运行 \(\langle T_r,r\rangle\)包括标记为 \((0,q_1)\)或标记为的节点 \((0,q_2)\),并包括标记为 \((0,q3)\)或标记为的节点 \((1,q_2)\)。 请注意,如果 年 ,过渡函数 \(\delta\)具有值 \({\bf true}\),然后 年 不需要有继任者。 也, \(\delta\)永远不能有值 \({\bf false}\)。
跑步 \如果(\langle T_r,r\rangle\)的所有无限路径都满足接受条件,则接受。 跑步 \(\langle T_r,r\rangle)和无限路径 \(\pi\subseteq T_r),让 \(\inf(\pi)\subseteq Q)是这样的 \(q\in\inf(\pi)\)当且仅当存在无穷多 \(y\in\pi\),其中 \(r(y)\在T\times\lbrace q\rbrace中)。 那就是, \(\inf(\pi)\)正好包含在 \(\pi\)。 我们在此考虑三个验收条件,定义如下。 一条路 \(\pi\)满足:
—
一 比奇 条件 \(alpha\subseteq Q)当且仅当 \(\inf(\pi)\cap\alpha\ne\emptyset\)。
—
一 co-Büchi公司 条件 \(alpha\subseteq Q)iff \(\inf(\pi)\cap\alpha=\emptyset\)。
—
一 奇偶校验 条件 \(\alpha:Q\rightarrow\lbrace 1,\ldots,k\rbrace)iff最小颜色 \(i\in\lbrace 1,\ldots,k\rbrace),其中 \(\inf(\pi)\cap\alpha^{-1}(i)\ne\emptyset\)为偶数。 数字 k个 中的颜色 \(\alpha\)称为 指数 自动机。
—
一 拉宾 条件 \(alpha=\lbrace\langle\alpha_1,\beta_1\rangle,\ldots,\langle\α_k,\beta _k\rangle\rbrace\subseteq 2^Q\times 2^Q)iff \(1)我们有 \(\inf(\pi)\cap\alpha _i\ne\emptyset\)和 \(\inf(\pi)\cap\beta _i=\emptyset\)。
对于这三个条件,如果存在接受树的运行,则自动机接受树 \(L({{\mathcal{A}})\)所有 \(\Sigma\)-标记 D类 -树木 \({\mathcal{A}}\)接受。
下面我们讨论交替自动机的一些特殊情况。 交替自动机 \({\mathcal{A}}\)是 不确定性的 如果对于中出现的所有公式 \(\delta\),如果 \((c_1,q_1)和 \((c2,q2))是结膜相关的,那么 \(c1\ne c2\)。 (即,如果转换以析取范式重写,则最多有一个元素 \(\lbrace c\rbrace\times Q\),对于每个 \(c在D中),在每个析取中)。 自动机 \({\mathcal{A}}\)是 普遍的 如果中出现的所有公式 \(δ)是 \(D乘以Q),以及 \({\mathcal{A}}\)是 确定性 如果它既不确定又普遍。 自动机 \({\mathcal{A}}\)是一个 单词 自动机,如果 \(|D|=1\)。 那么,我们可以省略 D类 从自动机的规范出发,表示 \({\mathcal{A}}\)作为 \(delta:Q\times\Sigma\rightarrow{{mathcal{B}}^+(Q)\)。 如果单词automaton是不确定的或通用的,那么 \(delta:Q\times\Sigma\rightarrow 2^Q\),我们经常扩展 \(delta)到状态集和有限字:for \(S\subseteq Q\),我们知道了 \(\delta(S,\epsilon)=S\)和单词 \(w\in\Sigma^*\)和一个字母 \(\sigma\in\sigma\),我们有 \(δ(S,w\cdot\sigma)=δ(δ(S,w),\sigma))。 有时,我们对通过访问一些 \(alpha\subseteq Q\)。 为此,我们定义 \(\delta_{\alpha}:2^Q\times\Sigma^+\rightarrow 2^Q\)如下。 首先, \(δ_{\alpha}(S,\sigma)=δ(S,\sigma)\cap\alpha\)。 那么,说一句话 \(w\in\Sigma^+\),我们定义 \(delta_{\alpha}(S,w\cdot\sigma)=\delta(\delta_}\alpha}(S,w),\sigma)\cup(\delta。 因此,要么 \在运行的前缀中访问(\alpha\),该前缀读取 w个 离开后 S公司 ,或运行的最后状态为 \(\alpha\)。 不难通过归纳法证明 w个 对所有州来说 \(在q中),我们有 \(q\in\delta_{\alpha}(S,w)\)if存在从 S公司 在 w个 达到 q个 和访问 \离开后(\阿尔法\) S公司 最后,我们说 \(\Sigma\)-标记 D类 -树 \(语言T,taurangle)是 有规律的 如果是所有信件 \(\sigma\in\sigma\),我们有 \(\tau^{-1}(\sigma))是 D类 。请注意,常规树可以由 \((D,\西格玛)\)- 传感器 :确定性自动机 D类 每个州都用一个字母标记 \(\西格玛\)。 然后, \(τ(x)),对于节点 \(x\在D^*\中)是标记传感器状态的字母,通过读取可以达到该状态 x个 .
我们用三个字母缩写来表示每种不同类型的自动机 \(种族D、N、U、A\rbrace\times\lbrace B、C、P、R\rbrace\times\lbrace W、T\rbrace),其中第一个字母描述自动机的分支模式(确定性、非确定性、通用或交替),第二个字母描述接受条件(Büchi、co-Büchi、奇偶性或拉宾), 第三个字母描述了自动机运行的对象(单词或树)。 例如,APT是交替奇偶树自动机,UCT是通用co-Büchi树自动机。
跳过确定性设置部分中的4个指导行为前瞻性游戏 4 确定性环境中的决策行为前瞻性游戏 在本节中,我们研究决定是否 玩家1 在给定的行为游戏中具有获胜的视角策略,因此其中获胜条件由自动机或LTL公式给出。 我们还研究了 观点 -ATL公司 ⋆ 模型检查问题。
4.1 泛自动机的上界 考虑一个游戏图 \(G=语言AP,V{1},V{2},E,V_0,tau\rangle)。 对于顶点 \(v\在v_{2}\中),a \((V_{2}^+\cdot V_{1})\)-来自的路径 v(v) 是有限路径 \(v{2}^+\cdot v{1}中的v_1、v_2、\ldot、v_k) 克 这样的话 \(v_1=v\)。 A类 \(V_{2}^\omega\)-来自的路径 v(v) 是一条无限路径 \(v_1,v_2,\ldots\in v_{2}^\omega\)in 克 这样的话 \(v_1=v\)。 什么时候? 玩家1 将标记移动到顶点 \(v\在v_{2}\中),标记可以遍历 \((V_{2}^+\cdot V_{1})\)-路径 \(\rho\)来自 v(v) ,在这种情况下返回 \(V_{1}\)英寸 \({\sf Last}(\rho)\),或者它可以遍历 \(V_{2}^\omega\)-路径自 v(v) ,在这种情况下,它永远不会返回到中的顶点 \(V_{1}\)。
考虑UCW \({\mathcal{U}}=\langle2^{AP},Q,Q_0,delta,alpha\rangle)和一个状态 \(q\中的q\)。 假设标记位于某个顶点 \(v{1}中的v\)以及 玩家1 是强制令牌在中进行计算 \(L({\mathcal{U}}^q)\)。 进一步假设 玩家1 选择将标记移动到后续标记 \(v^{prime}\)的 v(v) 。我们区分两种可能性。
—
\(v_{1}\中的v^{\prime}\)。 然后 玩家1 是从强制令牌 \(v^{\prime}\)转换为中的计算 \(L({\mathcal{U}}^{q^{\prime}})\),用于所有状态 \(q^{\prime}\in\delta(q,\tau(v))\)。
—
\(在v{2}中为v^{prime})。 然后,我们区分两种情况。
–
有一个 \(V_{2}^\omega\)-路径 \(\rho\)来自 \(v^{prime}\)和 \(tau(\rho)不在L({\mathcal{U}}^{q^{prime}})中 \(q^{prime}\ in \ delta(q,tau(v))\)。 然后我们说 \(v^{\prime}\)是一个陷阱 \(语言v,q语言) 的确, 玩家2 可以留在顶点中 \(V_{2}\)并强制令牌进入不在 \(L({\mathcal{U}}^{q^{prime}})\),确保 玩家1 不满意。
–
\(v^{\prime}\)不是的陷阱 \(langle v,q rangle),在这种情况下,对于每个 \((V_{2}^+\cdot V_{1})\)-路径 \(\rho\cdot v^{\prime\prime}\)来自 \(v^{prime}\), 玩家1 应强制放置一个令牌 \(v^{\prime\prime}\)到中的计算 \(L({\mathcal{U}}^{q^{prime}})\),用于所有状态 \(q^{\prime}\ in \delta(q,\tau(v)\cdot\tau,\rho))。
上述直觉激发了以下定义 更新的目标 一双 \(langle v,q rangle in v_1乘以q),代表目标 玩家1 强制放置令牌 v(v) 接受方 q个 ,还有一个选择 \(v)的继承人 v(v) ,我们定义集合 \(S^{v^{prime}}{v,q}\subseteq(v\timesQ\times\lbrace\bot,top\rbrace)\cup\lbrace{{false}}\rbrace\)更新的目标–这些目标 玩家1 必须满足才能满足她 \选择后的(langle v,q)目标 \(v ^{\prime}\)。 这个 \更新的目标中的(\lbrace\bot,\top\rbrace)标记用于跟踪中的访问 \(阿尔法):更新的目标 \(S^{v^{prime}}_{v,q}中的(langlev^{prime\prime},q^{primer},c\rangle)有 \(c=\top\)如果 玩家2 可以强制访问 \当 \({\mathcal{U}}\)从 q个 到 \(q^{prime}\)沿着标记路径的单词 v(v) 通过 \(v ^{\prime}\)到 \(v ^{\prime\prime}\)。 在形式上,我们定义 \(S^{v^{prime}}{v,q})如下。 首先,如果 \(v^{\prime}\)是一个陷阱 \(langle v,q rangle),然后 \(S^{v^{\prime}}_{v,q}=\lbrace{{false}}\rbrace)。 的确,曾经 玩家1 选择作为陷阱的顶点 \(兰格尔v,q兰格尔),她无法实现她的目标。 否则, \(S^{v^{prime}}_{v,q}\subseteq(v\times q\times\lbrace\bot,\top\rbrace))和一个三元组 \(\langle v^{prime\prime},q^{prime},c\rangle)位于 \(S^{v^{\prime}}_{v,q}\)如果下列条件之一成立:
—
\(v^{\prime}\在v_{1}\中), \(v^{prime\prime}=v^{prime}),以及 \(q^{prime}\ in \ delta(q,tau(v))\)。 然后, \(c=\top\)iff \(q^{prime}\in\alpha\)。
—
\(v^{\prime}\在v_{2}\中),有一个 \((V_{2}^+\cdot V_{1})\)-路径 \(\rho\cdot v^{\prime\prime}\)来自 \(v^{prime}\),以及 \(q^{\prime}\ in \delta(q,\tau(v)\cdot\tau,\rho))。 然后, \(c=\top\)如果存在 \((V_{2}^+\cdot V_{1})\)-路径 \(\rho\cdot v^{\prime\prime}\)来自 \(v ^{\prime}\)使得 \(q^{\prime}\in\delta_\alpha(q,tau(v)\cdot\tau(\rho)))。
请注意,可能是 \(v^{\prime}\)不是的陷阱 \(\langle v,q\rangle),但没有 \((V_{2}^+\cdot V_{1})\)-来自的路径 \(v^{prime}\)。 也就是说,所有来自 \(v^{\prime}\)停留在顶点中 \(V_{2}\)和位于 \(L({\mathcal{U}}^{q^{prime}})\)代表全部 \(q^{prime}\ in \ delta(q,tau(v))\)。 然后, \(S^{v^{\prime}}{v,q}=\emptyset\)。
定理8。 让 \({\mathcal{G}}=\langle G,{\matchal{U}}\rangle\)是一个游戏,其中 克 是一个游戏图 \({\mathcal{U}}\)是一个UCW。 我们可以建造一个UCT \({\mathcal{A}}_{\mathcal{G}}\)结束 V(V) -标签 \(V_{1}\)-树,以便 \({\mathcal{A}}_{\mathcal{G}}\)接受 V(V) -标签 \(V_{1}\)-树 \(语言V_{1}^*,eta\rangle)iff \(langle V{1}^*,eta rangle)获胜 P(P) -战略 玩家1 .的大小 \({\mathcal{A}}_{\mathcal{G}}\)是中的多项式 \(|G|\)和 \(|{\mathcal{U}}|\)。
证明。 让 \({\mathcal{U}}=\langle2^{AP},Q,Q_0,\delta,\alpha\rangle\)。 我们定义 \({\mathcal{A}}_{\mathcal{G}}=langle V,V_{1},Q^{prime},Q^{primer}_0,delta^{primes},alpha^{prime}),其中
—
\(Q^{\prime}=V\次Q\times\lbrace\bot,\top\rbrace\)。 凭直觉,当 \({\mathcal{A}}_{\mathcal{G}}\)处于状态 \(langlev,q,c\rangle),它接受强制放置令牌的策略 v(v) 被接受的计算 \({\mathcal{U}}^q\)。
—
\(q^{\prime}_0=\langle v_0,q_0,\bot\rangle\)。
—
对于所有人 \(语言v,q,b等级\in v\times q\times\lbrace\bot,\top\rbrace\)和字母 \(v^{prime}\ in v\),如果 \(S_{v,q}^{v^{prime}}=\lbrace{{false}}\rbrace)或 \(不是E(v,v^{prime})),然后 \(delta^{prime}(langlev,q,b\rangle,v^{primer})={{false}})。 否则, \(在S_{v,q}^{v^{prime}}(v^{rime\prime},v^{prime})中,开始{等式*}\delta^{prime}=\bigbedge_{\langlev^{\prime\prime},q^{\prime}、c\rangle\。 \结束{方程式*}\) 因此,对于每一个更新的需求 \(语言v^{prime\prime},q^{prime},c\rangle\在S_{v,q}^{v^{prime}}\中),自动机在状态下发送一个副本 \(langle v^{prime\prime},q^{prime},c\rangle)指向方向 \(v^{prime\prime}\)。 请注意,可能会向同一方向发送多个更新的需求。 的确,不同 \((V_{2}^+\cdot V_{1})\)-来自的路径 \(v^{prime}\)可能会引出不同的单词 \({\mathcal{U}}\)从读取 q个 此外,由于 \({\mathcal{U}}\)是通用的,它可以发送不同状态的副本,即使是单个单词。 注:; 然而,所有州都被派往 \(v^{\prime\prime}\)同意 V(V) -元素,它是 \(v^{prime\prime}\)。 还要注意,当 \(S^{v^{\prime}}{v,q}=\emptyset\),我们得到 \(delta^{prime}(langlev,q,b\rangle,v^{prime})={bf-true})。
—
\(\alpha^{\prime}=V\times Q\times\lbrace\top\rbrace\)。 回想一下 \(\top\)标志表示 玩家2 可能会到达 问 -遍历访问路径的更新需求中的元素 \(\alpha\)。 因此,co-Büchi要求访问 \(alpha)只有有限多次才能达到访问州的要求 \(\top\)仅有限次。
□ 定理9。 让 \({\mathcal{G}}=\langle G,{\mathcal{U}}\langle)是一个游戏,其中 克 是一个游戏图 \({\mathcal{U}}\)是一个UCW。 我们可以建造一个NBT \({\mathcal{A}}^{prime}_{\matchal{G}}\)over V(V) -标签 \(V_{1}\)-树,以便有一个获胜 P(P) -战略 玩家1 在里面 \({\mathcal{G}}\)iff \(L({\mathcal{A}}^{\prime}_{\mathcal{G}})\)不为空。 的大小 \({\mathcal{A}}^{prime}_{\matchal{G}}\)是中的多项式 \(|G|\)和指数 \(|{\mathcal{U}}|\)。
证明。 根据定理 8 ,我们可以建造一个UCT \({\mathcal{A}}_{\mathcal{G}}\)结束 V(V) -标签 \(V_{1}\)-树,以便 \(L({\mathcal{A}}_{\mathcal{G}})\)不为空 P(P) -战略 玩家1 在里面 \({\mathcal{G}}\)。 的大小 \({\mathcal{A}}_{\mathcal{G}}\)是中的多项式 \(|G|\)和 \(|{\mathcal{U}}|\)。 从 \({\mathcal{A}}_{\mathcal{G}}\)到 \({\mathcal{A}}^{prime}_{\mathcal{G}}\)可以通过以下方法完成[ 39 ]. 下面我们分析结构,并说明 \({\mathcal{A}}_{\mathcal{G}}\)在 V(V) 组件表示它是多项式 \(|G|\)和指数 \(|{\mathcal{U}}| \)。
对于 \(k \ge 1),我们表示 \([k]=\lbrace 1,\ldots,k\rbrace\)。 中的施工[ 39 ]改造UCT \({mathcal{A}}_{mathcal{G}}=langle V,V{1},Q^{prime},Q^{prime}_0,delta^{primes},alpha^{primer})到NBT \带状态的({\mathcal{A}}^{\prime}_{\mathcal{G}}\) \(S=2^{Q^{\prime}\times[k]}\times 2^{Q^{\prime}\times[k]}\),其中 k个 是这样的 \(|Q^{\prime}|\cdot k\)限定了NRT的大小,它等价于 \({\mathcal{A}}_{\mathcal{G}}\),在 \(|Q^{prime}|\)。 此外,对于每个州 \(语言P,语言S),我们有 \(O\subseteq P\),如果 \(语言q,i语言)和 \(\langle q^{\prime},i^{\prime}\langle)在 P(P) 具有 \(q=q^{prime}\),然后 \(i=i^{prime}\)。 因此 S公司 可以写成 \(2^{Q^{\prime}}\乘以2^{Q^{\prime}}\times{{\mathcal{F}}\),其中 \({{\mathcal{F}}\)是函数集 \(f:Q^{\prime}\rightarrow[k]\)。 回忆一下UCT的状态 \({\mathcal{A}}_{\mathcal{G}}\)是 \(Q^{\prime}=V\次Q\times\lbrace\bot,\top\rbrace\),并且 \({\mathcal{A}}_{\mathcal{G}}\)在 V(V) -组件。 因此 \NRT的({\mathcal{A}}_{\mathcal{G}}\)是中的多项式 \(|G|\)和指数 \(|{\mathcal{U}|\),因此 k个 是中唯一的多项式 \(|G|\)。 此外,对于每个 \(语言P,O语言S),如果 \(语言v、q、c、i)和 \(语言v^{prime},q^{prime},c^{primer},i^{primes})位于 P(P) ,然后从 \({\mathcal{A}}_{\mathcal{G}}\)在 V(V) -组件,我们有 \(v=v^{prime}\)。 因此 S公司 可以写成 \(V\times 2^{Q\times\lbrace\bot,\top\rbrace\times 2^{Q\times \lbrace\bot,\top\rbrace}\times{\mathcal{F}}),其中 \({{\mathcal{F}}\)是函数集 \(f:Q\times\lbrace\bot,\top\rbrace\rightarrow[k]\)。 因此, \(|S|\)是中的多项式 \(|G|\)和指数 \(|{\mathcal{U}|\)。□
由于NBT的非空问题 \({mathcal{A}})可以在二次时间内求解[ 56 ],我们可以返回一个大小为 \(O(|{\mathcal{A}}|)\)证明了非空性,我们可以得出一个上限:
推论10。 决定是否 玩家1 P(P) -在透视游戏中获胜 \(\langle G,{\mathcal{U}}\rangle\)用于UCW \({\mathcal{U}}\)位于EXPTIME中。 这个问题可以用时间多项式在 \(|G|\)和指数 \(|{\mathcal{U}}|\)。 此外,当 玩家1 P(P) -如果获胜,算法将返回见证 P(P) -利用尺寸多项式换能器的策略 \(|G|\)和指数 \(|{\mathcal{U}}|\)。
然而,正如我们在第节中所示 4.3 ,UCW足够强大,可以对LTL中的目标进行推理,我们现在显示出推论 10 事实上,当UPW给出目标时,也适用。
定理11。 决定是否 玩家1 P(P) -在透视游戏中获胜 \UPW的(langle G,{mathcal{U}}) \({\mathcal{U}}\)位于EXPTIME中。 这个问题可以用时间多项式在 \(|G|\)和指数 \(|{\mathcal{U}}|\)。 此外,当 玩家1 P(P) -如果获胜,算法将返回见证 P(P) -利用尺寸多项式换能器的策略 \(|G|\)和指数 \(|{\mathcal{U}}|\)。
证明。 在定理的证明中 8 ,我们构建了一个UCT,其中更新的目标包括 \(\lbrace\bot,\top\rbrace\)表示在co-Büchi条件下的访问。 当UPW给出目标时 \({\mathcal{U}}),我们定义更新的目标以包括访问的最小颜色。 那就是, \(S^{v^{prime}}_{v,q}\substeq(v\timesQ\times\lbrace 1,\ldots,k\rbrace)\cup\lbrace{false}}\rbrace\),其中 k个 是的索引 \({\mathcal{U}}\)是这样一个更新的目标 \(\langle v^{prime\prime},q^{prime},c\rangle)位于 \(S^{v^{prime}}_{v,q}\)如果 玩家2 可以强制进行磨合 \({\mathcal{U}}\)来自 q个 到 \(q^{prime}\)中,沿着标记路径的单词访问的最小颜色 v(v) 通过 \(v ^{\prime}\)到 \(v^{\prime\prime}\)是 c(c) 然后,通过类似于定理证明中的结构 8 ,我们获得UPT \({\mathcal{A}}_{\mathcal{G}}\)结束 V(V) -标签 \(V_{1}\)-树,以便 \({\mathcal{A}}_{\mathcal{G}}\)接受 V(V) -标签 \(V_{1}\)-树 \(语言V_{1}^*,eta\rangle)iff \(langle V_{1}^*,eta\rangle)获胜 P(P) -战略 玩家1 .的大小 \({\mathcal{A}}_{\mathcal{G}}\)是中的多项式 \(|G|\)和 \(|{\mathcal{U}}|\)。 由[ 39 ],UPT空度可以通过多项式放大降为UCT空度。 2 因此,我们可以获得UCT \中大小多项式的({\mathcal{A}}^{\prime}_{\matchal{G}}\) \(|G|\)和 \(|{\mathcal{U}|\),这样 \({\mathcal{A}}^{prime}_{\matchal{G}}\)接受 V(V) -标签 \(V_{1}\)-树 \(\langle V_{1}^*,\eta\langle \)iff \(langle V_{1}^*,eta\rangle)获胜 P(P) -战略 玩家1 与UPT类似 \({\mathcal{A}}_{\mathcal{G}}),UCT \({\mathcal{A}}^{prime}_{\mathcal{G}}\)在 V(V) -组件。 因此,我们可以转换UCT \({\mathcal{A}}^{prime}_{\mathcal{G}}\)到NBT \用[ 39 ]如定理证明所示 9 .的大小 \({\mathcal{A}}^{\prime\prime}_{\mathcal{G}}\)是中的多项式 \(|G|\)和指数 \(|{\mathcal{U}}|\)。 现在,该主张源于这样一个事实,即NBT的非空性问题可以在二次时间内解决[ 56 ],我们可以返回一个大小为 \(O(|{\mathcal{A}}^{\prime\prime}_{\matchal{G}|)见证了非空性。□
4.2 确定性自动机的下界 我们显示了EXPTIME下限 共同安全 规格。 安 \(\omega\)-常规语言 L(左) 如果每个字都是安全的 \(w\in\Sigma^\omega\),如果 \(w\ in L\),然后 w个 有前缀 x个 这样的话 \(x\cdot y\ in L\)表示所有 \(y\in\Sigma^\omega\)[ 4 ]. 很容易看出,协同安全语言可以被DBW识别,DBW的唯一状态是 \(\alpha\)是一个接受接收器,类似地,DCW的唯一状态不在 \(\alpha\)是一个接受接收器。 这种自动机处于瓦格纳层次结构的底部[ 58 ],它们被称为 弱小的[ \(-\)+] 自动机,表示自动机是弱的,至多有一次从拒绝组件到接受组件的转换,我们表示确定性弱[ \DWW的(-\)+]字自动机[ \(-\)+].
定理12。 让 \({\mathcal{G}}=\langle G,{\matchal{A}}\rangle\)是一个游戏,其中 克 是一个游戏图 \({\mathcal{A}})是DWW[ \(-\)+]. 决定是否 玩家1 有一场胜利 P(P) -中的策略 \({\mathcal{G}}\)是EXPTIME-hard。 此外,对于固定大小,它已经是EXPTIME-hard 克 .
证明。 我们显示了线性空间ATM的成员资格问题的减少。 ATM是元组 \(M=语言Q_e,Q_u,\Sigma,\Gamma), \(\增量\), \(q_{\it-init}\), \(q_{\it acc},q_{\it rej}\rangle\),其中 \(Q_e)和 \(Q_u\)是 存在的 和 普遍的 国家,我们让 \(Q=Q_e\杯Q_u\)。 然后, \(西格玛)和 \(\Gamma\)分别是输入字母和工作字母 \(\Sigma\subseteq\Gamma),以及 \(Delta\subseteq Q\times\Gamma\times Q\times Gamma\temes\lbrace L,R\rbrace)是一个转换关系。 最后, \(q{初始化},q{访问}),以及 \(q{\it-rej}\)分别是初始状态、接受状态和拒绝状态,我们假设 \(在q_e中为q_{init}\)。 在会员问题中,我们得到一个ATM作为输入 M(M) 和一个输入词 \(w\in\Sigma^*\),我们决定是否 M(M) 接受 w个 .
的配置 M(M) 描述其状态、工作磁带上的内容以及读取头的位置。 自 M(M) 是线性空间ATM,有一些线性函数 \(p:\nbox{I$\!$N}\rightarrow\mbox{I$\!$N{),以便工作磁带在每个配置中使用的单元格数 M(M) 运行时 w个 以为界 \(p(|w|)\)。 我们描述了 M(M) 一句话 \(u\cdot q\cdot\gamma\cdot v\),用于 \(u,v\in\Gamma^*\), \(\gamma\in\gamma\),以及 \(q\中的q\)。 然后, M(M) 处于状态 q个 ,磁带的内容是 \(u\cdot\gamma\cdot v),读取头指向 \(伽玛射线)。 的初始配置 M(M) 在 w个 ,则为 \(q_{\it init}\cdot w\cdot\texttt{}\^{p(|w|)-|w|}\),用于特殊字母 \(\texttt{}\在\Gamma\中)。 如果当前状态为 \(q_{\it acc}\)或 \(q{\it-rej}\),则配置是最终的,没有后续配置。 否则,配置的后续项 \(u\cdot q\cdot\gamma\cdot v)由以下公式确定 \(\增量\)。 对于每个元组 \(\langleq,\gamma,q^{prime},\gama^{primer},d\rangle\in\Delta\),有一个通过移动到状态获得的后续配置 \(q^{\prime}\),写入 \(\gamma^{\prime}\)而不是 \(\gamma\),并将头部向左或向右移动一个单元格,具体取决于 d日 .如果 \(q\在q_e\中),配置为 存在的 、和 M(M) 可以选择后续配置并从中继续运行。如果 \(q\在q_u\中),配置为 普遍的 、和 M(M) 从所有后续配置继续。 因此 M(M) 在 w个 导出顶点为 M(M) 的配置,以及 w个 被接受iff 玩家1 在与存在配置相关联的顶点中进行,有一个策略可以从可达性游戏中的初始配置中取胜,该游戏的目标是与配置关联的顶点 \(q_{\it acc}\)。 线性空间ATM的成员资格问题已经很难解决了 M(M) 固定大小,并且当 \(Delta)存在状态和普遍状态之间的交替[ 15 ],因此 \(\Delta\subseteq(Q_e\times\Gamma\ times Q_u\times\Gamma\ times\lbrace L,R\rbrace)\cup(Q_u\ times\Gamma\ times Q_e\times\Gamma\times\ lbrace L.,R\br race)\)。
上面描述的游戏图假设 F类 -战略及其规模在 \(|w|\)。 我们减排的最大挑战是使用 P(P) -策略,以便使用固定大小的图形。 我们首先描述了约简的主要思想,然后对其进行形式化描述。 的顶点 玩家1 将维护有关上次转换的信息(尤其是 M(M) ),但没有关于磁带内容的信息。 的顶点 玩家2 将维护有关上次转换的信息(尤其是 M(M) )和磁带头下的字母。 在每个 玩家1 反过来,她选择了 \(\增量\),对应于当前状态和字母,并移动到 玩家2 相应的顶点。 由于当前字母没有编码在 玩家1 的顶点,那么 玩家1 可能会撒谎,但DWW[ \(-\)+]会确保她输掉比赛。 此外 玩家2 顶点 玩家1 选择移动必须与当前字母对应。 同样,如果 玩家1 然后是DWW[ \(-\)+]确保她输掉比赛。 在一个 玩家2 然后,她根据当前状态和顶点中编码的字母组合选择一个转换,并移动到相应的 玩家1 顶点。 回想一下 M(M) 在存在状态和普遍状态之间交替。 因此,只有一个 玩家2 二者之间的顶点 玩家1 游戏中的顶点。 这一事实使 玩家1 以保持磁带配置,尽管她只看到她的顶点。 玩家1 只要对应于的顶点 \已达到(q{\it acc}\)。
DWW公司[ \(-\)+] \({\mathcal{A}})确保 玩家1 在选择当前字母的转换以及将控件传递给 玩家2 。由于可能有成倍增长的磁带内容, \({\mathcal{A}}\)无法维护完整的磁带内容。 相反, \({\mathcal{A}}\)只在特定位置维护字母 \(0\le k\le p(|w|)-1\)。 职位 k个 由选择 玩家2 在序言中,我们添加到游戏中。 玩家1 没有看到序言,因此她不知道 k个 因此为了避免损失, 玩家1 不应隐瞒任何磁带单元,因此应忠实地模拟 M(M) 在 w个 因此, 玩家1 赢了 P(P) -战略iff M(M) 接受 w个 .
现在,我们正式描述减少。 提供ATM \(M=语言Q_e,Q_u,\Sigma,\Gamma), \(\增量\), \(q_{\it-init}\), \具有线性空间复杂度函数的(q{it-acc},q{it-rej}) \(p:\mbox{I$\!$N}\rightarrow\mbox{I$\!$N}\)和一个单词 \(w=w_0,w_1,w_2,\ldots\in\Sigma^*\),我们构造了一个博弈 \({\mathcal{G}}=\langle G,{\mathcal{A}}\rangle\)这样 克 大小固定, \({\mathcal{A}}\)是中的多项式 \(|w|\),和 玩家1 P(P) -获胜 \({\mathcal{G}}\)iff M(M) 接受 w个 。对于 \(j在e种族中,u种族),让 \(\Delta_j\subset\Delta\)是 \(Q_j\)。 游戏图 \(G=langle AP,V{1},V{2},V_0,E,tau\rangle)定义如下:
—
\(AP=\lbrace v_0,u_0,q_{\it init}\rbrace\cup\Delta\)。
—
\(V{1}=\lbrace V_0,q{\it init}\rbrace\cup\Delta _u\)。 顶点 \(v0\)是初始顶点,即顶点 \(q{init}\)对应于处于状态的计算 \(q_{\it init}\)在遍历任何转换之前,以及顶点 \(\langleq,\gamma,q^{prime},\gama^{primer},d\rangle\in\Delta_u)对应于处于状态的计算 \遍历转换后的(q^{prime}\) \(\langleq,\gamma,q^{prime},\gama^{prime},d\rangle)。
—
\(V_{2}=\lbrace u_0\rbrace\cup(\Delta _e\times\Gamma)\)。 顶点 \(u_0\)是其中 玩家2 选择位置 k个 由DWW监控[ \(-\)+] \({\mathcal{A}})。 顶点 \(\langle t,\gamma\rangle\in\Delta _e\times\gamma\)对应于过渡 \(t\in\Delta _e\)由选择 玩家1 在上一轮,和信中 \(伽马射线) 玩家1 声称在当前的磁带头下。
—
这套 E类 包含以下边:
–
\(语言v_0,u_0语言), \(语言u_0、u_0),以及 \(\langle u_0,q_{\it init}\langle\)。 我们称这些边为 序言 属于 克 .
–
\每 \(t=langle q_{it init},\gamma_1,q^{prime},\ gamma_2,d\rangle\in\Delta _e)和 \(\gamma\in\gamma\)。
–
\(\langle t,\langle t^{prime},\gamma\rangle\rangle),对于每个 \(t=langle q_1,gamma_1,q_2,gamma_2,d\rangle\in\Delta _u\), \(t^{prime}=langle q_2,gamma^{prime}_1,q^{primer},gamma{prime{_2,d^{primes}rangle in Delta _e),以及 \(\gamma\in\gamma\)。
–
\(\langle\langle t,\gamma^{prime}_1范围,t^{prime}范围),每 \(t=langle q_1,gamma_1,q_2,gamma_2,d\rangle\in\Delta _e)和 \(t^{prime}=langle q_2,\gamma^{prime}_1,q^{primes},\gama^{primer}_2,d^{primet}\rangle\in\Delta _u\)。
自循环位于 \(u_0\)启用 玩家2 选择入住时间 \(u_0\)。 自 玩家1 具有透视可见性,她不知道 玩家2 选择留在家里 \(u_0\)。 涉及过渡的边描述了要通过以下方式进行检查的计算 \({\mathcal{A}}\)。
—
对于每个 \(v\in\lbrace v_0,u_0,q_{\it init}\rbrace\cup\Delta _u\),我们有 \(τ(v)=\lbrace v\rbrace),并且对于每个 \(v=\langle t,\gamma\rangle\in\Delta _e\times\gamma\),我们有 \(τ(v)=l种族t种族)。
DWW公司[ \(-\)+] \({\mathcal{A}}=\langle\Sigma,S,S_0,\delta,\alpha\langle\)定义如下:
—
\(\Sigma=\lbrace v_0,u_0,q_{\it init}\rbrace\cup\Delta\)。
—
\(S=\lbrace S_0,S_{\it acc},S{\it rej}\rbrace\cup\bigcup_{0\le k\le p(|w|)-1}S^k\),其中 \(S^k=\lbrace\langlek,\gamma,h\rangle:\gamma\in\gamma,0\leh\lep(|w|)-1\rbrace\)。 三人组 \(波长k,γ,h)英寸 \(S^k\)表示字母的位置 k个 在磁带里是 \(\gamma\),读取头的位置为 小时 。对于 \(0\le k\le |w|-1\),让 \(s_0^k=langle k,w_k,0rangle),对于 \(|w|\le k\le p(|w|)-1\),并设 \(s_0^k=\langle k,\texttt{},0\rangle\)。
—
\(delta:S\times\Sigma\rightarrow S\)定义如下:
(1)
对于 \(s\in\lbrace s_{it acc},s_{it-rej}\rbrace)和 \(\sigma\in\sigma\),我们有 \(δ(s,σ)=s)。
(2)
对于每个 \(s中的s)和 \(\sigma\in\lbrace v0,q{\it-init}\rbrace)我们有 \(δ(s,σ)=s)。
(3)
\(δ(s_0,u_0)=s_0^0),对于 \(t \ in \ Delta \)我们有 \(δ(s_0,t)=s_0)。
(4)
让 \(s=s_0^k\)。 如果 \(0\le k\le p(|w|)-2\)然后 \(δ(s,u0)=s_0^{k+1})。 如果 \(k=p(|w|)-1\)那么 \(δ(s,u0)=s_{根据})。 因此 玩家2 在序言中 克 确定位置 k个 那个 \({\mathcal{A}}\)监视器。
(5)
对于每个 k个 和 \(在s^k\set-nuse\lbrace s_0^k\rbrace中)我们有 \(δ(s,u_0)=s)。
(6)
让 \(s=语言k,gamma,h,以s^k表示)和 \(t=langleq,gamma_1,q^{prime},gamma_2,d\rangle\in\Delta)。 如果 \(d=R),那么我们表示 \(d^{prime}=1\),否则 \(d^{prime}=-1\)。 然后,我们有以下内容:
–
如果 \(h+d^{prime}\not\in\lbrace 0,\ldots,p(|w|)-1\rbrace),然后 \(δ(s,t)=s_{it-rej})。
–
如果 \(h+d^{prime}\in\lbrace 0,\ldots,p(|w|)-1\rbrace),然后
*
如果 \(h=k),然后
如果 \(伽马=伽马_1)和 \(q^{\prime}=q{\itacc}\),然后 \(δ(s,t)=s_{it acc}\)。
如果 \(伽马=伽马_1)和 \(q^{\prime}\ne q_{\it acc}\),然后 \(δ(s,t)=λk,γ_2,h+d^{prime}λ)。
如果 \(\gamma\ne\gamma_1),然后 \(δ(s,t)=s_{it-rej})。
*
如果 \(h\ne k\),然后
—
\(\alpha=\lbrace s_{\it acc}\rbrace\)。
□ 4.3 紧密的复杂性 现在,我们已经准备好展示针对不同类别的行为获胜条件决定给定透视游戏的问题的严格复杂性。 回忆一下输入 \({mathcal{G}}=langleG,L\rangle)到问题有两个参数。 因此,除了 关节复杂性 问题的复杂性 \(|G|\)和描述 L(左) ,我们也对其感兴趣 图形复杂性 ,即 \(|G|\),假设 L(左) 由固定大小的自动机或公式给出。 事实上,通常 克 远大于获胜条件的大小,是计算瓶颈[ 41 ].
定理13。 让 \({\mathcal{G}}=\langle G,\psi\rangle\)是一个游戏,其中 \(\psi\)是LTL公式。 决定是否 玩家1 有一场胜利 P(P) -中的策略 \({\mathcal{G}}\),并找到一个赢家 P(P) -策略是2EXPTIME-complete。 此外,对于固定大小的游戏图来说,问题已经是2EXPTIME-hard了。 问题的图形复杂性是PTIME-complete。
证明。 对于上限,我们构造了一个NBW \({\mathcal{A}}_{\lnot\psi}\)尺寸指数 \(|\psi|\)这样 \(L({\mathcal{A}}_{\lnot\psi})=\lbrace w:w\not\models\psi\rbrace)[ 57 ]. 我们二元化 \({\mathcal{A}}_{\lnot\psi}\)以获得UCW \(\psi\),然后使用推论 10 .
图复杂性的下限来自交替可达性的PTIME特性[ 28 ]. 我们现在证明了2EXPTIME下限。 在[ 5 ]结果表明,决定是否 玩家1 赢了 F类 -游戏中的策略 \({\mathcal{G}}=\langleG,\psi\rangle\)对于固定大小的游戏图来说已经是2EXPTIME-hard了 克 和LTL公式 \具有固定数量的原子命题。 中的证据[ 5 ]减少可实现性问题[ 51 ]对于LTL公式 \(\psi\)对博弈具有固定数量的原子命题 \({\mathcal{G}}=\langle G,\psi\langle) \(G=\langle 2^{AP}\times\lbrace 1\rbrace,2^{AP}\timests\lbrace 2\rbrace,((2^{AP}\tormes\lbcrace 1\r race)\times(2^ AP}\ times\lbrace2\rbace))\cup(2^}AP}times\lbcrace2\r racE)\times\ times(2 ^{AP{times\ lbrace 1 \rbrace)),\langle\emptyset,1\rangle,AP,\tau\rangle),其中for every \(在2^{AP}中)我们有 \(\tau(langle u,1\rangle)=\tau。 因此, 克 在的顶点之间交替 玩家1 和 玩家2 因此,尽管 玩家1 具有洞察力,她了解整个剧本。 因此, 玩家1 赢了 F类 -中的策略 \如果她赢了 P(P) -战略。 因此,决定是否 玩家1 赢了 P(P) -对于固定大小的游戏图来说,策略是2EXPTIME已经很难了。□
定理14。 让 \({\mathcal{G}}=\langle G,{\matchal{A}}\rangle\)是一个游戏,其中 \({\mathcal{A}}\)是DWW[ \(-\)+]或UPW。 决定是否 玩家1 赢了 P(P) -中的策略 \({\mathcal{G}}\),并找到一个获胜的 P(P) -策略是EXPTIME-complete。 此外,对于固定大小的游戏图来说,问题已经是EXPTIME-hard了。 问题的图形复杂性是PTIME-complete。
证明。 EXPTIME下限遵循定理 12 图复杂性的下限来自交替可达性的PTIME特性[ 28 ]. 上限来自定理 11 . □
4.4 无记忆策略案例 回想一下,无记忆策略是透视策略的特例。 在本节中,我们将研究决定游戏的问题,其中 玩家1 仅限于无记忆策略。 令人惊讶的是,在这个看似简单的设置中,图的复杂度是NP-完全的,因此它比透视策略的多项式图复杂度更难。
定理15。 让 \({\mathcal{G}}=langleG,L\rangle)是一个游戏。 决定是否 玩家1 在 \({\mathcal{G}}\),并找到一个成功的无记忆策略,当 L(左) 由LTL公式给出,当 L(左) 由DWW给出[ \(-\)+]或UPW。 在这两种情况下,问题的图形复杂性都是NP-完全的。
证明。 我们从以下情况开始 L(左) 由LTL公式给出,因此 \({\mathcal{G}}=langle G,\psi\rangle\)。 鉴于 \({\mathcal{G}}),我们猜测 玩家1 在里面 克 因此,对于每个顶点 \(v\在v{1}\中),我们选择一个传出边。 让 \(G^{\prime}\)是从 克 通过删除中顶点的所有传出边 \(V_{1}\)未选中。 很容易看出 玩家1 正在从顶点获胜 \(v0\)iff \(v_0\)英寸 \(G^{\prime}\)满足 \(磅/平方英寸)。 这可以使用LTL模型检查在PSPACE中进行检查[ 53 ]. 因此,可以在PSPACE中检查所有可能的无记忆策略。 PSPACE中的硬度来自LTL模型检查。 事实上,当所有顶点都属于 玩家2 ,该问题与检查 \({\mathcal{G}}\)满足 \(磅/平方英寸)。
我们继续讨论以下情况 L(左) 由DWW给出[ \(-\)+]或UPW \({\mathcal{A}}\)。 在这里,我们猜测并检查一个获胜策略 玩家1 然而,在这里,我们可以通过检查语言的交集的空性来检查多项式时间内的猜测见证 \(G^{\素数}\) \({\mathcal{A}}\),它是一个NPW或DWW[+-](即通过对偶DWW获得的安全属性的确定性弱自动机[ \(-\)+]). 因此,问题属于NP。
我们描述了问题2DP(两个顶点不相交路径)的简化,在中证明是NP完全的[ 24 ]. 在2DP中,我们得到了一个有向图 \(G=\langle V,E\langle)和两个顶点 \(v,u\ in v\),并且必须确定是否存在来自 u个 到 v(v) 和来自 v(v) 到 u个 也就是说,是否存在路径 \(s_1、s_2、\ldot、s_k)和 \(s^{\prime}_1,s^{\prime}_2,\ldots,s^{\prime}_{k^{\prime}\)使得 \(s_1=s^{prime}_{k^{prime}=u\), \(s^{\prime}_1=s_k=v\),以及 \(s1,s2,\ldot,s{k-1},s^{prime}_1,ss^{prime}_2,\ldots,s^}prime}{k^{prime}-1})都是不同的。
给出一个图表 \(G=语言V,E)和两个顶点 \(v,u\ in v\),定义游戏图 \(G^{\prime}=\langle AP,V,\emptyset,V,E,\tau\rangle\),其中 \(AP=\l种族p_1,p_2\r种族\), \(\tau(v)=\lbrace p_1\rbrace\), \(τ(u)=\lbrace p_2\rbrace),以及 \(\tau(u^{\prime})=\emptyset\)表示全部 \(u^{prime}\ not\ in \lbrace v,u\rbrace)。 因此, 玩家1 拥有所有顶点,初始顶点为 v(v) ,它的标签为 \(p_1\),它是其中唯一的顶点 \(p_1)保持不变。 也, u个 由标记 \(p_2),它是其中唯一的顶点 \(第2页)保持不变。 现在,考虑一下(共同安全)语言 \(L\subseteq(2^{lbrace p_1,p_2\rbrace})^\omega\)其中 \(w\ in L\)iff w个 在中有前缀 \(p_1\cdot{\bf真}^*\cdot p_2\cdot}^*\ cdot p_1)。 因此, L(左) 是满足LTL公式的剧本集 \(\psi=p_1\wedget\circ\Diamond\,(p_2\wedge\circ\Diamond_,p_1)\)。 显然, L(左) 也可以由DWW定义[ \(-\)+]或固定大小的UPW。
我们证明了这一点 \(langle G,v,u rangle in mbox{2DP})iff 玩家1 获胜 \(langle G^{prime},L\rangle)使用无记忆策略。 首先假设 \(\langle G,v,u\rangle\in\mbox{2DP}\)。 让 \(v=s1,s2,\ldot,sk=u=s^{prime}_1,s^{prime}_2,\ldots,s^}prime}_{k^{prime}}=v\)如上所述。 考虑无记忆策略 \(f:V\右箭头V\) \(f(s_i)=s_{i+1}\),对于 \(1)和 \(f(s^{prime}_i)=s^{prime}_{i+1}\),对于 \(1)。 很容易看出这一点 \({\sf结果}(v,f)\)是一条无限路径,它反复遍历来自 u个 到 v(v) 和来自 v(v) 到 u个 因此, \(L中的{\sf结果}(v,f))和 玩家1 获胜 \(语言G^{prime},语言)。
对于另一个方向,假设 玩家1 获胜 \(langle G^{prime},L\rangle)使用无记忆策略。 让 \(f:V\右箭头V\)是 玩家1 这样的话 \({\sf结果}(v,f)\ in L\)。 回想一下 \({\sf结果}(v,f)=v,f(v),f^2(v)、f^3(v)和\ldots\)。 自 \({\sf结果}(v,f)\)位于 L(左) ,有一个最小值 \(j)这样 \(f^j(v)=v\)并且有 \(0)这样 \(f^i(v)=u)。 我们要求所有人 \(1 l1 l2 j),我们有 \(f^{l1}(v)\ne f^{L2}(v)\)。 请注意,这将完成证明,因为它意味着 \({\sf结果}(v,f)\)证明 \(语言G,v,u rangle in mbox{2DP})。 所以,假设存在矛盾 \(1\le l_1\lt l_2\le j\) \(f^{l1}(v)=f^{l2}(v)\)。 然后, \({\sf结果}(v,f)=v,f(v),\ldots(f^{l_1}(v),\ltots f^{l-2-1}(f))^\omega\)。 我们区分两种情况。 首先,如果 \(l2=j\),我们得到了与 j个 或存在 \(0)这样 \(f^i(v)=u)。 那么,如果 \(l2\ltj),我们得到一个矛盾 \({\sf结果}(v,f)\)处于 L(左) . □
4.5 观点 -ATL公司 ⋆ 模型检查 对于ATL ⋆ 和ATL,模型检查问题分别为2EXPTIME-complete和PTIME-complete,图的复杂度为PTIME-complete[ 5 ]. 添加纵向不确定性使图形复杂度EXPTIME-完整[ 5 ]. 正如我们现在所展示的,透视部分可见性是免费的,而无记忆的透视部分可见性增加了图形的复杂性。
定理16。 的模型检查问题 观点 -ATL公司 ⋆ 2EXPTIME-完成。 对于固定大小的游戏图来说,问题已经是2EXPTIME-hard了。 当唯一的路径限定符是 \(语言\!语言A\等级\!等级\)和 \(\langle\!\langle-A\rangle\!\rangle_P\),图形复杂性为PTIME-complete。 使用路径限定符 \(\langle\!\langle-A\rangle\!\rangle_M\),图的复杂度为 \(Delta _2^P),并且是NP-和coNP-hard。 的模型检查问题 观点 -ATL已完成PTIME。
证明。 我们从 观点 -ATL公司 ⋆ .下限遵循定理 13 和 15 特别地,对于 观点 -ATL公司 ⋆ 具有 \(\langle\!\langle-A\rangle\!\rangle_M\)路径量词后面是对定理证明中使用的2DP进行补充的问题的简化 15 .
对于上限,让 克 作为一个游戏图,让 \(\varphi\)为 观点 -ATL公司 ⋆ 公式。 与CTL算法相同 ⋆ 模型检查[ 21 ],我们标记每个顶点 v(v) 在里面 克 通过的所有状态子公式 \(\varphi\)保持不变 v(v) 。我们以自下而上的方式进行此操作,从最内层的状态子公式开始 \(\varphi\)。 对于最内层的状态子公式 \(\varphi i \)和顶点 v(v) ,我们决定是否 \(\varphi _i)保持在 v(v) 如下所示。 如果 \(\varphi _i=\langle\!\langle A\rangle\!\rangle\psi\) \(A\subseteq\lbrace\mbox{PLAYER~1},\mbox{PAYER~2}\rbrace\),然后我们使用ATL ⋆ 模型检查[ 5 ]. 如果 \(\varphi _i=\langle\!\langle A\rangle\!\rangle _P\psi\),然后我们继续如下。 如果 \(A=\lbrace\mbox{PLAYER~1}\rbrace\)或 \(A=\lbrace\mbox{PLAYER~2}\rbrace\),然后我们使用定理 13 .如果 \(A=\lbrace\mbox{PLAYER~1},\mbox{PAYER~2}\rbrace\)或 \(A=\emptyset\),然后我们声明 \(\varphi _i=\exists\psi\)或 \(\varphi_i=\forall\psi\),并使用CTL ⋆ 模型检查。 请注意,虽然对于 \(\langle\!\langle\rangle\!\rangle\),它们需要以下项的证明 \(\langle\!\langle-A\rangle\!\rangle_P\),因为不清楚 P(P) -策略可以迫使所有的计算都发挥作用。 为了看到他们可以,假设 \顶点的(v\models\exists\psi\) v(v) 所以,有一个剧本 \(\rho=v_1,v_2,\ldots\)来自 v(v) 满足 \(磅/平方英寸)。 然后, 玩家1 和 玩家2 可以合作以确保满足 \(\psi\)使用 P(P) -战略 \(f1)和 \(f2)这样对于每个前缀 \(\rho^{\prime}=v_1,\ldots,v_i\)的 \(\rho\),如果 \(v_i\在v_j\中),然后 \(fj({\sf-Persp}{j}(\rho^{prime}))=v{i+1})。 因为每两个不同的前缀 \(\rho^{\prime}\)和 \(\rho^{\prime\prime}\),共 \(\rho\)结束于 \(V_j\),长度 \({\sf-Persp}_{j}(\rho^{prime}))和 \({\sf-Persp}_{j}(\rho^{prime\prime}))不相等,则 \(f_j)定义明确。
我们继续这个案子 \(\varphi_i=\langle\!\langle A\rangle\!\rangle_M\psi\)。 如定理的上界 15 ,我们猜一个无记忆的策略 A类 ,并检查通过删除策略未选择的边而获得的图中的所有路径是否满足 \(磅/平方英寸)。 复杂性是PSPACE,图复杂性是NP。现在,当我们以自下而上的方式进行时 \(\langle\!\langle-A\rangle\!\rangle_M\psi\)子公式需要这样的调用,这会将图形复杂性增加到 \(Delta _2^P\)。 三
我们继续 观点 -ATL公司。 考虑以下形式的公式 \(\langle\!\langle A\rangle\!\rangle_P\theta\)或 \(\langle\!\langle A\langle\!\langle_M\theta\),用于 \形式的(θ) \(\circ\varphi 1\), \(\Box\,\varphi_1\)或 \(\varphi_1{\mathcal{U}}\varphi_2\),对于一些状态公式 \(\varphi 1\)和 \(\varphi 2\)。 请注意,在所有三种情况下,我们都有 \(语言\!语言A\等级\!等级_P\θ)和 \(\langle\!\langleA\rangle\!\rangle_M\theta\)都等价于 \(\langle\!\langle-A\rangle\!\rangle\theta\)。 的确,如果球员 A类 可以确保满足 \(θ)由 F类 -策略,然后他们可以使用无记忆的策略来实现,而这些策略也 P(P) -战略。 因此,每个 观点 -ATL公式等价于通过替换每个公式获得的ATL公式 \(语言\!语言A\等级\!等级_P\)或 \(\langle\!\langle A\rangle\!\rangle_M\)路径限定符 \(\langle\!\langle\rangle\!\rangle\)。 然后,根据ATL模型检查的PTIME完整性提出了该主张[ 5 ]. □
跳过概率设置部分的5个决定前瞻性游戏 5 概率环境下的透视博弈决策 In定理 5 ,我们展示了一些游戏 玩家1 有一个 \((P,F)-几乎获胜的策略,但没有 P(P) -获胜策略。 在这一节中,我们表明,对于DCW给定的行为目标,概率设置中关于透视游戏的推理是不可确定的(因此对于DPW和NBW也是如此)。
定理17。 决定是否 玩家1 \((P,F)-几乎赢了,她是否 \((P,P)\)-几乎赢得DCW透视游戏是不确定的。
证明。 我们证明了概率co-Büchi字自动机(简称PCW)的空性问题的简化,证明了它是不可判定的[ 7 , 17 ]. PCW是 \({\mathcal{P}}=\langle\Sigma,Q,Q_0,\delta,\alpha\rangle\),其中 \(\西格玛\)是字母表, 问 是州, \(q0\)是初始状态, \(alpha\subseteq Q)是一个co-Büchi接受条件 \(delta:Q\times\Sigma\times Q\rightarrow[0,1]\)是这样的 \(q中的q)和 \(\sigma\in\sigma\),我们有 \(在q}\delta(q,sigma,q^{prime})中的sum_{q^{\prime}=1\)。 一句话 \(w\in\Sigma^\omega)被接受 \({\mathcal{P}}\)如果 w个 在里面 \({\mathcal{P}}\),表示为 \(Pr_{{\mathcal{P}}}(w)\)为1。 中的不可判定性证明[ 7 , 17 ]已经适用于PCW,其范围为 \(delta)是有理数。 因此,我们可以假设有一个公约数 第页 所有概率 \({\mathcal{P}}\),这样 \(\frac{1}{r}\)是一个整数。 让 \(n=\frac{1}{r}\)。 通过复制中的状态 \({\mathcal{P}})我们可以进一步假设 \({\mathcal{P}}\)等于 \(\压裂{1}{n}\)。 因此,对于 \(q中的q)和 \(\sigma\in\sigma\) n个 状态,表示 \(q_0^\sigma,\ldots,q_{n-1}^\sigma),使得 \每 \(k\in\lbrace 0,\ldots,n-1\rbrace)。
我们构建了一个游戏 \({\mathcal{G}}=\langle G,{\mathcal{A}}\rangle\),其中 \({\mathcal{A}}\)是DCW,这样 \({\mathcal{P}}\)是非空的iff 玩家1 \((P,F)\)-几乎获胜 \({\mathcal{G}}\)。 直观地说 \({\mathcal{P}})通过玩家的随机策略进行模拟 \({\mathcal{G}}\)。
游戏图 克 具有 \(AP=\Sigma\cup\lbrace 0,\ldots,n-1\rbrace\cup\lb race\#\rbrace)如图所示 2 .中的一个剧本 克 具有无限轮序列,因此在每轮中 玩家1 选择 \(\sigma\in\sigma\), 玩家2 选择索引 \(i \in\lbrace 0,\ldots,n-1 \rbrace),然后 玩家1 选择索引 \(第0、第1、第1种族中的j)。 自 玩家1 具有透视可见性 我 和 j个 都是独立的。 因此,每个参与者 \({\mathcal{G}})有可能确保精确模拟 \({\mathcal{P}}\)通过选择到 \(\lbrace 0,\ldots,n-1 \rbrace)顶点 克 均匀随机。 的确,如果 玩家2 选择 \(i \in\lbrace 0,\ldots,n-1 \rbrace)均匀随机,然后 玩家1 选择 j个 不知道 我 ,则不考虑(可能随机)选择 j个 通过 玩家1 ,索引 \((i+j)\mod{n}\)均匀分布在 \(\lbrace 0,\ldots,n-1\rbrace)。 同样,如果 玩家1 选择 j个 均匀随机,那么 \无论什么情况,(i+j)\mod{n}\)都是均匀分布的 玩家2 做。 图2。 博弈图G在每个顶点上正好有一个原子命题在\(\Sigma\cup\lbrace 0,\ldots,n-1\rbrace\cup\blrace\#\rbrace)中成立。
DCW公司 \({\mathcal{A}}=\langle\Sigma^{\prime},Q^{\prime} \({\mathcal{P}})如下:
—
\(\Sigma^{\prime}=\ Sigma\cup\lbrace 0,\ldots,n-1\rbrace\cup\blrace\#\rbrace)。
—
\(Q^{\prime}=Q\cup(Q\times\Sigma)\cup。
—
\(q^{prime}_0=q_0\)。
—
\(\delta^{\prime}:Q^{\rime}\times\Sigma^{\prime}\rightarrow Q^{\ prime}\)定义如下:
–
对于 \(q中的q)和 \(\sigma\in\sigma\),我们有 \(delta^{prime}(q,\sigma)=\langleq,\sigma\rangle)。
–
对于 \(语言q,在Qtimes\sigma中为sigma)和 \(i\in\lbrace 0,\ldots,n-1\rbrace),我们有 \(delta^{prime}(langleq,sigma\rangle,i)=langleq、sigma,i\rangle\)。
–
对于 \(语言q,σ,i rangle in Qtimes\Sigmatimes\lbrace 0,ldots,n-1 race)和 \(j\in\lbrace 0,\ldots,n-1\rbrace),我们有 \(delta^{prime}(langleq,sigma,irangle,j)=q{(i+j)mod{n}}^sigma)。
–
对于每个 \(q\在q^{prime}\中)我们有 \(delta^{prime}(q,\#)=q\)。
–
对于每个 \(q中的q)和 \(k\in\lbrace 0,\ldots,n-1\rbrace)我们有 \(delta^{prime}(q,k)=q\)。
–
对于每个 \(q\ in(q\ times\Sigma)\ cup(q\ times\Sigma\ times\lbrace 0,ldots,n-1 race))和 \(\sigma\in\sigma\)我们有 \(delta^{prime}(q,sigma)=q\)。
—
\(\alpha^{\prime}=\alpha\)。
我们现在证明了简化的正确性,即 \({\mathcal{P}}\)是非空的iff 玩家1 \((P,F)\)-几乎获胜 \(\langle G,{\mathcal{A}}\langle),并且 \({\mathcal{P}}\)是非空的iff 玩家1 \((P,P)\)-几乎是两翼。
首先假设 \({\mathcal{P}}\)是非空的,让 \(在L({\mathcal{P}})中为w\)。 让 \(g_1)是随机的 P(P) -战略 玩家1 这样,到 \(\Sigma\)顶点是根据 w个 (即,在 k个 第次回合 玩家1 选择 k个 第个字母 w个 ),以及选择 \(j\in\lbrace 0,\ldots,n-1\rbrace)是均匀随机完成的。 因为每一个随机选择 \(i \in\lbrace 0,\ldots,n-1 \rbrace)由 玩家2 索引 \((i+j)\mod{n})均匀分布,则对于每个随机策略 \第(g_2)页,共页 玩家2 我们有 \(Pr{g_1,g_2}(L({\mathcal{A}}))=Pr{{\mathcal{P}}}(w)=1\)。
假设现在 \({\mathcal{P}}\)为空。 让 \(g_2)是随机的 P(P) -战略 玩家2 这样的话 \(i \in\lbrace 0,\ldots,n-1 \rbrace)是均匀随机选择的。 请注意,在随机 P(P) -战略 玩家1 ,选择 j个 不能依赖 我 因此,对于每个随机 P(P) -战略 玩家1 ,索引 \(i+j)mod{n})均匀分布。 因此,对于每个策略 \第(g_1\)页,共页 玩家1 ,我们有 \(Pr_{g_1,g_2}(L({\mathcal{A}}))是 \({\mathcal{P}})接受一个单词 w个 它是根据由 \(g_1\)。 因为每一个字 w个 我们有 \(Pr_{\mathcal{P}}}}(w)\lt 1\),则 \(Pr_{g_1,g_2}(L({mathcal{A}})))。
因此,我们表明 \({\mathcal{P}}\)是非空的iff 玩家1 \((P,F)\)-几乎是双赢的。 事实上,由于战略 \第(g_2)页,共页 玩家2 上面定义的是透视图,那么我们也有透视图 \({\mathcal{P}}\)是非空的iff 玩家1 \(P,P)-几乎获胜。□
跳过6决定结构展望游戏部分 6 决定结构性前瞻性游戏 一个广泛研究的问题是确定哪些游戏 承认无记忆策略 即,在哪些游戏中 玩家1 赢了 F类 -如果她有一个成功的无记忆策略[ 54 ]. 回想一下,每一个无记忆的策略都是视角。 实际上,中的顶点 \(V_j)包含在 玩家 j个 因此,支持无记忆策略的游戏(例如,可达性、Büchi、co-Büchi.、Rabin和奇偶游戏[ 13 ])也承认 P(P) -战略。 4
在本节中,我们将研究哪些结构性获胜条件允许 P(P) -战略。 对于不允许无记忆策略的情况,这个问题特别有趣。 让我们回顾一下一般化的比奇和斯特雷特获胜条件,它们不承认无记忆的策略。 一条路 \(V^\omega中的\rho\)满足:
—
一 广义Büchi 条件 \(\alpha=\lbrace\alpha_1,\ldots,\alpha_k\rbrace\substeq 2^V)iff \(\inf(\rho)\cap\alpha _i\ne\emptyset\) \(1)。
—
一 斯特雷特 条件 \(alpha=\lbrace\langle\beta_1,\alpha_1\rangle,\ldots,\langle\beta_k,\alfa_k\rangle\rbrace\subseteq 2^V\times 2^V\)iff \(\inf(\rho)\cap\beta_i\ne\emptyset\)暗示 \(\inf(\rho)\cap\alpha _i\ne\emptyset\) \(1)。
正如我们现在所展示的,虽然广义的Büchi游戏不接受无记忆策略,但它们确实接受透视策略。 从直觉上看,这是因为 玩家1 可以通过维持一个指示她下一个要满足的连接词的计数器,以一种循环的方式满足广义Büchi条件的不同连接词。
定理18。 广义Büchi游戏承认 P(P) -战略。
证明。 让 \(G=langle V{1},V{2},V_0,E\rangle)是一个博弈图,让 \(V=V{1}\杯V{2}\) \(|V|=n\),并让 \(\alpha=\lbrace\alpha_1,\ldots,\alpha_{k}\rbrace\substeq 2^V)是广义的Büchi获胜条件。 对于顶点 v(v) ,我们表示为 \(G^v)从 克 通过将初始顶点更改为 v(v) 。我们证明如果 玩家1 F类 -获胜 \(朗格·G,阿尔法·朗格),然后她也 P(P) -赢了。让我们 \(f1)获胜 F类 -战略 玩家1 在里面 \(langle G,alpha rangle),然后让 \(U\subseteq V\)是当 玩家1 根据播放 \(第1页)。 那就是, \(v在U中)如果有策略 \第(f2)页,共页 玩家2 这样的话 v(v) 在中 \({\sf结果}(f1,f2))。 请注意,自 U型 是可到达顶点的集合,一个顶点 \(在U\cap v_{2}中的v\)不能在 \(V\set减去U\)。 自 \(f1)是 \(\langle G,\alpha\rangle),且获胜条件的满足与有限前缀无关,则 \(f_1\)也是 \(\langle G^v,\alpha\rangle),每 \(v在U中)。 因此,对于 \(1 \le i \le k)和 \(v在U中),战略 \(f1)为 玩家1 在比奇的比赛中 \(G^v\)与目标 \(\alpha _i\cap U\)。 我们用以下方式表示这场比赛 \({\mathcal{G}}^{v,i}=\langle G^v,\alpha_i\cap U\rangle\)。 由于比奇游戏承认无记忆策略, 玩家1 拥有无记忆的获胜策略 \Büchi游戏的(g_1^{v,i}) \({\mathcal{G}}^{v,i}\) \(v\在U\中)和 \(1)。 考虑以下内容 P(P) -战略 \(f^{\prime}_1\)用于 玩家1 。从开始 \(i=1\),她根据 \(g_1^{v_0,i})并保持一个计数器,该计数器在每次游戏访问中的顶点时都会增加 \(V_{1}\)。 自 \(g_1^{v_0,i}\)获胜且无记忆,该剧必须在年达到顶点 \(\alpha _i\cap U\)最多在 n个 轮。 当计数器至少为 n个 游戏达到顶点 \(在U\cap v_{1}中为v\),然后 玩家1 重置计数器,增加 我 到 \((i\mod{k})+1),并开始根据 \(g_1^{v,i}\)(使用新的 我 ). 请注意,如果在某个点上播放达到了一些 \(v\in\alpha_i\cap U\cap v_{2}),然后留在 \(V_{2}\),则该剧必须满足 \(阿尔法)根据 U型 此外,由于中的顶点 \(U\cap V_{2}\)在中没有后续项 \(V\set减去U\),如果 玩家2 不停留在 \(V_{2}\)访问后无限多轮 \(v\in\alpha_i\cap U\cap v_{2}),然后当播放移回顶点时 \(v^{prime}\在v_{1}\中),我们有 \(在U\中为v^{\prime}\),因此最终该剧达到 \当计数器至少为 n个 因此, \(f^{\prime}_1)获胜 P(P) -战略 玩家1 在里面 \(语言G,α)。□
对于Streett条件,维护计数器是不够的,因为 玩家1 还应注意以下顶点 玩家2 可能访问过,使 P(P) -战略弱于完全可见的战略:
证明。 我们用指数2证明了斯特雷特游戏的说法。 让 \(G_{mathit {m} 匹配 }\)是图中的游戏图 1 ,并让 \(\alpha=\lbrace\langle\lbrace v_p\rbrace、\lbrace-u_p\rbace\rangle、\langle\lcrace u_p\rdrace、\ lbrace v _p\rbrace\rangle\rbrace\)是斯特雷特获胜条件。 因此, \(\alpha\)要求顶点 \当顶点为 \(u_p\)被无限频繁地访问。 很容易看出这一点 玩家1 赢了 F类 -策略,其中从顶点 \(v_\#\)她选择继续 \(v_p\)每次访问 \(v_\#\)之前访问了 \(u_p\),并选择继续 \(v_q\)每次访问 \(v_\#\)之前访问了 \(u_q\)。 然而, 玩家1 没有获胜机会 P(P) -战略。 事实上 P(P) -战略 玩家1 在里面 \(G_{mathit {m} 观察 }\)必须独立于 玩家2 以及每一个这样的战略 玩家1 , 玩家2 有一个策略 \(\alpha\)不满意。□
我们现在可以用决定是否 玩家1 赢了 P(P) -所有常见结构视角游戏中的策略。
定理20。 考虑一个结构视角游戏 \({\mathcal{G}}=\langle G,\alpha\rangle\)。 让 k个 是的索引 \(\alpha\)。 决定是否 玩家1 P(P) -获胜 \({\mathcal{G}}\)可以在 \(|G|\)和 k个 对于 \(alpha),即Büchi、co-Büchi-或广义Büchi,以及时间多项式 \(|G|\)和指数 k个 对于 \(alpha)即奇偶校验、Rabin或Streett。
证明。 对于Büchi、co-Bu chi、广义Büchi、奇偶性和拉宾,复杂性来自于关于具有完全可见性的游戏的已知结果 5 [ 14 , 38 , 47 , 56 ]. 事实上,所有上述获胜条件都承认 P(P) -战略。 除了广义Büchi之外,所有的Büchi都承认无记忆策略,这是因为它们遵循定理 18 .
对于Streett,定理 19 这意味着我们应该开发一种新的算法。 我们表示 \(\alpha=\lbrace\langle\beta_1,\alpha_1\rangle,\ldots,\langle\beta_k,\alfa_k\rangle\rbrace\)。 首先,我们减少了Streett游戏 \(langle G,alpha rangle)到游戏 \(\langle G^{\prime},\psi\rangle\),其中 \(G^{\prime}\)是从 克 通过给顶点赋值原子命题 \(AP=\lbrace p_1,\ldots,p_k,q_1,\tots,q_k\rbrace\),以便 \(p_i\ in \ tau(v)\)iff \(v\in\alpha_i\)和 \(q_i \ in \ tau(v)\)iff \(v\in\beta_i\)。 让 \(\psi=\bigwedge _{1\le i\le k}\Box\,\Diamond\,q_i\rightarrow\Box\,\Diamond\,p_i\)。 显然, 玩家1 赢了 P(P) -中的策略 \如果她赢了 P(P) -中的策略 \(\langle G^{\prime},\psi\rangle\)。 现在,根据定理 11 ,这足以表明我们可以减少LTL公式 \(\psi\)到UPW \中大小多项式的({\mathcal{A}}\) k个 本质上, \({\mathcal{A}}\)由 k个 不相交的组件,每个组件都有三个状态 我 -th组件负责检查 我 中的th连词 \(\psi\)满足要求。 正式而言,UPW \({\mathcal{A}}\)这样 \(L({\mathcal{A}})=L(\psi)\)我们构造如下:
回想一下 \(\psi\)指定Streett获胜条件,因此 \(\psi=\bigwedge_{1\lei\lek}\Box\、\Diamond\、q_i\rightarrow\Box\,\Diamone\、p_i\)。 我们建立了一个UPW \({\mathcal{A}}\)这样 \(L({\mathcal{A}})=L(\psi))。 UPW公司 \({\mathcal{A}}\)由 k个 不相交的组件,以及 我 组件负责检查 我 中的th连词 \(\psi\)满足要求。 每个单词 \(w\in(2^{AP})^\omega\)正好有 k个 磨合 \({\mathcal{A}}\),每个组件中运行一次。 这个 我 th分量由三个状态组成 \(S^i=\lbrace S_q^i,S_p^i,S_{\bot}^i\rbrace\),用于监视带有标签的顶点中的访问 \(q_i)和 \(p_i\)。 奇偶校验接受条件 \(\alpha^{\prime}\)是这样的,对于 \(1)我们有 \(\alpha^{\prime}(s_p^i)=2\), \(alpha^{prime}(s_q^i)=3\)和 \(α^{\prime}(s_{\bot}^i)=4\)。 如果跑步 \(\pi\)包含在 我 然后是第个分量 \(\inf(\pi)\subseteq S^i\)。 因此, \(\alpha^{\prime}\)要求,如果运行在 \(s_q^i\)那么它也应该无限频繁地访问 \(s_p^i\)。 正式来说,我们有 \({\mathcal{A}}=\langle 2^{AP},S,S_0,\delta,\alpha^{\prime}\langle),其中:
—
\(S=\lbrace S_0\rbrace\cup\bigcup_{1\lei\lek}S^i\)。
—
\(delta:S\times 2^{AP}\rightarrow S\)定义如下。 对于一封信 \(2^{AP}中的sigma)我们有:
–
\(δ(s_0,\sigma)=\lbrace s_{\bot}^i:1\lei\lek\rbrace)。 因此,我们开始 k个 管路,每个组件一个 \(S^i\)。
–
对于每个 \(1 \le i \le k)和每个 \(在s^i\中)我们有:
*
如果 \(p_i\in\sigma\)然后 \(\delta(s,\sigma)=\lbrace s_p^i\rbrace)。
*
如果 \(p_i\not\in\sigma\)和 \(q_i\in\sigma\)然后 \(δ(s,σ)=\lbrace s_q^i\rbrace)。
*
如果 \(p_i,q_i不在sigma中)然后 \(delta(s,\sigma)=\lbrace s_{\bot}^i\rbrace)。
—
\(\alpha^{\prime}:S\rightarrow\lbrace 1,\ldots,4\rbrace)是这样的 \(\alpha^{\prime}(s_0)=1\)并且对于每个 \(1)我们有 \(\alpha^{\prime}(s_p^i)=2\), \(alpha^{prime}(s_q^i)=3\)和 \(\alpha^{\prime}(s_{\bot}^i)=4\)。
□ 我们注意到,在广义Büchi或Streett博弈的情况下,判定获胜无记忆策略的存在性在博弈图的大小上是NP-完全的,NP-harrdness已经应用于指数为2的广义Búchi获胜条件[ 31 ]. 通过定理 20 ,决定获胜视角(而非无记忆)策略存在性的图形复杂度指数更低。
最后,对结构性获胜条件的研究 P(P) -策略还诱导LTL片段承认 P(P) -行为环境中的策略:
定理21。 考虑一个游戏 \({\mathcal{G}}=langle G,\psi\rangle\)。 如果 \(\psi\)是以下形式的LTL公式 \(\bigvee_{1\lei\lek}(\Box\,\Diamond\,p_i\wedge\Diamone\,\Box\、q_i)\)或 \命题断言的(\bigwedge_{1\lei\lek}\Box\,\Diamond\,p_i\) \(p_i\)和 \(q_i\)结束 AP公司 ,然后 玩家1 F类 -获胜 \({\mathcal{G}}\)iff 玩家1 P(P) -获胜 \({\mathcal{G}}\)。
跳过7讨论部分 7 讨论 传统的部分可见性是纵向的——在所有顶点中,参与者只观察到原子命题的可观察子集的赋值。 我们引入并研究了透视博弈,它为多智能体系统中的一种新型局部可见性建模。 具有横向不确定性的透视游戏模型设置-玩家观察对所有原子命题的赋值,但仅在他们拥有的顶点上。 如第节所述 1 横向不确定性存在于通信网络、交换系统和其他复合系统中,其中每个底层组件只能查看其控制的系统部分。 我们表明,虽然横向不确定性与纵向不确定性具有许多相同的理论性质,但它更容易处理。 我们的结果的底线是,除非规范形式是确定性自动机,否则我们研究的问题的复杂性与它们在没有不确定性的情况下的复杂性是一致的,并且对于所有类型的规范,复杂性在游戏图的大小上都是多项式的。 直观地说,这是因为横向设置仅增加了与标记所遍历的游程后面的自动机状态有关的不确定性,而这种不确定性无论如何都存在于非确定性或交替自动机中。 这与纵向不确定性形成对比,纵向不确定性的算法在博弈图中是指数的。
将部分可见性导致的不确定性与自动机中分支导致的不确定同步并不容易。 从技术角度来看,我们没有考虑用NBW给出的目标来决定透视游戏的复杂性。 为了处理LTL,我们在UCW上的结果就足够了。 调查NBW的复杂性仍然很有意思,因为这一挑战与其他问题中面临的挑战类似,其中LTL的解决方案基于其向UCW的指数转换,当起点是NBW时,这是不合法的(参见无安全合成[ 30 , 39 ]). 我们还没有解决的另一个问题是具有LTL目标的概率透视游戏的可判定性。 事实上,DCW的不可判定性结果使用了概率co-Büchi自动机已知的不可确定性结果,并且没有时间逻辑相似性。 未来的其他工作包括将结果扩展到 战略逻辑 [ 19 ]以及用于求解透视游戏的符号算法的开发,这些算法在纵向设置中被证明是有趣且有用的[ 16 , 18 ].
从更具概念性的角度来看,我们看到了未来研究的几个有趣方向。 如果游戏保持不变,那么扩展到有两个以上玩家的游戏是很简单的 零和 ,因此玩家的目标形成了一个分区 \((2^{AP})^\omega\)。 一旦我们考虑到每个玩家都有自己的目标并且目标可能重叠的设置,游戏就变成 非零和 ,我们关心它的稳定结果。 研究了具有纵向不确定性的非零和对策[ 22 , 26 ]. 理性与不确定性的结合在计算上具有挑战性。 例如,在有三个或更多玩家的游戏中,决定纳什均衡是否存在是不确定的[ 26 ]. 在后续工作中[ 34 ]研究具有横向不确定性的非零和对策,即透视多层对策。 研究表明,横向不确定性导致在三个或三个以上参与者(包括联盟或非零和目标)的环境中无法确定。 从积极的方面来说,在两层非零和透视游戏中,发现和推理稳定的结果是可以决定的,事实上,与纵向不确定性的情况不同,可以在与完全可视的游戏相同的复杂性中完成。 这两种不确定性中另一个有趣的问题是 联盟 在这方面,应该区分联合目标中体现的协作和知识共享中体现的合作。 ATL的几个扩展 ⋆ 在部分可见性上下文中形式化不同的协作方案[ 10 , 25 ]可能与玩家的架构或策略的其他限制一起[ 2 , 三 ]. 我们推测透视视点的计算优势被继承到这些模型中。 计算优势还激发了LTL属性的特征化,这些属性允许透视策略。 一般的问题是PSPACE-难,很容易从LTL可满足性中减少,而挑战是扩展我们在第节中描述的语法片段 6 .
最后,减少不确定性的透视游戏的变体是透视游戏 带有通知 ,学习于[ 33 ]. 在那里,不确定性仍然是横向的,但玩家可能会收到关于访问她拥有的顶点之间发生的事件的通知。 将纵向和横向不确定性结合起来是很有意思的。 因此,考虑到游戏中玩家只能查看她控制的系统部分,甚至在其中,她的可见性是部分的。 我们推测,关于这种游戏的推理在图及其获胜条件中都是指数的。
1 在节中 2.3 和 三 ,我们正式定义了LTL和自动机。 对于本节中的示例,我们指定 L(左) 在LTL中使用时态运算符 \(\方框\,\)(始终), \(\钻石\,\)(最终),以及 \(\circ\)(下一步)。
脚注 2 中的转换[ 39 ]从APT到UCT,它涉及到字母表大小的指数放大。 扩展的字母表指导UCT解决不确定性问题。 因此,在UPT的情况下,字母表不会改变。
脚注 三 复杂性类 \(Delta _2^P)包括可由确定性多项式时间图灵机解决的所有问题,该机具有非确定性多项式时间图灵机的预言符, 也称为 \({\rm P}^{\rm NP}\)。
脚注 4 上述还表明,概率研究 P(P) -这些目标的策略并不有趣,因为相应的透视游戏是确定的,因此概率策略与确定性策略相比没有优势。
脚注 5 因此,经典游戏设置的改进导致透视游戏的改进。 特别是,对于奇偶校验 \(O(|G|^{log(k)+6})对拉宾来说是 \(O(|G|^{k+1}\cdot k!)\)。
脚注
[1] 阿加瓦尔S。 , 科迪亚拉姆M.S。 、和 拉克希曼公司。 . 2013 . 软件定义网络中的流量工程 .英寸 第32届IEEE国际计算机通信会议记录 . 2211 – 2219 . 谷歌学者 交叉引用 [2] 奥戈特斯。 . 2006 . 交替时间时序逻辑中的动作和知识 . 合成 149 , 2 ( 2006 ), 375 – 407 . 谷歌学者 交叉引用 [3] 亚历山那州。 , 洛根B。 , Nga N.Hoang村 、和 拉基布A。 . 2009 . 资源有限联盟的逻辑 .英寸 第21届国际人工智能联合会议记录 . 659 – 664 . 谷歌学者 数字图书馆 [4] 阿尔卑斯山B。 和 施耐德F.B。 . 1987 . 认识安全和活力 . 分布式计算 2 , 3 ( 1987 ), 117 – 126 . 谷歌学者 数字图书馆 [5] 阿鲁尔·R。 , 亨廷格T.A。 、和 库普夫曼·O。 . 2002 . 交替时间时序逻辑 . 美国医学会杂志 49 , 5 ( 2002 ), 672 – 713 . 谷歌学者 数字图书馆 [6] 氨基f B。 , 贾科莫·G·德 , 穆拉诺A。 、和 鲁宾S。 . 2018 . 假设条件下的综合 .英寸 第16届知识表示与推理原则国际会议论文集 . 615 – 616 . 谷歌学者 [7] 拜尔C。 , 伯特兰·N。 、和 格勒·M。 . 2008 . 概率Büchi自动机的决策问题 .英寸 第十一届软件科学和计算结构基础国际会议论文集 . 施普林格 , 287 – 301 . 谷歌学者 [8] 巴雷特·C。 , 雅各布·R·。 、和 马拉特·M。 . 2000 . 形式语言约束路径问题 . SIAM计算机杂志 30 , 三 ( 2000 ), 809 – 837 . 谷歌学者 数字图书馆 [9] 贝拉迪内利F。 , 洛姆西奥A。 , 穆拉诺A。 、和 鲁宾S。 . 2017 . 根据认知策略逻辑验证广播多智能体系统。 在 第26届国际人工智能联合会议记录 ,卷。 17 . 91 – 97 . 谷歌学者 交叉引用 [10] 伯顿·R·。 , 莫伯特B。 , 穆拉诺A。 , 鲁宾S。 、和 瓦尔迪·M.Y。 . 2017 . 信息不完全的战略逻辑 .英寸 第32届IEEE计算机科学逻辑研讨会论文集 . 1 – 12 . 谷歌学者 交叉引用 [11] 伯旺格·D·。 , 查特吉K。 , 沃尔夫·M·德 , Doyen L。 、和 亨廷格T.A。 . 2010 . 不完全信息奇偶博弈的策略构造 . 信息与计算 208 , 10 ( 2010 ), 1206 – 1220 . 谷歌学者 数字图书馆 [12] 布林N。 和 Jamroga W。 . 2014 . 比较不同的战略能力:不确定性和记忆如何影响游戏的一般属性 . 自治代理和多代理系统 28 , 三 ( 2014 ), 474 – 518 . 谷歌学者 数字图书馆 [13] Cachat T。 . 2002 . 双向树自动机求解下推游戏 .英寸 会议记录 自动机逻辑与无限游戏 . 格拉代尔E。 , 托马斯·W·。 、和 威尔克T。 (编辑), 计算机科学课堂讲稿 ,卷。 2500 , 施普林格 , 303 – 317 . 谷歌学者 交叉引用 [14] Calude C.S.公司。 , Jain S。 , Khoussainov B。 , 李伟(Li W.)。 、和 斯蒂芬·F。 . 2017 . 拟多项式时间中奇偶对策的判定 .英寸 第49届ACM计算理论研讨会论文集 . 252 – 263 . 谷歌学者 数字图书馆 [15] 钱德拉·A·K。 和 斯托克迈耶·L·J。 . 1976 . 交替 .英寸 第17届IEEE计算机科学基础研讨会论文集 . 98 – 108 . 谷歌学者 数字图书馆 [16] 查特吉K。 和 Doyen L。 . 2010 . 部分观测奇偶对策的复杂性 .英寸 第十六届程序设计人工智能和推理逻辑国际会议论文集 . 施普林格 , 1 – 14 . 谷歌学者 交叉引用 [17] 查特吉K。 , Doyen L。 , Gimbert H。 、和 亨廷格T.A。 . 2010 . 免费的随机性 .英寸 第35届计算机科学数学基础国际研讨会论文集 . 施普林格 , 246 – 257 . 谷歌学者 交叉引用 [18] 查特吉K。 , Doyen L。 , 亨廷格T。 、和 拉斯金J.-F。 . 2007 . 不完全信息下欧米伽规则博弈的算法 . 计算机科学中的逻辑方法 三 , 三 ( 2007 ). 谷歌学者 [19] 查特吉K。 , 亨廷格T.A。 、和 皮特曼N。 . 2010 . 战略逻辑 . 信息与计算 208 , 6 ( 2010 ), 677 – 693 . 谷歌学者 数字图书馆 [20] 阿尔法罗·L·德 , 亨廷格T.A。 、和 库普夫曼·O。 . 1998 . 并发可达性游戏 .英寸 第39届IEEE计算机科学基础研讨会论文集 . 564 – 575 . 谷歌学者 交叉引用 [21] 艾默生E.A。 和 雷氏C-L。 . 1987 . 模型检查的模式:分支时间逻辑反击 . 计算机程序设计科学 8 ,第3页( 1987 ), 275 – 306 . 谷歌学者 数字图书馆 [22] 菲利奥特E。 , Gentilini R。 、和 拉斯金J.-F。 . 2018 . 不完全信息下的理性综合 .英寸 第33届IEEE计算机科学逻辑研讨会论文集 . ACM公司 , 422 – 431 . 谷歌学者 数字图书馆 [23] 菲斯曼D。 和 库普夫曼·O。 . 2009 . 有限状态切换系统的推理 .英寸 第五届国际海法核查会议闭幕词, 计算机科学课堂讲稿 ,卷。 6405 . 施普林格 , 71 – 86 . 谷歌学者 [24] 财富S。 , 霍普克罗夫特J。 、和 威利J。 . 1980 . 有向子图同胚问题 . 理论计算机科学 10 , 2 ( 1980 ), 111 – 121 . 谷歌学者 交叉引用 [25] 戈兰科五世。 和 贾姆罗加·W。 . 2016 . 并发多层博弈的状态和路径联盟有效性模型 . 自治代理和多代理系统 30 , 三 ( 2016 ), 446 – 485 . 谷歌学者 数字图书馆 [26] 古铁雷斯·J·。 , Perelli G。 、和 伍尔德里奇M.J。 . 2018 . 反应模块游戏中的不完整信息 . 信息与计算 261 , 4 ( 2018 ), 650 – 675 . 谷歌学者 交叉引用 [27] Halpern J.Y.公司。 和 瓦尔迪·M.Y。 . 1986 . 知识与时间推理的复杂性:扩展抽象 .英寸 第18届ACM计算理论研讨会论文集 . ACM公司 , 304 – 315 . 谷歌学者 [28] 伊梅尔曼N。 . 1981 . 量词的数量优于磁带单元格的数量 . 计算机与系统科学杂志 22 , 三 ( 1981 ), 384 – 406 . 谷歌学者 交叉引用 [29] 贾姆罗加·W。 , 彭泽克·W·。 , 德姆宾斯基P。 、和 Mazurkiewicz A.W.公司。 . 2018 . 战略能力的部分订单削减 .英寸 第17届自治代理和多代理系统国际会议记录 . 156 – 165 . 谷歌学者 数字图书馆 [30] Jobstmann B。 和 布隆·R。 . 2006 . LTL合成的优化 .英寸 第六届计算机辅助设计形式方法国际会议论文集 . 117 – 124 . 谷歌学者 数字图书馆 [31] Jobstmann B。 , 格雷斯迈耶A。 、和 布隆·R。 . 2005 . 作为游戏修复程序 .英寸 第十七届计算机辅助验证国际会议记录, 计算机科学课堂讲稿 ,卷。 3576 . 226 – 238 . 谷歌学者 数字图书馆 [32] 凯门尼J.G。 , 斯内尔J.L。 、和 纳普A.W。 . 1976 . 可数马尔可夫链 . 施普林格 . 谷歌学者 交叉引用 [33] 库普夫曼·O。 和 Shenwald北。 . 2020 . 带有通知的透视游戏 .英寸 第40届软件技术与理论计算机科学基础会议论文集 ,卷。 182 . 达格斯图尔-莱布尼兹·泽特鲁姆宫(Schloss Dagstuhl-Leibniz-Zentrum für Informatik) , 51:1–51:16 . 谷歌学者 [34] 库普夫曼·O。 和 Shenwald北。 . 2021 . 透视多层游戏 .英寸 第36届IEEE计算机科学逻辑研讨会论文集 . 1 – 13 . 谷歌学者 数字图书馆 [35] 库普夫曼·O。 和 瓦尔迪·G。 . 2019 . 流程逻辑 . 计算机科学中的逻辑方法 15 , 4 ( 2019 ). 谷歌学者 [36] 库普夫曼·O。 和 瓦尔迪·G。 . 2019 . 透视游戏 .英寸 第34届IEEE计算机科学逻辑研讨会论文集 . 1 – 13 . 谷歌学者 交叉引用
[37] 库普夫曼·O。 和 瓦尔迪·M.Y。 . 2000 . 不完全信息合成 .英寸 时间逻辑的进展 . Kluwer学术出版社 , 109 – 127 . 谷歌学者 交叉引用 [38] 库普弗曼O。 和 瓦尔迪·M.Y。 . 2004 . 从补充到认证 .英寸 第十届系统构建与分析工具与算法国际会议论文集, 计算机科学课堂讲稿 ,体积。 2988 . 施普林格 , 591 – 606 . 谷歌学者 交叉引用 [39] 库普夫曼·O。 和 瓦尔迪·M.Y。 . 2005 . 无安全决策程序 .英寸 第46届IEEE计算机科学基础研讨会论文集 . 531 – 540 . 谷歌学者 数字图书馆 [40] 利伯松D。 . 2003 . 切换系统和控制 . 比克豪泽 . 谷歌学者 交叉引用 [41] Lichtenstein O。 和 普努埃利A。 . 1985 . 检查有限状态并发程序是否满足其线性规范 .英寸 第十二届ACM程序设计语言原理研讨会会议记录 . 97 – 107 . 谷歌学者 数字图书馆 [42] 卢斯蒂格·Y。 和 瓦尔迪·M.Y。 . 2013 . 从组件库合成 . 技术转让软件工具 15 , 5–6 ( 2013 ), 603 – 618 . 谷歌学者 数字图书馆 [43] 马加里奥特·M。 . 2006 . 用变分原理分析切换系统的稳定性:简介 . Automatica公司 42 , 12 ( 2006 ), 2059 – 2077 . 谷歌学者 数字图书馆 [44] 马丁D.A。 . 1975 . Borel确定性 . 数学年刊 102, 2 (1975), 363–371. 谷歌学者 交叉引用 [45] 莫伯特B。 和 穆拉诺A。 . 2018 . 层次信息下知识与策略的推理 .英寸 第十六届知识表示与推理原理国际会议论文集 . 谷歌学者 [46] 彼得森·G.L。 和 赖夫·J.H。 . 1979 . 多人轮换 .英寸 第20届IEEE计算机科学基础研讨会论文集 . 348 – 363 . 谷歌学者 数字图书馆 [47] 皮特曼N。 和 普努利A。 . 2006 . rabin和街头游戏的更快解决方案 .英寸 第21届IEEE计算机科学逻辑研讨会论文集 . 275 – 284 . 谷歌学者 数字图书馆 [48] 普努埃利A。 和 罗斯纳·R。 . 1990 . 分布式反应系统很难合成 .英寸 第31届IEEE计算机科学基础研讨会论文集 . 746 – 757 . 谷歌学者 数字图书馆 [49] Puchala B。 . 2010 . 部分信息异步欧米伽规则游戏 .英寸 第35届计算机科学数学基础国际研讨会论文集 . 施普林格 , 592 – 603 . 谷歌学者 交叉引用 [50] 赖夫·J.H。 . 1984 . 不完全信息两层博弈的复杂性 . 计算机与系统科学杂志 29 , 2 ( 1984 ), 274 – 301 . 谷歌学者 交叉引用 [51] 罗斯纳·R。 . 1992 . 反应系统的模块化综合 . 博士论文 . 以色列魏茨曼科学研究所 .UMI订单号:DP17517。 谷歌学者 [52] 肖本斯P.Y。 . 2004 . 具有不完全召回的交替时间逻辑 . 理论计算机科学电子笔记 85 , 2 ( 2004 ), 82 – 93 . 谷歌学者 交叉引用 [53] Sistla A.P.公司。 和 克拉克E.M。 . 1985 . 命题线性时序逻辑的复杂性 . ACM学报 32 , 3 ( 1985 ), 733 – 749 . 谷歌学者 数字图书馆 [54] 托马斯·W·。 . 1995 . 无限对策中策略的综合 .英寸 第十二届计算机科学理论方面研讨会论文集, 计算机科学课堂讲稿 ,卷。 900 . 施普林格 , 1 – 13 . 谷歌学者 [55] 瓦尔迪·M.Y。 . 1985 . 概率并发有限状态程序的自动验证 .英寸 第26届IEEE计算机科学基础研讨会论文集 . 327 – 338 . 谷歌学者 数字图书馆 [56] 瓦尔迪·M.Y。 和 Wolper P.公司。 . 1986 . 程序模态逻辑的自动机理论技术 . 计算机与系统科学杂志 32 , 2 ( 1986 ), 182 – 221 . 谷歌学者 数字图书馆 [57] 瓦尔迪·M.Y。 和 Wolper P.公司。 . 1994 . 关于无限计算的推理 . 信息与计算 115 , 1 ( 1994 ), 1 – 37 . 谷歌学者 数字图书馆 [58] 瓦格纳·K。 . 1979 . 打开 \(\omega\)-正则集 . 信息和控制 43 ,第2页( 1979 ), 123 – 177 . 谷歌学者 交叉引用 [59] 韦奇星G。 . 1985 . 关于NP的布尔闭包 .英寸 计算理论基础国际会议论文集, 计算机科学课堂讲稿 ,体积。 199 . 施普林格 , 485 – 493 . 谷歌学者 交叉引用