跳到主要内容
研究论文
开放式访问

透视游戏

出版:2024年1月17日出版历史

跳过抽象节

摘要

我们介绍和学习透视游戏,该模型为多代理系统建模,其中代理只能查看其拥有的系统部分。与标准的多层回合游戏一样,游戏图的顶点在玩家之间进行划分。从初始顶点开始,玩家共同生成一个计算,每当生成的计算到达自己拥有的顶点时,每个玩家都会决定后续顶点。玩家的透视策略仅取决于其顶点的访问历史。因此,与基于观测的部分可见性模型不同,其中不确定性是纵向的,塑性层部分观察历史中的所有顶点,透视模型中的不确定性是横向的,参与者完全观察历史中部分顶点。

我们考虑确定性和概率性透视游戏,具有结构(例如,比奇或奇偶)和行为(例如,LTL公式)获胜条件。对于这些设置,我们从游戏图和目标两方面研究了游戏的理论属性以及决定玩家是否具有获胜视角策略问题的可判定性和复杂性。我们比较了透视策略和无记忆策略,并研究了时序逻辑ATL的一个扩展使用路径量词捕捉视角和无记忆策略。

跳过1简介部分

1简介

多智能体系统的设计和控制对应于对智能体之间的交互进行建模的游戏中获胜策略的综合。游戏在一个图形上进行,该图形的路径对应于系统的计算。我们在这里研究的设置中,每个玩家都可以控制系统的不同部分。因此,游戏是以回转为基础的:从初始顶点开始,玩家共同生成即图中的一条路径,当游戏到达她控制的顶点时,每个玩家决定后继顶点。游戏中玩家的目标是指他们产生的无限游戏。每个目标都是一个Borel集合\上Cantor拓扑中的(\alpha\)\(V ^\omega)[44],其中V(V)是图的顶点集。在某些设置中\(\alpha\)是结构的:它被指定为\(\omega\)-常规条件V(V)(例如,Büchi或parity)。在其他设置中\(\alpha\)是行为:中的顶点V(V)按集合的赋值进行标记AP公司原子命题的定义,以及\(\alpha\)是一种由无限单词组成的语言\((2^{AP})^\omega\)。

A类策略对于玩家来说,指导她如何继续达到顶点的游戏。我们区分确定性(又名。纯净的)选择后续顶点的策略,以及随机化的策略,选择后继顶点的概率分布[20]. 我们还将游戏与全能见度,其中策略可能取决于游戏的完整历史,以及与局部可见性战略只取决于历史的可见部分。部分可见性的传统方法假设纵向不确定性,其中在所有顶点中,参与者只观察到原子命题的可观察子集的赋值[5,16,18,37,50]. 具有纵向不确定性(又名。基于观测不确定性),我们对系统进行建模,其中每个底层组件只能查看和控制系统变量的子集。例如,使用私有变量与用户交互的程序。在那里,参与者的策略无法区分可观察原子命题以相同方式表现的不同路径。

我们介绍和学习透视游戏,哪个型号横向不确定性-一种新型的局部能见度。与标准的基于回合的游戏一样,游戏图的顶点在玩家之间进行划分,玩家共同生成计算结果。在透视游戏中,每个玩家的可见性仅限于其顶点。因此,玩家的透视策略无法区分访问其他玩家所拥有顶点的不同历史。透视游戏捕获多代理系统,其中代理只能查看其控制的系统部分。例如,一种通信网络,在该网络中,拥有部分路由器的公司必须仅根据有关访问其路由器的信息作出路由决定[1],复合反应系统中不观察环境与其他组件相互作用的组件[42]和交换系统,其中组件由调度器激活,并且在关闭时不知道系统的演变[40,43]. 再举一个例子,考虑一个由几个客户端组成的系统,这些客户端轮流使用服务器。每个客户端都可以在使用服务器时观察服务器的当前状态,但不能在其他客户端使用服务器时监视服务器。因此,每个客户端都具有透视可见性。透视游戏不同于迄今为止研究的所有部分可见性模型。事实上,在透视游戏中,两个玩家都可以完全看到他们控制的系统部分,而对他们不控制的部分则没有可见性(特别是,甚至没有关于转换次数的信息)。因此,虽然在具有纵向不确定性的游戏中,玩家观察到所有顶点,但在透视游戏中,可见性和可见性的缺乏是部分的横向-有些顶点玩家根本看不到,有些则完全看到。

透视策略与无记忆的策略,仅取决于游戏的当前顶点。显然,每一个无记忆的策略都是视角。实际上,控制顶点的玩家可以看到当前顶点。视角策略也与口吃不变策略在里面异步游戏[27,29]. 在这些游戏中,玩家不知道他们的步骤之间经过的时间(以及其他组件完成的步骤数)。由于这些游戏中的策略是无记忆的,所以设置比透视游戏更简单。最接近透视游戏的模型是[49],它在异步设置中考虑具有部分可见性的游戏。在那里,对玩家没有可见效果的动作对该玩家是隐藏的。换句话说,每当一个游戏从顶点穿过一条边时v(v)到顶点\(v^{\prime}\),则遍历仅对能够区分v(v)\(v^{prime}\)。因此,透视游戏是[49]. 与透视游戏不同,在[49]是纵向的。如所示[49]决定玩家是否有获胜策略的问题是可以判定的,但所描述的算法的复杂性并不严格。另一个相关模型是[42]控制流量成分。受软件和web服务系统的激励,作者研究了由组件库组成的系统。组件获得并放弃对计算的控制,其行为与计算历史无关。类似的设置是在计算过程中打开和关闭的切换系统的设置[23]. 超越可见性模型中的差异(例如[42]组件没有关于历史记录的信息,包括之前对其自身的调用,以及[23]区分活动和休眠切换系统,取决于组件在关闭时对环境的感知)[23,42]是不同的,并且涉及从协作组件合成系统。相反,我们研究的是一个游戏环境,其中组件具有零和目标。

我们首先研究透视游戏的一些理论方面。我们考虑具有获胜条件的两层博弈L(左)要么是结构性的,即\(L\subseteq V^\omega),或行为,即\(L\subseteq(2^{AP})^\omega\)。玩家1目标是一部计算在L(左),因此是一个成功的战略玩家1是一个保证生成的播放L(左)不管怎样玩家2收益。我们表明,在确定性环境中,透视策略(P(P)-策略)弱于完全可见的策略(F类-战略)。因此,有些游戏玩家1用一个F类-战略还没有赢得P(P)-战略。的弱点P(P)-策略应用;然而,仅适用于玩家1因此,玩家1有一个P(P)-战胜所有人的战略P(P)-的策略玩家2若(iff)玩家1有一个P(P)-战胜所有人的战略F类-的策略玩家2在概率设置中,P(P)-双方的策略都较弱。最后,在确定性和概率性设置中,透视游戏都是不确定的。因此,有些游戏玩家1没有获胜机会(或者在概率设置中几乎没有获胜机会)P(P)-战略L(左)也不是玩家2赢了P(P)补充战略L(左)虽然建立上述结果所需的证明和示例是新颖的,但所获得的图片与其他研究的部分能见度模型的已知图片相似[16,18].

推理游戏的首要问题是决定玩家是否有获胜策略。在这里,透视游戏和其他部分可见性模型之间的差异变得非常显著:处理纵向不确定性通常涉及将游戏图进行一些类似于子结构的转换,转换为具有完全可见性的指数大小的游戏图。因此,具有纵向不确定性的决策博弈在图中是EXPTIME完全的[5,11,16,18]. 在透视游戏中,我们可以避免图形大小的指数放大,并在获胜条件下(通常要小得多)将其与指数放大进行交换!本质上,虽然在纵向设置中,我们对图的当前位置存在不确定性,这会导致图中出现指数放大,但横向设置会导致获胜条件下自动机当前位置的不确定性,从而导致获胜条件出现指数放大。从技术上讲,我们的算法构造了一个交替树自动机,它完全接受描述获胜的所有树P(P)-战略玩家1.树枝对应于以下可能的选择玩家1,自动机向每个分支发送由玩家2我们分析了我们的算法对于由确定性或泛co-Büchi或奇偶自动机以及LTL公式给出的行为获胜条件的复杂性,并表明该问题对于所有上述类型的自动机都是EXPTIME-完全的,对于LTL是2EXPTIME完全的。在所有情况下,图的复杂性都是多项式的。关于下界,我们证明了对于固定大小的图和有限字上确定性自动机给出的获胜条件,该问题已经是EXPTIME困难的。我们的下限证明是由线性空间中的一个约简得到的交替图灵机,它使用部分可见性来强制玩家1生成接受计算,以尊重图灵机在配置的所有位置的转换函数。实际上,获胜条件检查的位置取决于玩家2在游戏的序言中玩家1没有观察到。总而言之,虽然求解透视游戏比求解全可见性游戏要困难得多,但指数放大只是在获胜的条件下。透视游戏的图形复杂性与无不确定性游戏的图形复杂度一致,并且比具有纵向不确定性的游戏图形复杂度指数低。

在概率设置中,我们证明了部分可观测性使玩家能够随机均匀地绘制数字。本质上,通过让玩家j个选择一个数字\(x_j\in\lbrace 0,\dots,n-1\rbrace),我们得到了\(x_1+x_2\mod{n}\)均匀分布在\(\l痕迹0,\dots,n-1\r痕迹)。这使得具有确定性co-Büchi自动机指定的获胜条件的透视游戏能够为概率co-Búchi自动机的空性问题建模。由于后一个问题无法确定[7,17],决定是否玩家1具有随机P(P)-策略几乎肯定会赢得相应的透视游戏。

具有行为获胜条件的决策游戏与ATL密切相关模型检查[5]. 时序逻辑ATL在多代理系统中提供对计算的选择性量化。具体来说,路径量词\(\langle\!\langle-A\rangle\!\rangle),对于集合A类玩家的范围,涵盖玩家的计算集A类可以强制系统进入。特别是游戏的初始顶点满足\(\langle\!\langle\mbox{PLAYER~1}\rangle\!\rangle\psi\)iff玩家1在比赛中有获胜的策略具有获胜条件\(磅/平方英寸)。路径量词\(\langle\!\langle\rangle\!\rangle\)假设F类-战略。ATL的一般扩展对于具有部分可见性的多代理系统是不可确定的,因为它允许异步进行的参与者之间的合作[46,48]. 已经研究了许多可判定的设置[5,6,9,10,12,45]. 与游戏一样,不确定性是纵向的,导致模型检查算法的图形复杂度指数高于ATL没有不确定性。

我们介绍观点-ATL公司,它扩展了ATL使用两个新的路径量词,\(语言\!语言A\等级\!等级_P\)和\(\langle\!\langleA\rangle\!\rangle_M\),该范围涵盖玩家在A类可以强制系统分别使用透视和无记忆策略。我们解决了以下的模型检查问题观点-ATL公司有两名球员,并表明它是2EXPTIME-完成的,就像ATL的一样。对于仅使用\(语言\!语言A\等级\!等级\)和\(\langle\!\langle-A\rangle\!\rangle_P\)路径量词,我们算法的图形复杂度仅为多项式。因此,处理横向不确定性比处理纵向不确定性容易得多。另一方面,使用路径量词对固定大小公式进行模型检查\(\langle\!\langle-A\rangle\!\rangle_M\)是NP-hard,这使得图的复杂性观点-ATL公司NP和co-NP都很难。从积极的方面来看,我们表明观点-ATL通过透视和无记忆路径量化扩展了ATL,模型检查在系统和规范中都是多项式的。从本质上讲,这是因为满足ATL目标所需的策略是无记忆的,因此是透视的,等等\(语言\!语言A\等级\!等级_P\)和\(\langle\!\langle A\langle\!\langle_M\)与\(\langle\!\langle\rangle\!\rangle\)。这个\(\langle\!\langle-A\rangle\!\rangle_M\)路径量词可以看作是回忆不完全的路径量词的特例,即当玩家A类没有不确定性,但记忆有限[52].

最后,我们研究了具有结构性获胜条件的视角博弈。由于无记忆策略是透视图,因此具有允许无记忆策略的获胜条件的游戏的决策程序适用于透视图游戏。这包括比奇、平价和拉宾条件。对于不允许无记忆策略的广义Büchi和Streett条件,我们研究了P(P)-策略并表明,虽然广义Büchi获胜条件并不总是允许无记忆策略,但它确实允许透视策略。因此,具有广义Büchi条件的透视对策的解相当于求解具有完全可见性的对策。另一方面,斯特雷特获胜的条件不允许采用透视策略。尽管如此,我们仍然能够描述一种算法,该算法用于确定透视Streett游戏,其复杂性在Streett条件下成对数量上是指数的,并且在图中是多项式的。我们使用允许透视策略的结构性获胜条件的特征,以指向在行为透视游戏中允许此类策略的LTL片段。

跳过2个人游戏部分

2前瞻性游戏

A类游戏图是元组\(G=langle AP,V_{1},V_}2},V_0,E,tau\rangle),其中AP公司是一组有限的原子命题,\(V_{1}\)和\(V{2})是不相交的顶点集,由玩家1玩家2,然后我们让\(V=V{1}\杯V{2}\)。然后,\(v0\在v{1}\中)是一个初始顶点,我们假设它属于玩家1、和\(E\subseteq V\乘以V\)是一个总边关系,因此对于每个\(v\ in v\)有\(v^{prime}\ in v\)这样\(E中的v,v^{prime})。功能\(tau:V\rightarrow 2^{AP})将每个顶点映射到一组原子命题大小 \第(|G|\)页,共页\(|E|\),即其中的边数。在游戏开始时,在\(v_0\)。然后,在每一回合中,拥有代币所在顶点的玩家选择一个后续顶点并将代币移动到那里。A类 \(\rho=v_0,v_1,\ldots\)英寸,是中的无限路径开始于\(v0\);因此\(\langle v_i,v_{i+1}\langle\在E\中)\(第0页)。这出戏\(\rho\)引发计算 \(τ(\rho)=τ(v_0),τ(v_1),在(2^{AP})^\omega\)中。A类游戏是一对\({\mathcal{G}}=langle G,L\rangle\),其中是一个游戏图,并且\(L\subseteq(2^{AP})^\omega\)是一个行为获胜条件,即\(\omega \)-原子命题上的正则语言,由LTL公式或自动机给出。1直觉上,玩家1目标是一部计算量很大的戏剧L(左),同时玩家2目标是一部计算在\({\it-comp}(L)=(2^{AP})^\omega\set-nuse-L\)。从形式上讲,我们区分了不同类别的战略和参与者的目标,定义如下。有时我们也指带有构造获胜条件.在那里,\(L\subseteq V^\omega)由\(\omega)-常规获胜条件(例如,Büchi或平价)超过V(V)相应地,图表可能不会被原子命题标记。

2.1确定性设置

\({\sf-Prefs}(G)\)是.对于序列\顶点的(\rho=v_0,\ldots,v_n),让\({\sf Last}(\rho)=v_n\)。对于\(j\in\lbrace 1,2\rbrace),让\({\sf Prefs}_{j}(G)=\lbrace\rho\ in{\sf Prefs}(G):{\sf Last}(\rho)\ in V_j\rbrace\)。因此,\({\sf Prefs}_{j}(G)\)是\({\sf-Prefs}(G)\)由最后一个顶点位于\(V_j\)。A类策略对于玩家j个是一个函数\(f_j:{\sf Prefs}_{j}(G)\rightarrow V\)这样对于每个\(在{\sf-Prefs}_{j}(G)中),我们有\(\langle{\sf Last}(\rho),f_j(\rho)\rangle\ in E\)。也就是说玩家j个映射以顶点结束的播放的前缀v(v)她继承了v(v)。为了技术方便,我们添加了\(\ε\)到\({\sf Prefs}_{1}(G)\)并且需要所有策略\第(f1)页,共页玩家1拥有\(f1(epsilon)=v_0)。因此,所有重头戏都以玩家1将令牌放置在\(v_0\)。这个结果两种策略\(f1)和\第(f_2\)页,共页玩家1玩家2分别是当玩家遵循策略时获得的游戏\(f1)和\(第2页)。正式地,\({\sf结果}(f1,f2)=v_0,v_1,\ldots\)是这样的\(i \ge 0),如果\(v_i\在v_j\中),然后\(v{i+1}=f_j(v0,\ldots,v_i))。

上述定义假设双方都能充分了解其策略所产生的游戏。我们现在考虑一个设置,其中玩家j个仅限于她拥有的顶点。请注意,自玩家j个决定这些顶点中的继承者,她也知道对继承者的访问,即使她没有继承者。形式上,对于前缀\(\rho=v_0,\ldots,v_i\ in{\sf Prefs}(G)\)和\(第1、2、2种族),视角 玩家j个\(\rho\),表示\({\sf-Persp}_j(\rho)\),是\(\rho\)到顶点\(v_j中的v_i)。我们表示玩家j个关于中的前缀\({\sf前缀}_{j}(G)\)由\({\sf PPrefs}_{j}(G))。形式上,\({\sf PPrefs}_{j}(G)=\lbrace{\sf Persp}_j(\rho):\rho\在{\sf Prefs}_{j}(G)\rbrace中)。请注意\({\sf PPrefs}_{j}(G)\substeq V_j^*\)。A类透视策略对于玩家j个然后是一个函数\(f_j:{\sf PPrefs}_{j}(G)\rightarrow V\)以便\(在{\sf-PPrefs}_{j}(G)中),我们有\(\langle{\sf Last}(\rho),f_j(\rho)\rangle\ in E\)。也就是说,针对玩家j个绘制她对以顶点结尾的剧本前缀的透视图v(v)她继承了v(v).视角策略的一个众所周知的特例是无记忆的:策略\(f_j\)是无记忆的如果每个\(\rho\in{\sf PPrefs}_{j}(G)\),我们有\(f_j(\rho)\)仅取决于\({\sf Last}(\rho)\)。也就是说,如果不区分到达同一顶点的剧本的前缀,则策略是无记忆的。请注意玩家j个可以视为一个函数\(f_j:V_j\右箭头V\)。

我们使用F类P(P)指出策略的可见性类型,即它们是否已满(F类)或观点(P(P)). 考虑一个游戏\({mathcal{G}}=langle G,Lrangle)。对于\(α,β在F种族,P种族),我们说玩家1\((\alpha,\beta)\)-获胜\({\mathcal{G}}\)如果有\(阿尔法)-策略\(f1)用于玩家1这样,对于每一个\(测试版)-策略\(f2)用于玩家2,我们有\(L中的tau({\sf结果}(f_1,f_2))。同样,玩家2\((\alpha,\beta)\)-获胜\({\mathcal{G}}\)如果有\(阿尔法)-策略\(f2)用于玩家2这样,对于每一个\(β)-策略\(f1)用于玩家1,我们有\(L中的tau({\sf结果}(f_1,f_2)))。

示例1。

考虑游戏图\(G_{mathit{m} 匹配}\)出现在图中1.让\({\mathcal{G}}=langle G_{\mathit{m} 匹配},\varphi\rangle\)与\(\varphi=\Box\,\Diamond\,((p\wedget\circ\circ p)\vee(q\wedged\circ q))。因此,玩家1旨在计算包含无限多次窗体窗口出现的次数\(p\cdot{\bf true}\cdot p\)或\(q\cdot{\bf true}\cdot q\)。很容易看出这一点玩家1 \((F,F)\)-获胜\({\mathcal{G}}\)。的确,考虑一个策略\(f1)用于玩家1她选择从\(v_\#\)到\(v_p\)每次访问\(v_\#\)之前访问了\(u_p\),并选择继续\(v_q\)每次访问\(v_\#\)之前访问了\(u_q\)。然后,对于每个策略\第(f2)页,共页玩家2、计算\(τ({\sf结果}(f1,f2))满足\(\psi=\Box\,(((\$\wedge\circ p)\rightarrow\circ\circp)\wedge(\$\ wedge\circ q)\right arrow\ circ\(\varphi\)。事实上,玩家1\((P,F)\)-获胜\({\mathcal{G}}\)。要了解这一点,请考虑一个策略\(f^{\prime}_1\)用于玩家1她从中获利\(v_\#\)到\(v_p\)和\(v_q\)交替。也就是说,在对顶点的奇数访问中\(v_\#\)她选择\(v_p\),甚至在访问\她选择了\(v_q\)。然后,对于每个策略\(f^{\prime}_2\)用于玩家2、计算\({\sf结果}(f^{prime}_1,f^{prime}_2)\(v_p\)后跟\(u_\$,u_p\)或\(u_\$,u_q,v_\#,v_q\),以及中的每次访问\(v_q\)后跟\(u_\$,u_q\)或\(u_\$,u_p,v_\#,v_p),保证\(\varphi\)满足要求。

图1。

图1。游戏图\(G_{mathit{m} 匹配}\)超过\(AP=\lbrace p,q,\#,\$\rbrace\)。玩家1的顶点是圆,玩家2的顶点是方形。初始顶点是\(v_{#}\)。

的获胜策略玩家1在示例中1假设完全可见玩家2。以下定理表明玩家2没关系。

定理2。

每一场比赛\({\mathcal{G}}\),我们有玩家1 \((F,F)\)-获胜\({\mathcal{G}}\)iff玩家1 \((F,P)\)-获胜\({\mathcal{G}}\),以及玩家1 \((P,F)\)-获胜\({\mathcal{G}}\)iff玩家1 \((P,P)\)-获胜\({\mathcal{G}}\)。

证明。

\({\mathcal{G}}=\langle G,L\langle)。首先,考虑F类P(P)策略\第(f1)页,共页玩家1,并假设\对于每一个F类-战略\第(f2)页,共页玩家2显然,\对于每一个P(P)-战略\(f_2\)用于玩家2.

对于另一个方向,考虑F类P(P)策略\第(f1)页,共页玩家1,并假设我们\(tau({\sf结果}(f_1,f_2))不在L中)F类-战略\第(f2)页,共页玩家2.让\(\rho={\sf结果}(f1,f2))。我们定义了一个P(P)-战略\(f^{\prime}_2\)用于玩家2这样,对于每个前缀\的(\rho^{\prime}\)\(\rho\)与\({\sf Last}(\rho^{prime})在V_{2}中有\(f^{prime}_2({\sf-Persp}_{2}(\rho^{prime}))=f2(\rho ^{primer})。注意,对于每两个不同的前缀\(\rho^{\prime},\rho_{\primes}\),共\(\rho\)与\({\sf最后}(\rho^{\prime})\),\({\sf Last}(\rho^{prime\prime})\在V_{2}\)中\({\sf-Persp}_{2}(\rho^{prime})和\({\sf-Persp}{2}(\rho^{prime\prime}))不同,因此\(f^{prime}_2)是很好定义的。现在,作为\({\sf结果}(f_1,f^{prime}_2)={\sf成果}(f1,f_2)\(\tau({\sf结果}(f_1,f^{\prime}_2)),而不是在L\中),我们完成了。□

由于可见性类型为玩家2没关系,我们可以从符号中省略它。即,针对\(\alpha\in\lbrace F,P\rbrace\),我们说玩家1 \(\alpha\)-获胜\({\mathcal{G}}\)如果存在\(阿尔法)-策略\(f1)用于玩家1这样,对于每个策略\(f2)用于玩家2(或F类P(P)),我们有\(\tau({\sf结果}(f_1,f_2))\在L\中)。

另一方面玩家1真的很重要。那就是,F类-战略玩家1严格来说比P(P)-战略。正式而言,我们有以下几点:

定理3。

有一个游戏\({\mathcal{G}}\)这样玩家1 F类-获胜\({\mathcal{G}}\)还没有玩家1不会P(P)-获胜\({\mathcal{G}}\)。

证明。

\({\mathcal{G}}=langle G_{\mathit{m} 匹配},\psi\rangle\),带\(\psi=\Box\,(((\$\wedget\circ p)\rightarrow\circ\circ p)\wedge(\$\ wedget\circ q)\right arrow\ circ\circ q))\)。因此,\(\psi\)需要玩家1继续\访问后(v_p\)\(u_p\)并继续\访问后(v_q\)\(u_q\)。在示例中1,我们展示了玩家1 F类-获胜\({\mathcal{G}}\)。另一方面,玩家1不会P(P)-获胜\({\mathcal{G}})。事实上,当玩家1具有洞察力,她可以在\(v_p\)和\(v_q)独立于玩家2因此,对于每个P(P)-战略\第(f1)页,共页玩家1,有一个策略\第(f2)页,共页玩家2这样的话\(\psi\)在中不满足\(τ({\sf结果}(f1,f2))。□

具有全可见性的游戏已确定也就是说,每场比赛\({mathcal{G}}=langleG,Lrangle),或者玩家1拥有确保满足L(左),或玩家2拥有确保满足\({\it comp}(L)\)[18,44]. 在游戏中从定理的证明、战略\第(f2)页,共页玩家2不是赢,而是阻止\(f1)获胜。事实上,没有玩家2正在获胜。正式而言,我们有以下几点:

定理4。

透视游戏尚未确定。

证明。

考虑游戏图\(G_{mathit{m} 匹配}\),并让\(\psi=\Box\,(((\$\wedget\circ p)\rightarrow\circ\circ p)\wedge(\$\ wedget\circ q)\right arrow\ circ\circ q))\)。如上所述,玩家1不会P(P)-获胜\(语言G_{m} 匹配},\psi\rangle\)。此外,作为玩家1F类-获胜\(语言G_{m} 匹配},\psi\rangle),我们有玩家2不会P(P)-获胜\(语言G_{mathit{m} 匹配},我们完成了。□

2.2概率设置

现在,我们将设置扩展为概率设置。有限集上的概率分布A类是一个函数\(\kappa:A\rightarrow[0,1]\)这样\(a}\kappa(a)=1\中的sum_{a\)。这个支持属于\(\kappa\)是集合\({\sf-Supp}(\kappa)=\lbrace a\ in a:\kappo(a)\gt 0\rbrace)。我们表示为\(mathcal{D}(A))上的概率分布集A类.A型随机策略对于玩家j个是一个函数\(g_j:{\sf Prefs}_{j}(g)\rightarrow\mathcal{D}(V)\)这样对于每个\({\sf前缀}_{j}(G)中的\rho\)\(v\在{\sf-Supp}(g_j(\rho))中,我们有\(\langle{\sf Last}(\rho),v\rangle\ in E\)。透视随机策略定义类似,如\(g_j:{\sf PPrefs}_{j}(g)\rightarrow\mathcal{D}(V)\)。事件是一个可测量的集合\计算的(L\substeq(2^{AP})^\omega\)。给定(可能是透视)随机策略\(g_1)和\在两个参与者中,事件的概率是唯一定义的[32]. 直觉上,事件的概率L(左)是获得计算在L(左)。我们表示为\(Pr_{g_1,g_2}(L)\)的概率L(左)当随机策略\(g_1)和\使用(g_2\)。我们还使用\(Pr_{g_1,g_2}(\psi)),对于LTL公式\(\psi\),指事件\(L(\psi)=\L滚道w:w\型号\psi\滚道\)。众所周知\(ω)-正则语言,因此也是LTL公式,是可测量的[55].

对于随机策略\第(g_1\)页,共页玩家1,我们这么说\(g_1\)是一个几乎获胜的战略如果\每个随机策略的(Pr_{g_1,g_2}(L)=1\)\第(g_2)页,共页玩家2与确定性情况一样,我们使用F类P(P)指出随机策略是否具有全面或前瞻性可见性,并讨论\((alpha,beta)-几乎赢了,因为\(第F、P种族中的α、β)。

在双方球员都能看到的比赛中,众所周知玩家1如果她有获胜(确定性)策略[44]. 这不再适用于透视游戏:

定理5。

有一个游戏\({\mathcal{G}}\)这样玩家1 \((P,F)\)-几乎获胜\({\mathcal{G}}\)还没有玩家1不会P(P)-获胜\({\mathcal{G}}\)。

证明。

\({\mathcal{G}}=langle G_{\mathit{m} 匹配},θ_\#\rangle\),用于\(\theta_\#=\Diamond\,((p\wedget\circ\#\wedged\circ\circ p)\vee(q\wedge\circ\#\wedge\ circ q))。考虑随机P(P)-战略\第(g_1\)页,共页玩家1每当她访问顶点时\(v_\#\),她移到继任者\具有概率的(v_p\)\(\frac{1}{2}\)和继任者\(v_q\)具有概率\(\压裂{1}{2}\)。很容易看出这一点\(g_1\)是一个\((P,F)\)-在\({\mathcal{G}})。然而,对于每个P(P)-战略\(f1)用于玩家1,有一个策略\(f2)用于玩家2这样的话\(\rho({\sf结果}(f_1,f_2)))不满足\(θ_\#\),因此玩家1不会P(P)-获胜\({\mathcal{G}})。□

在定理中2,我们证明了在确定性博弈中玩家2没关系。在概率设置中,这确实很重要。

定理6。

有一个游戏\({\mathcal{G}}\)这样玩家1 \((P,P)\)-几乎获胜\({\mathcal{G}}\)还没有玩家1不会\((P,F)\)-几乎获胜\({\mathcal{G}}\)。

证明。

\({\mathcal{G}}=langle G_{\mathit{m} 匹配},\theta_\$\rangle\),用于\(\theta_\$=\Diamond\,((p\wedget\circ\$\wedged\circ\circ p)\vee(q\wedge\circ\$\wedge\ circ q))\)。考虑战略\定理证明中描述的(g_1)5。请注意\(g_1\)是一个\((P,P)\)-在\({\mathcal{G}}\)。事实上,对于每一个随机P(P)-战略\第(g_2)页,共页玩家2,我们有\(Pr_{g_1,g_2}(θ_\$)=1)。另一方面,对于每一个随机P(P)-策略\(g^{\prime}_1\),共玩家1,有一个F类-战略\的(g^{\prime}_2\)玩家2这样的话\(Pr_{g^{prime}_1,g^{prime}_2}(θ_\$)=0\)。因此,玩家1没有\((P,F)\)-在\({\mathcal{G}})。□

最后,在确定性的情况下,可能没有玩家几乎赢了给定的透视游戏:

定理7。

透视游戏还没有完全确定。

证明。

考虑游戏图\(G_{mathit{m} 匹配}\),然后让\(\psi=\circ\circ\ circ((p\rightarrow\circ\scirc p)\楔形(q\right箭头\circ q))\)。很容易看出这两者都不是玩家1几乎P(P)-获胜\(语言G_{mathit{m} 匹配},\psi\rangle\)或玩家2几乎P(P)-获胜\(语言G_{mathit{m} 匹配},范围)。□

2.3透视交替时序逻辑

逻辑ATL为多代理系统中的计算提供选择性量化[5]. ATL中有两种类型的公式:状态公式,其满意度与系统建模游戏中的特定顶点有关,以及路径公式,其满意度与特定计算有关。正式地说,是ATL状态公式是以下公式之一:

(S1)

第页,用于\(AP中为p\)。

(S2)

\(\lnot\varphi _1)或\(\varphi_1\vee\varphi_2\),其中\(\varphi_1\)和\(\varphi 2\)为ATL状态公式。

(S3)

\(\langle\!\langle A\langle\!\langle\psi\),其中\(A\subseteq\lbrace\mbox{PLAYER~1},\mbox{PAYER~2}\rbrace\)是一组玩家和\(\psi\)是ATL路径公式。

一个ATL路径公式是以下公式之一:

(第1页)

一个ATL状态公式。

(第2页)

\(\lnot\psi_1)或\(\psi _1\vee\psi _2\),其中\(psi 1)和\(psi 2\)为ATL路径公式。

(第3页)

\(\circ\psi_1)或\(\psi_1{\mathcal{U}}\psi_2\),其中\(psi 1)和\(psi 2\)为ATL路径公式。

逻辑ATL由规则生成的一组状态公式组成(S1–3)。其他布尔连接词和时态运算符定义自\(\不\),\(\版本\),\(\circ\),和\({\mathcal{U}}\)以通常的方式;特别地,\(\Diamond\,\psi\,=\,{\bf true}{\mathcal{U}}\psi\)和\(\Box\,\psi\,=\,\lnot\Diamond\,\lnot \psi\.)。同样,CTL是CTL的一部分,逻辑ATL是ATL的片段它由所有公式组成,其中每个时态操作符前面都紧接着一个路径限定符。逻辑LTL由应用上述规则P1-3获得的路径公式组成,其中P1仅包含原子命题。

ATL的语义是根据游戏图定义的\(G=\langle AP,V_{1}\),\(V_{2}\),\(v_0\),\(E,tau\rangle)。在定义语义之前,我们需要一些符号。回想一下,给出了两种策略\(f1)和\第(f2)页,共页玩家1玩家2分别定义\({\sf结果}(f_1,f_2))作为通过出租获得的游戏玩家1玩家2跟随\(f1)和\(f2)从初始状态在这里,我们调整结果函数,以获得游戏开始的顶点和一组两个策略,每个玩家一个策略作为参数。因此,给定一个顶点v(v)和一套\({\mathcal{F}}=\l种族f1,f2种族),共玩家1玩家2战略,我们定义\({\sf结果}(v,{\mathcal{F}})=v^0,v^1,\ldots\),其中\(v^0=v\)和所有\(第1、2、2种族)和\(i \ge 0),如果\(v_j中的v^i\),然后\(v^{i+1}=f_j(v^0,\ldots,v^i))。

我们写作\(v\models\varphi)表示顶点v(v)满足状态公式\(\varphi\)并写入\(\rho\models\psi\)以指示该重头戏\(\rho=\rho_0,\rho_1,\ldots\)满足路径公式\(磅/平方英寸)。对于\(i \ge 0),让\(\rho^i)表示后缀\从位置(\rho\)因此,\(\rho^i=\rho_i,\rho{i+1},\rho{i+2},\ ldots\)。满意度关系\为所有顶点定义了(\models\)v(v)和游戏\第(\rho\)页,共页,归纳如下:

(S1)

\(v\models p\),用于\(AP中为p\),iff\(p\in\tau(v)\)。

(S2)

\(v\models\lnot\varphi_1)iff\(v\not\models\varphi_1),以及\(v\models\varphi_1\vee\varphi_2)iff\(v\models\varphi_1)或\(v\models\varphi 2\)。

(S3)

\(v\models\langle\!\langle A\rangle\!\rangle\psi\)如果存在集合\({\mathcal{F}})策略,每个玩家一个A类,对于所有集合\策略的(tilde{{mathcal{F}}),每个不在A类以及所有剧本\(在({\sf结果}(v,{{mathcal{F}}}\cup\tilde{{mathcal{F{}}))中,我们有\(\rho\models\psi\)。

(第1页)

\状态公式的(\rho\models\varphi)\(\varphi\)iff\(\rho_0\models\varphi\)。

(第2页)

\(\rho\models\lnot\psi_1)iff\(型号),以及\(\rho\models\psi_1\vee\psi_2)iff\(\rho\models\psi_1)或\(\rho\型号\psi 2\)。

(第3页)

\(\rho\models\circ\psi_1)iff\(型号),以及\(\rho\models\psi_1{\mathcal{U}}\psi_2)如果存在位置\(i \ge 0)这样\(\rho^i\models\psi_2)和所有位置\(0\le j\lt i\),我们有\(\rho^j\models\psi_1)。

例如,ATL公式\(\langle\!\langle\mbox{PLAYER~1}\rangle\!\rangle((\Diamond\,\Box\,\lnot{\it-req})\vee(\Box\、\Diamone\,{\it-grant}))断言玩家1有一个强制计算的策略,其中要么只发送有限多个请求,要么提供无限多个授权。

逻辑观点-自动变速器扩展ATL通过增强\(\langle\!\langle-A\rangle\!\rangle)路径量词A类(根据定理2,不在A类并不重要)。除了\(\langle\!\langle-A\rangle\!\rangle)对应于完全可见性,我们有路径限定符\(语言\!语言A\等级\!等级_P\)和\(\langle\!\langle-A\rangle\!\rangle_M\),其中策略分别是透视和无记忆的。正式而言,我们有以下几点:

\(v\models\langle\!\langle A\rangle\!\rangle_P\psi\)如果存在集合\的({\mathcal{F}}\)P(P)-策略,每个玩家一个A类,对于所有集合\(\波浪线{{\mathcal{F}}}\),共(F类P(P))策略,每个不在A类以及所有剧本\(在({\sf结果}(v,{{mathcal{F}}}\cup\tilde{{mathcal{F{}}))中,我们有\(\rho\models\psi\)。

\(v\models\langle\!\langle A\rangle\!\rangle_M\psi\)如果存在集合\({\mathcal{F}}\)无记忆策略,每个玩家一个A类,对于所有集合\(\波浪线{{\mathcal{F}}}\),共F类-策略,每个不在A类以及所有剧本\(在({\sf结果}(v,{{mathcal{F}}}\cup\tilde{{mathcal{F{}}))中,我们有\(\rho\models\psi\)。

模型检验问题对于观点-ATL公司,我们得到了一个游戏图和a观点-ATL公司公式\(\psi\),我们必须决定是否\(v_0\型号\psi\)。

我们还考虑观点-ATL,它通过透视和无记忆路径量化扩展了ATL。

跳过3AUTOMATA节

AUTOMATA公司

给定一个集合D类方向,aD类-树是一套\(T\subseteq D^{*}\)这样,如果\(x\cdot c\ in T\),其中\(D^{*}中的x\)和\(D\中的c\),然后也\(T\中的x\)。的元素T型被称为节点和空单词\(\varepsilon\)是属于T型。对于每个\(T\中的x\),节点\(x\cdot c\),用于\(c在D中),是继承人属于x个。调用没有后续节点的节点叶子.A型路径 \树的(\pi\)T型是一套\(\pi\subseteq T\),以便\(\varepsilon\in\pi\)和\(x\in\pi\),或者x个是一片叶子还是有一个独特的\(c在D中)这样\(x\cdot c\in\pi\)。给定一个字母表\(\西格玛\),a\(\Sigma\)-标记D类-树是一对\(langle T,tau rangle)其中T型是一棵树\(\tau:T\rightarrow\Sigma\)映射T型到中的一封信\(\西格玛\)。

对于一组X(X),让\({{\mathcal{B}}}^{+}(X)\)是上的正布尔公式集X(X)(即,从中的元素构建的布尔公式X(X)使用\(\楔子\)和\(\vee\)),其中我们还允许公式\({\bf true}\)和\({\bf false}\)。对于一组\(Y\substeq X\)和一个公式\(在{{mathcal{B}}^{+}(X)中的θ),我们说 满足 \(θ)iff赋值\({\bf true}\)到中的元素并分配\({\bf false}\)到中的元素\(X\设置减去Y\)使\(θ)为真。交替树自动机\({\mathcal{A}}=\langle\Sigma,D,Q,Q_{in},\delta,\alpha\langle\),其中\(\Sigma\)是输入字母,D类是一组方向,是一组有限的状态,\(delta:Q\times\Sigma\rightarrow{{mathcal{B}}^+(D\timesQ))是一个转换函数,\(q_{in}\ in q\)是初始状态,并且\(\alpha\)指定验收条件(定义\(Q^\omega\);我们在下面定义了几种验收条件)。对于一个州\(q\在q\中),我们使用\({\mathcal{A}}^q\)表示从\({\mathcal{A}}\),方法是将初始状态设置为q个. The大小属于\({\mathcal{A}}\),表示\(|{\mathcal{A}}|\),是出现在\(\增量\)。

交替自动机\({\mathcal{A}}\)运行于\(\西格玛\)-标记D类-树木。A类运行属于\上的({\mathcal{A}}\)\(\Sigma\)-标记D类-树\(langle T,taurangle)是一个\((T\倍Q)\)-标记\(\box{I$\!$N}\)-树\(\langle T_r,r)。的每个节点\(T_r)对应于的节点T型.中的节点\(T_r),标记为\((x,q)\),描述读取节点的自动机的副本x个属于T型并访问该州q个。请注意\(T_r)可以对应于T型。节点及其后续节点的标签必须满足转换函数。正式地,\(\langle T_r,r\rangle\)满足以下条件:

(1)

\(r(\varepsilon)=\langle\varepsilon,q_{in}\langle\)。

(2)

\(y\在T_r中)\(r(y)=langle x,q rangle)和\(δ(q,τ(x))=θ)。然后有一个(可能是空的)集合\(S=\l种族(c0,q_0),(c1,q_1)\),\(\ldots\),\(((c_{n-1},q_{n-1})\rbrace\substeq D\times q\),这样S公司满足\(θ),以及所有\(0\lei\len-1),我们有\(y\cdot i\ in T_r)和\(r(y\cdot i)=\langle x\cdot c_i,q_i\rangle\)。

例如,如果\(langle T,taurangle)是一个\(\lbrace 0,1\rbrace)-树\(\tau(\varepsilon)=a)和\(delta(q{in},a)=((0,q_1)\vee(0,q _2))\wedge((0、q_3)\ve(1,q_2)),然后在级别1上运行\(\langle T_r,r\rangle\)包括标记为\((0,q_1)\)或标记为的节点\((0,q_2)\),并包括标记为\((0,q3)\)或标记为的节点\((1,q_2)\)。请注意,如果,过渡函数\(\delta\)具有值\({\bf true}\),然后不需要有继任者。也,\(\delta\)永远不能有值\({\bf false}\)。

跑步\如果(\langle T_r,r\rangle\)的所有无限路径都满足接受条件,则接受。跑步\(\langle T_r,r\rangle)和无限路径\(\pi\subseteq T_r),让\(\inf(\pi)\subseteq Q)是这样的\(q\in\inf(\pi)\)当且仅当存在无穷多\(y\in\pi\),其中\(r(y)\在T\times\lbrace q\rbrace中)。那就是,\(\inf(\pi)\)正好包含在\(\pi\)。我们在此考虑三个验收条件,定义如下。一条路\(\pi\)满足:

比奇条件\(alpha\subseteq Q)当且仅当\(\inf(\pi)\cap\alpha\ne\emptyset\)。

co-Büchi公司条件\(alpha\subseteq Q)iff\(\inf(\pi)\cap\alpha=\emptyset\)。

奇偶校验条件\(\alpha:Q\rightarrow\lbrace 1,\ldots,k\rbrace)iff最小颜色\(i\in\lbrace 1,\ldots,k\rbrace),其中\(\inf(\pi)\cap\alpha^{-1}(i)\ne\emptyset\)为偶数。数字k个中的颜色\(\alpha\)称为指数自动机。

拉宾条件\(alpha=\lbrace\langle\alpha_1,\beta_1\rangle,\ldots,\langle\α_k,\beta _k\rangle\rbrace\subseteq 2^Q\times 2^Q)iff\(1)我们有\(\inf(\pi)\cap\alpha _i\ne\emptyset\)和\(\inf(\pi)\cap\beta _i=\emptyset\)。

对于这三个条件,如果存在接受树的运行,则自动机接受树\(L({{\mathcal{A}})\)所有\(\Sigma\)-标记D类-树木\({\mathcal{A}}\)接受。

下面我们讨论交替自动机的一些特殊情况。交替自动机\({\mathcal{A}}\)是不确定性的如果对于中出现的所有公式\(\delta\),如果\((c_1,q_1)和\((c2,q2))是结膜相关的,那么\(c1\ne c2\)。(即,如果转换以析取范式重写,则最多有一个元素\(\lbrace c\rbrace\times Q\),对于每个\(c在D中),在每个析取中)。自动机\({\mathcal{A}}\)是普遍的如果中出现的所有公式\(δ)是\(D乘以Q),以及\({\mathcal{A}}\)是确定性如果它既不确定又普遍。自动机\({\mathcal{A}}\)是一个单词自动机,如果\(|D|=1\)。那么,我们可以省略D类从自动机的规范出发,表示\({\mathcal{A}}\)作为\(delta:Q\times\Sigma\rightarrow{{mathcal{B}}^+(Q)\)。如果单词automaton是不确定的或通用的,那么\(delta:Q\times\Sigma\rightarrow 2^Q\),我们经常扩展\(delta)到状态集和有限字:for\(S\subseteq Q\),我们知道了\(\delta(S,\epsilon)=S\)和单词\(w\in\Sigma^*\)和一个字母\(\sigma\in\sigma\),我们有\(δ(S,w\cdot\sigma)=δ(δ(S,w),\sigma))。有时,我们对通过访问一些\(alpha\subseteq Q\)。为此,我们定义\(\delta_{\alpha}:2^Q\times\Sigma^+\rightarrow 2^Q\)如下。首先,\(δ_{\alpha}(S,\sigma)=δ(S,\sigma)\cap\alpha\)。那么,说一句话\(w\in\Sigma^+\),我们定义\(delta_{\alpha}(S,w\cdot\sigma)=\delta(\delta_}\alpha}(S,w),\sigma)\cup(\delta。因此,要么\在运行的前缀中访问(\alpha\),该前缀读取w个离开后S公司,或运行的最后状态为\(\alpha\)。不难通过归纳法证明w个对所有州来说\(在q中),我们有\(q\in\delta_{\alpha}(S,w)\)if存在从S公司w个达到q个和访问\离开后(\阿尔法\)S公司最后,我们说\(\Sigma\)-标记D类-树\(语言T,taurangle)是有规律的如果是所有信件\(\sigma\in\sigma\),我们有\(\tau^{-1}(\sigma))是D类。请注意,常规树可以由\((D,\西格玛)\)-传感器:确定性自动机D类每个州都用一个字母标记\(\西格玛\)。然后,\(τ(x)),对于节点\(x\在D^*\中)是标记传感器状态的字母,通过读取可以达到该状态x个.

我们用三个字母缩写来表示每种不同类型的自动机\(种族D、N、U、A\rbrace\times\lbrace B、C、P、R\rbrace\times\lbrace W、T\rbrace),其中第一个字母描述自动机的分支模式(确定性、非确定性、通用或交替),第二个字母描述接受条件(Büchi、co-Büchi、奇偶性或拉宾),第三个字母描述了自动机运行的对象(单词或树)。例如,APT是交替奇偶树自动机,UCT是通用co-Büchi树自动机。

跳过确定性设置部分中的4个指导行为前瞻性游戏

4确定性环境中的决策行为前瞻性游戏

在本节中,我们研究决定是否玩家1在给定的行为游戏中具有获胜的视角策略,因此其中获胜条件由自动机或LTL公式给出。我们还研究了观点-ATL公司模型检查问题。

4.1泛自动机的上界

考虑一个游戏图\(G=语言AP,V{1},V{2},E,V_0,tau\rangle)。对于顶点\(v\在v_{2}\中),a\((V_{2}^+\cdot V_{1})\)-来自的路径v(v)是有限路径\(v{2}^+\cdot v{1}中的v_1、v_2、\ldot、v_k)这样的话\(v_1=v\)。A类\(V_{2}^\omega\)-来自的路径v(v)是一条无限路径\(v_1,v_2,\ldots\in v_{2}^\omega\)in这样的话\(v_1=v\)。什么时候?玩家1将标记移动到顶点\(v\在v_{2}\中),标记可以遍历\((V_{2}^+\cdot V_{1})\)-路径\(\rho\)来自v(v),在这种情况下返回\(V_{1}\)英寸\({\sf Last}(\rho)\),或者它可以遍历\(V_{2}^\omega\)-路径自v(v),在这种情况下,它永远不会返回到中的顶点\(V_{1}\)。

考虑UCW\({\mathcal{U}}=\langle2^{AP},Q,Q_0,delta,alpha\rangle)和一个状态\(q\中的q\)。假设标记位于某个顶点\(v{1}中的v\)以及玩家1是强制令牌在中进行计算\(L({\mathcal{U}}^q)\)。进一步假设玩家1选择将标记移动到后续标记\(v^{prime}\)的v(v)。我们区分两种可能性。

\(v_{1}\中的v^{\prime}\)。然后玩家1是从强制令牌\(v^{\prime}\)转换为中的计算\(L({\mathcal{U}}^{q^{\prime}})\),用于所有状态\(q^{\prime}\in\delta(q,\tau(v))\)。

\(在v{2}中为v^{prime})。然后,我们区分两种情况。

有一个\(V_{2}^\omega\)-路径\(\rho\)来自\(v^{prime}\)和\(tau(\rho)不在L({\mathcal{U}}^{q^{prime}})中\(q^{prime}\ in \ delta(q,tau(v))\)。然后我们说\(v^{\prime}\)是一个陷阱\(语言v,q语言)的确,玩家2可以留在顶点中\(V_{2}\)并强制令牌进入不在\(L({\mathcal{U}}^{q^{prime}})\),确保玩家1不满意。

\(v^{\prime}\)不是的陷阱\(langle v,q rangle),在这种情况下,对于每个\((V_{2}^+\cdot V_{1})\)-路径\(\rho\cdot v^{\prime\prime}\)来自\(v^{prime}\),玩家1应强制放置一个令牌\(v^{\prime\prime}\)到中的计算\(L({\mathcal{U}}^{q^{prime}})\),用于所有状态\(q^{\prime}\ in \delta(q,\tau(v)\cdot\tau,\rho))。

上述直觉激发了以下定义更新的目标一双\(langle v,q rangle in v_1乘以q),代表目标玩家1强制放置令牌v(v)接受方q个,还有一个选择\(v)的继承人v(v),我们定义集合\(S^{v^{prime}}{v,q}\subseteq(v\timesQ\times\lbrace\bot,top\rbrace)\cup\lbrace{{false}}\rbrace\)更新的目标–这些目标玩家1必须满足才能满足她\选择后的(langle v,q)目标\(v ^{\prime}\)。这个\更新的目标中的(\lbrace\bot,\top\rbrace)标记用于跟踪中的访问\(阿尔法):更新的目标\(S^{v^{prime}}_{v,q}中的(langlev^{prime\prime},q^{primer},c\rangle)有\(c=\top\)如果玩家2可以强制访问\当\({\mathcal{U}}\)从q个\(q^{prime}\)沿着标记路径的单词v(v)通过\(v ^{\prime}\)到\(v ^{\prime\prime}\)。在形式上,我们定义\(S^{v^{prime}}{v,q})如下。首先,如果\(v^{\prime}\)是一个陷阱\(langle v,q rangle),然后\(S^{v^{\prime}}_{v,q}=\lbrace{{false}}\rbrace)。的确,曾经玩家1选择作为陷阱的顶点\(兰格尔v,q兰格尔),她无法实现她的目标。否则,\(S^{v^{prime}}_{v,q}\subseteq(v\times q\times\lbrace\bot,\top\rbrace))和一个三元组\(\langle v^{prime\prime},q^{prime},c\rangle)位于\(S^{v^{\prime}}_{v,q}\)如果下列条件之一成立:

\(v^{\prime}\在v_{1}\中),\(v^{prime\prime}=v^{prime}),以及\(q^{prime}\ in \ delta(q,tau(v))\)。然后,\(c=\top\)iff\(q^{prime}\in\alpha\)。

\(v^{\prime}\在v_{2}\中),有一个\((V_{2}^+\cdot V_{1})\)-路径\(\rho\cdot v^{\prime\prime}\)来自\(v^{prime}\),以及\(q^{\prime}\ in \delta(q,\tau(v)\cdot\tau,\rho))。然后,\(c=\top\)如果存在\((V_{2}^+\cdot V_{1})\)-路径\(\rho\cdot v^{\prime\prime}\)来自\(v ^{\prime}\)使得\(q^{\prime}\in\delta_\alpha(q,tau(v)\cdot\tau(\rho)))。

请注意,可能是\(v^{\prime}\)不是的陷阱\(\langle v,q\rangle),但没有\((V_{2}^+\cdot V_{1})\)-来自的路径\(v^{prime}\)。也就是说,所有来自\(v^{\prime}\)停留在顶点中\(V_{2}\)和位于\(L({\mathcal{U}}^{q^{prime}})\)代表全部\(q^{prime}\ in \ delta(q,tau(v))\)。然后,\(S^{v^{\prime}}{v,q}=\emptyset\)。

定理8。

\({\mathcal{G}}=\langle G,{\matchal{U}}\rangle\)是一个游戏,其中是一个游戏图\({\mathcal{U}}\)是一个UCW。我们可以建造一个UCT\({\mathcal{A}}_{\mathcal{G}}\)结束V(V)-标签\(V_{1}\)-树,以便\({\mathcal{A}}_{\mathcal{G}}\)接受V(V)-标签\(V_{1}\)-树\(语言V_{1}^*,eta\rangle)iff\(langle V{1}^*,eta rangle)获胜P(P)-战略玩家1.的大小\({\mathcal{A}}_{\mathcal{G}}\)是中的多项式\(|G|\)和\(|{\mathcal{U}}|\)。

证明。

\({\mathcal{U}}=\langle2^{AP},Q,Q_0,\delta,\alpha\rangle\)。我们定义\({\mathcal{A}}_{\mathcal{G}}=langle V,V_{1},Q^{prime},Q^{primer}_0,delta^{primes},alpha^{prime}),其中

\(Q^{\prime}=V\次Q\times\lbrace\bot,\top\rbrace\)。凭直觉,当\({\mathcal{A}}_{\mathcal{G}}\)处于状态\(langlev,q,c\rangle),它接受强制放置令牌的策略v(v)被接受的计算\({\mathcal{U}}^q\)。

\(q^{\prime}_0=\langle v_0,q_0,\bot\rangle\)。

对于所有人\(语言v,q,b等级\in v\times q\times\lbrace\bot,\top\rbrace\)和字母\(v^{prime}\ in v\),如果\(S_{v,q}^{v^{prime}}=\lbrace{{false}}\rbrace)或\(不是E(v,v^{prime})),然后\(delta^{prime}(langlev,q,b\rangle,v^{primer})={{false}})。否则,\(在S_{v,q}^{v^{prime}}(v^{rime\prime},v^{prime})中,开始{等式*}\delta^{prime}=\bigbedge_{\langlev^{\prime\prime},q^{\prime}、c\rangle\。\结束{方程式*}\)因此,对于每一个更新的需求\(语言v^{prime\prime},q^{prime},c\rangle\在S_{v,q}^{v^{prime}}\中),自动机在状态下发送一个副本\(langle v^{prime\prime},q^{prime},c\rangle)指向方向\(v^{prime\prime}\)。请注意,可能会向同一方向发送多个更新的需求。的确,不同\((V_{2}^+\cdot V_{1})\)-来自的路径\(v^{prime}\)可能会引出不同的单词\({\mathcal{U}}\)从读取q个此外,由于\({\mathcal{U}}\)是通用的,它可以发送不同状态的副本,即使是单个单词。注:;然而,所有州都被派往\(v^{\prime\prime}\)同意V(V)-元素,它是\(v^{prime\prime}\)。还要注意,当\(S^{v^{\prime}}{v,q}=\emptyset\),我们得到\(delta^{prime}(langlev,q,b\rangle,v^{prime})={bf-true})。

\(\alpha^{\prime}=V\times Q\times\lbrace\top\rbrace\)。回想一下\(\top\)标志表示玩家2可能会到达-遍历访问路径的更新需求中的元素\(\alpha\)。因此,co-Büchi要求访问\(alpha)只有有限多次才能达到访问州的要求\(\top\)仅有限次。  

 □

定理9。

\({\mathcal{G}}=\langle G,{\mathcal{U}}\langle)是一个游戏,其中是一个游戏图\({\mathcal{U}}\)是一个UCW。我们可以建造一个NBT\({\mathcal{A}}^{prime}_{\matchal{G}}\)overV(V)-标签\(V_{1}\)-树,以便有一个获胜P(P)-战略玩家1在里面\({\mathcal{G}}\)iff\(L({\mathcal{A}}^{\prime}_{\mathcal{G}})\)不为空。的大小\({\mathcal{A}}^{prime}_{\matchal{G}}\)是中的多项式\(|G|\)和指数\(|{\mathcal{U}}|\)。

证明。

根据定理8,我们可以建造一个UCT\({\mathcal{A}}_{\mathcal{G}}\)结束V(V)-标签\(V_{1}\)-树,以便\(L({\mathcal{A}}_{\mathcal{G}})\)不为空P(P)-战略玩家1在里面\({\mathcal{G}}\)。的大小\({\mathcal{A}}_{\mathcal{G}}\)是中的多项式\(|G|\)和\(|{\mathcal{U}}|\)。\({\mathcal{A}}_{\mathcal{G}}\)到\({\mathcal{A}}^{prime}_{\mathcal{G}}\)可以通过以下方法完成[39]. 下面我们分析结构,并说明\({\mathcal{A}}_{\mathcal{G}}\)在V(V)组件表示它是多项式\(|G|\)和指数\(|{\mathcal{U}}| \)。

对于\(k \ge 1),我们表示\([k]=\lbrace 1,\ldots,k\rbrace\)。中的施工[39]改造UCT\({mathcal{A}}_{mathcal{G}}=langle V,V{1},Q^{prime},Q^{prime}_0,delta^{primes},alpha^{primer})到NBT\带状态的({\mathcal{A}}^{\prime}_{\mathcal{G}}\)\(S=2^{Q^{\prime}\times[k]}\times 2^{Q^{\prime}\times[k]}\),其中k个是这样的\(|Q^{\prime}|\cdot k\)限定了NRT的大小,它等价于\({\mathcal{A}}_{\mathcal{G}}\),在\(|Q^{prime}|\)。此外,对于每个州\(语言P,语言S),我们有\(O\subseteq P\),如果\(语言q,i语言)和\(\langle q^{\prime},i^{\prime}\langle)在P(P)具有\(q=q^{prime}\),然后\(i=i^{prime}\)。因此S公司可以写成\(2^{Q^{\prime}}\乘以2^{Q^{\prime}}\times{{\mathcal{F}}\),其中\({{\mathcal{F}}\)是函数集\(f:Q^{\prime}\rightarrow[k]\)。回忆一下UCT的状态\({\mathcal{A}}_{\mathcal{G}}\)是\(Q^{\prime}=V\次Q\times\lbrace\bot,\top\rbrace\),并且\({\mathcal{A}}_{\mathcal{G}}\)在V(V)-组件。因此\NRT的({\mathcal{A}}_{\mathcal{G}}\)是中的多项式\(|G|\)和指数\(|{\mathcal{U}|\),因此k个是中唯一的多项式\(|G|\)。此外,对于每个\(语言P,O语言S),如果\(语言v、q、c、i)和\(语言v^{prime},q^{prime},c^{primer},i^{primes})位于P(P),然后从\({\mathcal{A}}_{\mathcal{G}}\)在V(V)-组件,我们有\(v=v^{prime}\)。因此S公司可以写成\(V\times 2^{Q\times\lbrace\bot,\top\rbrace\times 2^{Q\times \lbrace\bot,\top\rbrace}\times{\mathcal{F}}),其中\({{\mathcal{F}}\)是函数集\(f:Q\times\lbrace\bot,\top\rbrace\rightarrow[k]\)。因此,\(|S|\)是中的多项式\(|G|\)和指数\(|{\mathcal{U}|\)。□

由于NBT的非空问题\({mathcal{A}})可以在二次时间内求解[56],我们可以返回一个大小为\(O(|{\mathcal{A}}|)\)证明了非空性,我们可以得出一个上限:

推论10。

决定是否玩家1 P(P)-在透视游戏中获胜\(\langle G,{\mathcal{U}}\rangle\)用于UCW\({\mathcal{U}}\)位于EXPTIME中。这个问题可以用时间多项式在\(|G|\)和指数\(|{\mathcal{U}}|\)。此外,当玩家1 P(P)-如果获胜,算法将返回见证P(P)-利用尺寸多项式换能器的策略\(|G|\)和指数\(|{\mathcal{U}}|\)。

然而,正如我们在第节中所示4.3,UCW足够强大,可以对LTL中的目标进行推理,我们现在显示出推论10事实上,当UPW给出目标时,也适用。

定理11。

决定是否玩家1 P(P)-在透视游戏中获胜\UPW的(langle G,{mathcal{U}})\({\mathcal{U}}\)位于EXPTIME中。这个问题可以用时间多项式在\(|G|\)和指数\(|{\mathcal{U}}|\)。此外,当玩家1 P(P)-如果获胜,算法将返回见证P(P)-利用尺寸多项式换能器的策略\(|G|\)和指数\(|{\mathcal{U}}|\)。

证明。

在定理的证明中8,我们构建了一个UCT,其中更新的目标包括\(\lbrace\bot,\top\rbrace\)表示在co-Büchi条件下的访问。当UPW给出目标时\({\mathcal{U}}),我们定义更新的目标以包括访问的最小颜色。那就是,\(S^{v^{prime}}_{v,q}\substeq(v\timesQ\times\lbrace 1,\ldots,k\rbrace)\cup\lbrace{false}}\rbrace\),其中k个是的索引\({\mathcal{U}}\)是这样一个更新的目标\(\langle v^{prime\prime},q^{prime},c\rangle)位于\(S^{v^{prime}}_{v,q}\)如果玩家2可以强制进行磨合\({\mathcal{U}}\)来自q个\(q^{prime}\)中,沿着标记路径的单词访问的最小颜色v(v)通过\(v ^{\prime}\)到\(v^{\prime\prime}\)是c(c)然后,通过类似于定理证明中的结构8,我们获得UPT\({\mathcal{A}}_{\mathcal{G}}\)结束V(V)-标签\(V_{1}\)-树,以便\({\mathcal{A}}_{\mathcal{G}}\)接受V(V)-标签\(V_{1}\)-树\(语言V_{1}^*,eta\rangle)iff\(langle V_{1}^*,eta\rangle)获胜P(P)-战略玩家1.的大小\({\mathcal{A}}_{\mathcal{G}}\)是中的多项式\(|G|\)和\(|{\mathcal{U}}|\)。由[39],UPT空度可以通过多项式放大降为UCT空度。2因此,我们可以获得UCT\中大小多项式的({\mathcal{A}}^{\prime}_{\matchal{G}}\)\(|G|\)和\(|{\mathcal{U}|\),这样\({\mathcal{A}}^{prime}_{\matchal{G}}\)接受V(V)-标签\(V_{1}\)-树\(\langle V_{1}^*,\eta\langle \)iff\(langle V_{1}^*,eta\rangle)获胜P(P)-战略玩家1与UPT类似\({\mathcal{A}}_{\mathcal{G}}),UCT\({\mathcal{A}}^{prime}_{\mathcal{G}}\)在V(V)-组件。因此,我们可以转换UCT\({\mathcal{A}}^{prime}_{\mathcal{G}}\)到NBT\用[39]如定理证明所示9.的大小\({\mathcal{A}}^{\prime\prime}_{\mathcal{G}}\)是中的多项式\(|G|\)和指数\(|{\mathcal{U}}|\)。现在,该主张源于这样一个事实,即NBT的非空性问题可以在二次时间内解决[56],我们可以返回一个大小为\(O(|{\mathcal{A}}^{\prime\prime}_{\matchal{G}|)见证了非空性。□

4.2确定性自动机的下界

我们显示了EXPTIME下限共同安全规格。\(\omega\)-常规语言L(左)如果每个字都是安全的\(w\in\Sigma^\omega\),如果\(w\ in L\),然后w个有前缀x个这样的话\(x\cdot y\ in L\)表示所有\(y\in\Sigma^\omega\)[4]. 很容易看出,协同安全语言可以被DBW识别,DBW的唯一状态是\(\alpha\)是一个接受接收器,类似地,DCW的唯一状态不在\(\alpha\)是一个接受接收器。这种自动机处于瓦格纳层次结构的底部[58],它们被称为弱小的[\(-\)+]自动机,表示自动机是弱的,至多有一次从拒绝组件到接受组件的转换,我们表示确定性弱[\DWW的(-\)+]字自动机[\(-\)+].

定理12。

\({\mathcal{G}}=\langle G,{\matchal{A}}\rangle\)是一个游戏,其中是一个游戏图\({\mathcal{A}})是DWW[\(-\)+]. 决定是否玩家1有一场胜利P(P)-中的策略\({\mathcal{G}}\)是EXPTIME-hard。此外,对于固定大小,它已经是EXPTIME-hard.

证明。

我们显示了线性空间ATM的成员资格问题的减少。ATM是元组\(M=语言Q_e,Q_u,\Sigma,\Gamma),\(\增量\),\(q_{\it-init}\),\(q_{\it acc},q_{\it rej}\rangle\),其中\(Q_e)和\(Q_u\)是存在的普遍的国家,我们让\(Q=Q_e\杯Q_u\)。然后,\(西格玛)和\(\Gamma\)分别是输入字母和工作字母\(\Sigma\subseteq\Gamma),以及\(Delta\subseteq Q\times\Gamma\times Q\times Gamma\temes\lbrace L,R\rbrace)是一个转换关系。最后,\(q{初始化},q{访问}),以及\(q{\it-rej}\)分别是初始状态、接受状态和拒绝状态,我们假设\(在q_e中为q_{init}\)。在会员问题中,我们得到一个ATM作为输入M(M)和一个输入词\(w\in\Sigma^*\),我们决定是否M(M)接受w个.

的配置M(M)描述其状态、工作磁带上的内容以及读取头的位置。M(M)是线性空间ATM,有一些线性函数\(p:\nbox{I$\!$N}\rightarrow\mbox{I$\!$N{),以便工作磁带在每个配置中使用的单元格数M(M)运行时w个以为界\(p(|w|)\)。我们描述了M(M)一句话\(u\cdot q\cdot\gamma\cdot v\),用于\(u,v\in\Gamma^*\),\(\gamma\in\gamma\),以及\(q\中的q\)。然后,M(M)处于状态q个,磁带的内容是\(u\cdot\gamma\cdot v),读取头指向\(伽玛射线)。的初始配置M(M)w个,则为\(q_{\it init}\cdot w\cdot\texttt{}\^{p(|w|)-|w|}\),用于特殊字母\(\texttt{}\在\Gamma\中)。如果当前状态为\(q_{\it acc}\)或\(q{\it-rej}\),则配置是最终的,没有后续配置。否则,配置的后续项\(u\cdot q\cdot\gamma\cdot v)由以下公式确定\(\增量\)。对于每个元组\(\langleq,\gamma,q^{prime},\gama^{primer},d\rangle\in\Delta\),有一个通过移动到状态获得的后续配置\(q^{\prime}\),写入\(\gamma^{\prime}\)而不是\(\gamma\),并将头部向左或向右移动一个单元格,具体取决于d日.如果\(q\在q_e\中),配置为存在的、和M(M)可以选择后续配置并从中继续运行。如果\(q\在q_u\中),配置为普遍的、和M(M)从所有后续配置继续。因此M(M)w个导出顶点为M(M)的配置,以及w个被接受iff玩家1在与存在配置相关联的顶点中进行,有一个策略可以从可达性游戏中的初始配置中取胜,该游戏的目标是与配置关联的顶点\(q_{\it acc}\)。线性空间ATM的成员资格问题已经很难解决了M(M)固定大小,并且当\(Delta)存在状态和普遍状态之间的交替[15],因此\(\Delta\subseteq(Q_e\times\Gamma\ times Q_u\times\Gamma\ times\lbrace L,R\rbrace)\cup(Q_u\ times\Gamma\ times Q_e\times\Gamma\times\ lbrace L.,R\br race)\)。

上面描述的游戏图假设F类-战略及其规模在\(|w|\)。我们减排的最大挑战是使用P(P)-策略,以便使用固定大小的图形。我们首先描述了约简的主要思想,然后对其进行形式化描述。的顶点玩家1将维护有关上次转换的信息(尤其是M(M)),但没有关于磁带内容的信息。的顶点玩家2将维护有关上次转换的信息(尤其是M(M))和磁带头下的字母。在每个玩家1反过来,她选择了\(\增量\),对应于当前状态和字母,并移动到玩家2相应的顶点。由于当前字母没有编码在玩家1的顶点,那么玩家1可能会撒谎,但DWW[\(-\)+]会确保她输掉比赛。此外玩家2顶点玩家1选择移动必须与当前字母对应。同样,如果玩家1然后是DWW[\(-\)+]确保她输掉比赛。在一个玩家2然后,她根据当前状态和顶点中编码的字母组合选择一个转换,并移动到相应的玩家1顶点。回想一下M(M)在存在状态和普遍状态之间交替。因此,只有一个玩家2二者之间的顶点玩家1游戏中的顶点。这一事实使玩家1以保持磁带配置,尽管她只看到她的顶点。玩家1只要对应于的顶点\已达到(q{\it acc}\)。

DWW公司[\(-\)+]\({\mathcal{A}})确保玩家1在选择当前字母的转换以及将控件传递给玩家2。由于可能有成倍增长的磁带内容,\({\mathcal{A}}\)无法维护完整的磁带内容。相反,\({\mathcal{A}}\)只在特定位置维护字母\(0\le k\le p(|w|)-1\)。职位k个由选择玩家2在序言中,我们添加到游戏中。玩家1没有看到序言,因此她不知道k个因此为了避免损失,玩家1不应隐瞒任何磁带单元,因此应忠实地模拟M(M)w个因此,玩家1赢了P(P)-战略iffM(M)接受w个.

现在,我们正式描述减少。提供ATM\(M=语言Q_e,Q_u,\Sigma,\Gamma),\(\增量\),\(q_{\it-init}\),\具有线性空间复杂度函数的(q{it-acc},q{it-rej})\(p:\mbox{I$\!$N}\rightarrow\mbox{I$\!$N}\)和一个单词\(w=w_0,w_1,w_2,\ldots\in\Sigma^*\),我们构造了一个博弈\({\mathcal{G}}=\langle G,{\mathcal{A}}\rangle\)这样大小固定,\({\mathcal{A}}\)是中的多项式\(|w|\),和玩家1 P(P)-获胜\({\mathcal{G}}\)iffM(M)接受w个。对于\(j在e种族中,u种族),让\(\Delta_j\subset\Delta\)是\(Q_j\)。游戏图\(G=langle AP,V{1},V{2},V_0,E,tau\rangle)定义如下:

\(AP=\lbrace v_0,u_0,q_{\it init}\rbrace\cup\Delta\)。

\(V{1}=\lbrace V_0,q{\it init}\rbrace\cup\Delta _u\)。顶点\(v0\)是初始顶点,即顶点\(q{init}\)对应于处于状态的计算\(q_{\it init}\)在遍历任何转换之前,以及顶点\(\langleq,\gamma,q^{prime},\gama^{primer},d\rangle\in\Delta_u)对应于处于状态的计算\遍历转换后的(q^{prime}\)\(\langleq,\gamma,q^{prime},\gama^{prime},d\rangle)。

\(V_{2}=\lbrace u_0\rbrace\cup(\Delta _e\times\Gamma)\)。顶点\(u_0\)是其中玩家2选择位置k个由DWW监控[\(-\)+]\({\mathcal{A}})。顶点\(\langle t,\gamma\rangle\in\Delta _e\times\gamma\)对应于过渡\(t\in\Delta _e\)由选择玩家1在上一轮,和信中\(伽马射线)玩家1声称在当前的磁带头下。

这套E类包含以下边:

\(语言v_0,u_0语言),\(语言u_0、u_0),以及\(\langle u_0,q_{\it init}\langle\)。我们称这些边为序言属于.

\每\(t=langle q_{it init},\gamma_1,q^{prime},\ gamma_2,d\rangle\in\Delta _e)和\(\gamma\in\gamma\)。

\(\langle t,\langle t^{prime},\gamma\rangle\rangle),对于每个\(t=langle q_1,gamma_1,q_2,gamma_2,d\rangle\in\Delta _u\),\(t^{prime}=langle q_2,gamma^{prime}_1,q^{primer},gamma{prime{_2,d^{primes}rangle in Delta _e),以及\(\gamma\in\gamma\)。

\(\langle\langle t,\gamma^{prime}_1范围,t^{prime}范围),每\(t=langle q_1,gamma_1,q_2,gamma_2,d\rangle\in\Delta _e)和\(t^{prime}=langle q_2,\gamma^{prime}_1,q^{primes},\gama^{primer}_2,d^{primet}\rangle\in\Delta _u\)。

自循环位于\(u_0\)启用玩家2选择入住时间\(u_0\)。玩家1具有透视可见性,她不知道玩家2选择留在家里\(u_0\)。涉及过渡的边描述了要通过以下方式进行检查的计算\({\mathcal{A}}\)。

对于每个\(v\in\lbrace v_0,u_0,q_{\it init}\rbrace\cup\Delta _u\),我们有\(τ(v)=\lbrace v\rbrace),并且对于每个\(v=\langle t,\gamma\rangle\in\Delta _e\times\gamma\),我们有\(τ(v)=l种族t种族)。

DWW公司[\(-\)+]\({\mathcal{A}}=\langle\Sigma,S,S_0,\delta,\alpha\langle\)定义如下:

\(\Sigma=\lbrace v_0,u_0,q_{\it init}\rbrace\cup\Delta\)。

\(S=\lbrace S_0,S_{\it acc},S{\it rej}\rbrace\cup\bigcup_{0\le k\le p(|w|)-1}S^k\),其中\(S^k=\lbrace\langlek,\gamma,h\rangle:\gamma\in\gamma,0\leh\lep(|w|)-1\rbrace\)。三人组\(波长k,γ,h)英寸\(S^k\)表示字母的位置k个在磁带里是\(\gamma\),读取头的位置为小时。对于\(0\le k\le |w|-1\),让\(s_0^k=langle k,w_k,0rangle),对于\(|w|\le k\le p(|w|)-1\),并设\(s_0^k=\langle k,\texttt{},0\rangle\)。

\(delta:S\times\Sigma\rightarrow S\)定义如下:

(1)

对于\(s\in\lbrace s_{it acc},s_{it-rej}\rbrace)和\(\sigma\in\sigma\),我们有\(δ(s,σ)=s)。

(2)

对于每个\(s中的s)和\(\sigma\in\lbrace v0,q{\it-init}\rbrace)我们有\(δ(s,σ)=s)。

(3)

\(δ(s_0,u_0)=s_0^0),对于\(t \ in \ Delta \)我们有\(δ(s_0,t)=s_0)。

(4)

\(s=s_0^k\)。如果\(0\le k\le p(|w|)-2\)然后\(δ(s,u0)=s_0^{k+1})。如果\(k=p(|w|)-1\)那么\(δ(s,u0)=s_{根据})。因此玩家2在序言中确定位置k个那个\({\mathcal{A}}\)监视器。

(5)

对于每个k个\(在s^k\set-nuse\lbrace s_0^k\rbrace中)我们有\(δ(s,u_0)=s)。

(6)

\(s=语言k,gamma,h,以s^k表示)和\(t=langleq,gamma_1,q^{prime},gamma_2,d\rangle\in\Delta)。如果\(d=R),那么我们表示\(d^{prime}=1\),否则\(d^{prime}=-1\)。然后,我们有以下内容:

如果\(h+d^{prime}\not\in\lbrace 0,\ldots,p(|w|)-1\rbrace),然后\(δ(s,t)=s_{it-rej})。

如果\(h+d^{prime}\in\lbrace 0,\ldots,p(|w|)-1\rbrace),然后

*

如果\(h=k),然后

  • 如果\(伽马=伽马_1)和\(q^{\prime}=q{\itacc}\),然后\(δ(s,t)=s_{it acc}\)。

  • 如果\(伽马=伽马_1)和\(q^{\prime}\ne q_{\it acc}\),然后\(δ(s,t)=λk,γ_2,h+d^{prime}λ)。

  • 如果\(\gamma\ne\gamma_1),然后\(δ(s,t)=s_{it-rej})。

*

如果\(h\ne k\),然后

  • 如果\(q^{\prime}=q{\itacc}\)然后\(δ(s,t)=s_{it acc}\)。

  • 如果\(q^{\prime}\ne q_{\it acc}\)然后\(δ(s,t)=λk,γ,h+d^{prime}λ)。

\(\alpha=\lbrace s_{\it acc}\rbrace\)。  

 □

4.3紧密的复杂性

现在,我们已经准备好展示针对不同类别的行为获胜条件决定给定透视游戏的问题的严格复杂性。回忆一下输入\({mathcal{G}}=langleG,L\rangle)到问题有两个参数。因此,除了关节复杂性问题的复杂性\(|G|\)和描述L(左),我们也对其感兴趣图形复杂性,即\(|G|\),假设L(左)由固定大小的自动机或公式给出。事实上,通常远大于获胜条件的大小,是计算瓶颈[41].

定理13。

\({\mathcal{G}}=\langle G,\psi\rangle\)是一个游戏,其中\(\psi\)是LTL公式。决定是否玩家1有一场胜利P(P)-中的策略\({\mathcal{G}}\),并找到一个赢家P(P)-策略是2EXPTIME-complete。此外,对于固定大小的游戏图来说,问题已经是2EXPTIME-hard了。问题的图形复杂性是PTIME-complete。

证明。

对于上限,我们构造了一个NBW\({\mathcal{A}}_{\lnot\psi}\)尺寸指数\(|\psi|\)这样\(L({\mathcal{A}}_{\lnot\psi})=\lbrace w:w\not\models\psi\rbrace)[57]. 我们二元化\({\mathcal{A}}_{\lnot\psi}\)以获得UCW\(\psi\),然后使用推论10.

图复杂性的下限来自交替可达性的PTIME特性[28]. 我们现在证明了2EXPTIME下限。在[5]结果表明,决定是否玩家1赢了F类-游戏中的策略\({\mathcal{G}}=\langleG,\psi\rangle\)对于固定大小的游戏图来说已经是2EXPTIME-hard了和LTL公式\具有固定数量的原子命题。中的证据[5]减少可实现性问题[51]对于LTL公式\(\psi\)对博弈具有固定数量的原子命题\({\mathcal{G}}=\langle G,\psi\langle)\(G=\langle 2^{AP}\times\lbrace 1\rbrace,2^{AP}\timests\lbrace 2\rbrace,((2^{AP}\tormes\lbcrace 1\r race)\times(2^ AP}\ times\lbrace2\rbace))\cup(2^}AP}times\lbcrace2\r racE)\times\ times(2 ^{AP{times\ lbrace 1 \rbrace)),\langle\emptyset,1\rangle,AP,\tau\rangle),其中for every\(在2^{AP}中)我们有\(\tau(langle u,1\rangle)=\tau。因此,在的顶点之间交替玩家1玩家2因此,尽管玩家1具有洞察力,她了解整个剧本。因此,玩家1赢了F类-中的策略\如果她赢了P(P)-战略。因此,决定是否玩家1赢了P(P)-对于固定大小的游戏图来说,策略是2EXPTIME已经很难了。□

定理14。

\({\mathcal{G}}=\langle G,{\matchal{A}}\rangle\)是一个游戏,其中\({\mathcal{A}}\)是DWW[\(-\)+]或UPW。决定是否玩家1赢了P(P)-中的策略\({\mathcal{G}}\),并找到一个获胜的P(P)-策略是EXPTIME-complete。此外,对于固定大小的游戏图来说,问题已经是EXPTIME-hard了。问题的图形复杂性是PTIME-complete。

证明。

EXPTIME下限遵循定理12图复杂性的下限来自交替可达性的PTIME特性[28]. 上限来自定理11. □

4.4无记忆策略案例

回想一下,无记忆策略是透视策略的特例。在本节中,我们将研究决定游戏的问题,其中玩家1仅限于无记忆策略。令人惊讶的是,在这个看似简单的设置中,图的复杂度是NP-完全的,因此它比透视策略的多项式图复杂度更难。

定理15。

\({\mathcal{G}}=langleG,L\rangle)是一个游戏。决定是否玩家1\({\mathcal{G}}\),并找到一个成功的无记忆策略,当L(左)由LTL公式给出,当L(左)由DWW给出[\(-\)+]或UPW。在这两种情况下,问题的图形复杂性都是NP-完全的。

证明。

我们从以下情况开始L(左)由LTL公式给出,因此\({\mathcal{G}}=langle G,\psi\rangle\)。鉴于\({\mathcal{G}}),我们猜测玩家1在里面因此,对于每个顶点\(v\在v{1}\中),我们选择一个传出边。\(G^{\prime}\)是从通过删除中顶点的所有传出边\(V_{1}\)未选中。很容易看出玩家1正在从顶点获胜\(v0\)iff\(v_0\)英寸\(G^{\prime}\)满足\(磅/平方英寸)。这可以使用LTL模型检查在PSPACE中进行检查[53]. 因此,可以在PSPACE中检查所有可能的无记忆策略。PSPACE中的硬度来自LTL模型检查。事实上,当所有顶点都属于玩家2,该问题与检查\({\mathcal{G}}\)满足\(磅/平方英寸)。

我们继续讨论以下情况L(左)由DWW给出[\(-\)+]或UPW\({\mathcal{A}}\)。在这里,我们猜测并检查一个获胜策略玩家1然而,在这里,我们可以通过检查语言的交集的空性来检查多项式时间内的猜测见证\(G^{\素数}\)\({\mathcal{A}}\),它是一个NPW或DWW[+-](即通过对偶DWW获得的安全属性的确定性弱自动机[\(-\)+]). 因此,问题属于NP。

我们描述了问题2DP(两个顶点不相交路径)的简化,在中证明是NP完全的[24]. 在2DP中,我们得到了一个有向图\(G=\langle V,E\langle)和两个顶点\(v,u\ in v\),并且必须确定是否存在来自u个v(v)和来自v(v)u个也就是说,是否存在路径\(s_1、s_2、\ldot、s_k)和\(s^{\prime}_1,s^{\prime}_2,\ldots,s^{\prime}_{k^{\prime}\)使得\(s_1=s^{prime}_{k^{prime}=u\),\(s^{\prime}_1=s_k=v\),以及\(s1,s2,\ldot,s{k-1},s^{prime}_1,ss^{prime}_2,\ldots,s^}prime}{k^{prime}-1})都是不同的。

给出一个图表\(G=语言V,E)和两个顶点\(v,u\ in v\),定义游戏图\(G^{\prime}=\langle AP,V,\emptyset,V,E,\tau\rangle\),其中\(AP=\l种族p_1,p_2\r种族\),\(\tau(v)=\lbrace p_1\rbrace\),\(τ(u)=\lbrace p_2\rbrace),以及\(\tau(u^{\prime})=\emptyset\)表示全部\(u^{prime}\ not\ in \lbrace v,u\rbrace)。因此,玩家1拥有所有顶点,初始顶点为v(v),它的标签为\(p_1\),它是其中唯一的顶点\(p_1)保持不变。也,u个由标记\(p_2),它是其中唯一的顶点\(第2页)保持不变。现在,考虑一下(共同安全)语言\(L\subseteq(2^{lbrace p_1,p_2\rbrace})^\omega\)其中\(w\ in L\)iffw个在中有前缀\(p_1\cdot{\bf真}^*\cdot p_2\cdot}^*\ cdot p_1)。因此,L(左)是满足LTL公式的剧本集\(\psi=p_1\wedget\circ\Diamond\,(p_2\wedge\circ\Diamond_,p_1)\)。显然,L(左)也可以由DWW定义[\(-\)+]或固定大小的UPW。

我们证明了这一点\(langle G,v,u rangle in mbox{2DP})iff玩家1获胜\(langle G^{prime},L\rangle)使用无记忆策略。首先假设\(\langle G,v,u\rangle\in\mbox{2DP}\)。\(v=s1,s2,\ldot,sk=u=s^{prime}_1,s^{prime}_2,\ldots,s^}prime}_{k^{prime}}=v\)如上所述。考虑无记忆策略\(f:V\右箭头V\)\(f(s_i)=s_{i+1}\),对于\(1)和\(f(s^{prime}_i)=s^{prime}_{i+1}\),对于\(1)。很容易看出这一点\({\sf结果}(v,f)\)是一条无限路径,它反复遍历来自u个v(v)和来自v(v)u个因此,\(L中的{\sf结果}(v,f))和玩家1获胜\(语言G^{prime},语言)。

对于另一个方向,假设玩家1获胜\(langle G^{prime},L\rangle)使用无记忆策略。\(f:V\右箭头V\)是玩家1这样的话\({\sf结果}(v,f)\ in L\)。回想一下\({\sf结果}(v,f)=v,f(v),f^2(v)、f^3(v)和\ldots\)。\({\sf结果}(v,f)\)位于L(左),有一个最小值\(j)这样\(f^j(v)=v\)并且有\(0)这样\(f^i(v)=u)。我们要求所有人\(1 l1 l2 j),我们有\(f^{l1}(v)\ne f^{L2}(v)\)。请注意,这将完成证明,因为它意味着\({\sf结果}(v,f)\)证明\(语言G,v,u rangle in mbox{2DP})。所以,假设存在矛盾\(1\le l_1\lt l_2\le j\)\(f^{l1}(v)=f^{l2}(v)\)。然后,\({\sf结果}(v,f)=v,f(v),\ldots(f^{l_1}(v),\ltots f^{l-2-1}(f))^\omega\)。我们区分两种情况。首先,如果\(l2=j\),我们得到了与j个或存在\(0)这样\(f^i(v)=u)。那么,如果\(l2\ltj),我们得到一个矛盾\({\sf结果}(v,f)\)处于L(左). □

备注1。

2DP问题的NP-harrdness用于[31]证明决定是否玩家1在一般的比奇游戏中有一个无记忆的获胜策略。因此,具有结构广义的Büchi获胜条件。我们本可以使用类似的想法,或描述从中问题的直接简化[31]关于定理证明中的NP下界15事实上,我们在那里的削减也是有效的\(\psi=\Box\,\Diamond\,p_1\wedget\Box\,\ Diamond_,p_2\),对应于结构广义Büchi条件\(\lbrace\lbrace v\rbrace,\lbrace u\rbrace\rbrace)。公式\然而,(\psi\)不是共同安全的,上述内容只涵盖了这种情况L(左)由UPW提供。与具有结构广义Buchi获胜条件的游戏不同,具有结构DWW的游戏[\(-\)+]获胜条件对应可达博弈,并决定是否玩家1在结构DWW中具有无记忆的获胜策略[\(-\)+]游戏相当于决定游戏,可以在线性时间内完成。在节中6,我们详细阐述了在具有结构性获胜条件的游戏中的无记忆策略和透视策略。\(\方框\)

备注2。

在[8],作者研究了确定边标记图是否包含由给定正则语言中的单词标记的简单路径的复杂性。作者描述了3SAT的减少,表明问题是NP-hard。约简构造,给定命题公式\(θ)在3CNF中,是一个标记的完全定向网格和一个正则表达式,它强制网格中的简单路径与满足以下条件的赋值相对应\(θ)。约简及其证明非常复杂。无记忆策略的结果是简单的套索形路径。这种联系表明,我们在定理证明中描述的简化15可以调整以显示所研究问题的NP-harrdence[8]. 下面我们描述这种减少。

鉴于\(langle G,v,u rangle),考虑图\(G^{\prime}\)从通过复制v(v)\(v{\it-in}\)(带有进入v(v)在里面)和\(v{\it-out}\)(带离开的边v(v)在里面),并标记来自\(v_{\it-out}\)和\(v{\it-in-}\)由\(p_1\)和复制u个\(u{\it-in}\)(带有进入u个在里面)和\(u{\it-out}\)(带离开的边u个在里面),并添加标记为的边\(第2页\)来自\(u{\it-in-}\)到\(u_{\it out}\)。不难看出,我们的证明中使用的相同论点可以用来证明\(langle G,v,u rangle)在2DP iff中\(G^{\prime}\)有一个从开始的简单路径\(v_{\it-out}\)由in中的单词标记\(p_1\cdot{\bf真}^*\cdot p_2\cdot}^*\ cdot p_1)。\(\方框\)

4.5观点-ATL公司模型检查

对于ATL和ATL,模型检查问题分别为2EXPTIME-complete和PTIME-complete,图的复杂度为PTIME-complete[5]. 添加纵向不确定性使图形复杂度EXPTIME-完整[5]. 正如我们现在所展示的,透视部分可见性是免费的,而无记忆的透视部分可见性增加了图形的复杂性。

定理16。

的模型检查问题观点-ATL公司2EXPTIME-完成。对于固定大小的游戏图来说,问题已经是2EXPTIME-hard了。当唯一的路径限定符是\(语言\!语言A\等级\!等级\)和\(\langle\!\langle-A\rangle\!\rangle_P\),图形复杂性为PTIME-complete。使用路径限定符\(\langle\!\langle-A\rangle\!\rangle_M\),图的复杂度为\(Delta _2^P),并且是NP-和coNP-hard。的模型检查问题观点-ATL已完成PTIME。

证明。

我们从观点-ATL公司.下限遵循定理1315特别地,对于观点-ATL公司具有\(\langle\!\langle-A\rangle\!\rangle_M\)路径量词后面是对定理证明中使用的2DP进行补充的问题的简化15.

对于上限,让作为一个游戏图,让\(\varphi\)为观点-ATL公司公式。与CTL算法相同模型检查[21],我们标记每个顶点v(v)在里面通过的所有状态子公式\(\varphi\)保持不变v(v)。我们以自下而上的方式进行此操作,从最内层的状态子公式开始\(\varphi\)。对于最内层的状态子公式\(\varphi i \)和顶点v(v),我们决定是否\(\varphi _i)保持在v(v)如下所示。如果\(\varphi _i=\langle\!\langle A\rangle\!\rangle\psi\)\(A\subseteq\lbrace\mbox{PLAYER~1},\mbox{PAYER~2}\rbrace\),然后我们使用ATL模型检查[5]. 如果\(\varphi _i=\langle\!\langle A\rangle\!\rangle _P\psi\),然后我们继续如下。如果\(A=\lbrace\mbox{PLAYER~1}\rbrace\)或\(A=\lbrace\mbox{PLAYER~2}\rbrace\),然后我们使用定理13.如果\(A=\lbrace\mbox{PLAYER~1},\mbox{PAYER~2}\rbrace\)或\(A=\emptyset\),然后我们声明\(\varphi _i=\exists\psi\)或\(\varphi_i=\forall\psi\),并使用CTL模型检查。请注意,虽然对于\(\langle\!\langle\rangle\!\rangle\),它们需要以下项的证明\(\langle\!\langle-A\rangle\!\rangle_P\),因为不清楚P(P)-策略可以迫使所有的计算都发挥作用。为了看到他们可以,假设\顶点的(v\models\exists\psi\)v(v)所以,有一个剧本\(\rho=v_1,v_2,\ldots\)来自v(v)满足\(磅/平方英寸)。然后,玩家1玩家2可以合作以确保满足\(\psi\)使用P(P)-战略\(f1)和\(f2)这样对于每个前缀\(\rho^{\prime}=v_1,\ldots,v_i\)的\(\rho\),如果\(v_i\在v_j\中),然后\(fj({\sf-Persp}{j}(\rho^{prime}))=v{i+1})。因为每两个不同的前缀\(\rho^{\prime}\)和\(\rho^{\prime\prime}\),共\(\rho\)结束于\(V_j\),长度\({\sf-Persp}_{j}(\rho^{prime}))和\({\sf-Persp}_{j}(\rho^{prime\prime}))不相等,则\(f_j)定义明确。

我们继续这个案子\(\varphi_i=\langle\!\langle A\rangle\!\rangle_M\psi\)。如定理的上界15,我们猜一个无记忆的策略A类,并检查通过删除策略未选择的边而获得的图中的所有路径是否满足\(磅/平方英寸)。复杂性是PSPACE,图复杂性是NP。现在,当我们以自下而上的方式进行时\(\langle\!\langle-A\rangle\!\rangle_M\psi\)子公式需要这样的调用,这会将图形复杂性增加到\(Delta _2^P\)。

我们继续观点-ATL公司。考虑以下形式的公式\(\langle\!\langle A\rangle\!\rangle_P\theta\)或\(\langle\!\langle A\langle\!\langle_M\theta\),用于\形式的(θ)\(\circ\varphi 1\),\(\Box\,\varphi_1\)或\(\varphi_1{\mathcal{U}}\varphi_2\),对于一些状态公式\(\varphi 1\)和\(\varphi 2\)。请注意,在所有三种情况下,我们都有\(语言\!语言A\等级\!等级_P\θ)和\(\langle\!\langleA\rangle\!\rangle_M\theta\)都等价于\(\langle\!\langle-A\rangle\!\rangle\theta\)。的确,如果球员A类可以确保满足\(θ)由F类-策略,然后他们可以使用无记忆的策略来实现,而这些策略也P(P)-战略。因此,每个观点-ATL公式等价于通过替换每个公式获得的ATL公式\(语言\!语言A\等级\!等级_P\)或\(\langle\!\langle A\rangle\!\rangle_M\)路径限定符\(\langle\!\langle\rangle\!\rangle\)。然后,根据ATL模型检查的PTIME完整性提出了该主张[5]. □

备注3。

在发现模型检查的精确图形复杂性时观点-ATL公司公式\从复杂性理论的角度来看,(\langle\!\langle-A\rangle\!\rangle_M\)路径量词很有趣,它对我们的故事贡献不大。我们分析的一个可能收紧是通过复杂性类BH,它基于NP上的布尔层次结构。本质上,它是包含NP的最小类,并且在并集、交集和补集下是闭合的[59]. BH包含在\(Delta _2^P),我们推测流动逻辑[35],片段的图形复杂性观点-ATL公司通过限制形式子公式的数量获得\(\langle\!\langle A\rangle\!\rangle_M\psi\)对应于BH层次结构中的级别。\(\方框\)

跳过概率设置部分的5个决定前瞻性游戏

5概率环境下的透视博弈决策

In定理5,我们展示了一些游戏玩家1有一个\((P,F)-几乎获胜的策略,但没有P(P)-获胜策略。在这一节中,我们表明,对于DCW给定的行为目标,概率设置中关于透视游戏的推理是不可确定的(因此对于DPW和NBW也是如此)。

定理17。

决定是否玩家1 \((P,F)-几乎赢了,她是否\((P,P)\)-几乎赢得DCW透视游戏是不确定的。

证明。

我们证明了概率co-Büchi字自动机(简称PCW)的空性问题的简化,证明了它是不可判定的[7,17]. PCW是\({\mathcal{P}}=\langle\Sigma,Q,Q_0,\delta,\alpha\rangle\),其中\(\西格玛\)是字母表,是州,\(q0\)是初始状态,\(alpha\subseteq Q)是一个co-Büchi接受条件\(delta:Q\times\Sigma\times Q\rightarrow[0,1]\)是这样的\(q中的q)和\(\sigma\in\sigma\),我们有\(在q}\delta(q,sigma,q^{prime})中的sum_{q^{\prime}=1\)。一句话\(w\in\Sigma^\omega)被接受\({\mathcal{P}}\)如果w个在里面\({\mathcal{P}}\),表示为\(Pr_{{\mathcal{P}}}(w)\)为1。中的不可判定性证明[7,17]已经适用于PCW,其范围为\(delta)是有理数。因此,我们可以假设有一个公约数第页所有概率\({\mathcal{P}}\),这样\(\frac{1}{r}\)是一个整数。\(n=\frac{1}{r}\)。通过复制中的状态\({\mathcal{P}})我们可以进一步假设\({\mathcal{P}}\)等于\(\压裂{1}{n}\)。因此,对于\(q中的q)和\(\sigma\in\sigma\)n个状态,表示\(q_0^\sigma,\ldots,q_{n-1}^\sigma),使得\每\(k\in\lbrace 0,\ldots,n-1\rbrace)。

我们构建了一个游戏\({\mathcal{G}}=\langle G,{\mathcal{A}}\rangle\),其中\({\mathcal{A}}\)是DCW,这样\({\mathcal{P}}\)是非空的iff玩家1 \((P,F)\)-几乎获胜\({\mathcal{G}}\)。直观地说\({\mathcal{P}})通过玩家的随机策略进行模拟\({\mathcal{G}}\)。

游戏图具有\(AP=\Sigma\cup\lbrace 0,\ldots,n-1\rbrace\cup\lb race\#\rbrace)如图所示2.中的一个剧本具有无限轮序列,因此在每轮中玩家1选择\(\sigma\in\sigma\),玩家2选择索引\(i \in\lbrace 0,\ldots,n-1 \rbrace),然后玩家1选择索引\(第0、第1、第1种族中的j)。玩家1具有透视可见性j个都是独立的。因此,每个参与者\({\mathcal{G}})有可能确保精确模拟\({\mathcal{P}}\)通过选择到\(\lbrace 0,\ldots,n-1 \rbrace)顶点均匀随机。的确,如果玩家2选择\(i \in\lbrace 0,\ldots,n-1 \rbrace)均匀随机,然后玩家1选择j个不知道,则不考虑(可能随机)选择j个通过玩家1,索引\((i+j)\mod{n}\)均匀分布在\(\lbrace 0,\ldots,n-1\rbrace)。同样,如果玩家1选择j个均匀随机,那么\无论什么情况,(i+j)\mod{n}\)都是均匀分布的玩家2做。

图2。

图2。博弈图G在每个顶点上正好有一个原子命题在\(\Sigma\cup\lbrace 0,\ldots,n-1\rbrace\cup\blrace\#\rbrace)中成立。

DCW公司\({\mathcal{A}}=\langle\Sigma^{\prime},Q^{\prime}\({\mathcal{P}})如下:

\(\Sigma^{\prime}=\ Sigma\cup\lbrace 0,\ldots,n-1\rbrace\cup\blrace\#\rbrace)。

\(Q^{\prime}=Q\cup(Q\times\Sigma)\cup。

\(q^{prime}_0=q_0\)。

\(\delta^{\prime}:Q^{\rime}\times\Sigma^{\prime}\rightarrow Q^{\ prime}\)定义如下:

对于\(q中的q)和\(\sigma\in\sigma\),我们有\(delta^{prime}(q,\sigma)=\langleq,\sigma\rangle)。

对于\(语言q,在Qtimes\sigma中为sigma)和\(i\in\lbrace 0,\ldots,n-1\rbrace),我们有\(delta^{prime}(langleq,sigma\rangle,i)=langleq、sigma,i\rangle\)。

对于\(语言q,σ,i rangle in Qtimes\Sigmatimes\lbrace 0,ldots,n-1 race)和\(j\in\lbrace 0,\ldots,n-1\rbrace),我们有\(delta^{prime}(langleq,sigma,irangle,j)=q{(i+j)mod{n}}^sigma)。

对于每个\(q\在q^{prime}\中)我们有\(delta^{prime}(q,\#)=q\)。

对于每个\(q中的q)和\(k\in\lbrace 0,\ldots,n-1\rbrace)我们有\(delta^{prime}(q,k)=q\)。

对于每个\(q\ in(q\ times\Sigma)\ cup(q\ times\Sigma\ times\lbrace 0,ldots,n-1 race))和\(\sigma\in\sigma\)我们有\(delta^{prime}(q,sigma)=q\)。

\(\alpha^{\prime}=\alpha\)。

我们现在证明了简化的正确性,即\({\mathcal{P}}\)是非空的iff玩家1 \((P,F)\)-几乎获胜\(\langle G,{\mathcal{A}}\langle),并且\({\mathcal{P}}\)是非空的iff玩家1 \((P,P)\)-几乎是两翼。

首先假设\({\mathcal{P}}\)是非空的,让\(在L({\mathcal{P}})中为w\)。\(g_1)是随机的P(P)-战略玩家1这样,到\(\Sigma\)顶点是根据w个(即,在k个第次回合玩家1选择k个第个字母w个),以及选择\(j\in\lbrace 0,\ldots,n-1\rbrace)是均匀随机完成的。因为每一个随机选择\(i \in\lbrace 0,\ldots,n-1 \rbrace)由玩家2索引\((i+j)\mod{n})均匀分布,则对于每个随机策略\第(g_2)页,共页玩家2我们有\(Pr{g_1,g_2}(L({\mathcal{A}}))=Pr{{\mathcal{P}}}(w)=1\)。

假设现在\({\mathcal{P}}\)为空。\(g_2)是随机的P(P)-战略玩家2这样的话\(i \in\lbrace 0,\ldots,n-1 \rbrace)是均匀随机选择的。请注意,在随机P(P)-战略玩家1,选择j个不能依赖因此,对于每个随机P(P)-战略玩家1,索引\(i+j)mod{n})均匀分布。因此,对于每个策略\第(g_1\)页,共页玩家1,我们有\(Pr_{g_1,g_2}(L({\mathcal{A}}))是\({\mathcal{P}})接受一个单词w个它是根据由\(g_1\)。因为每一个字w个我们有\(Pr_{\mathcal{P}}}}(w)\lt 1\),则\(Pr_{g_1,g_2}(L({mathcal{A}})))。

因此,我们表明\({\mathcal{P}}\)是非空的iff玩家1 \((P,F)\)-几乎是双赢的。事实上,由于战略\第(g_2)页,共页玩家2上面定义的是透视图,那么我们也有透视图\({\mathcal{P}}\)是非空的iff玩家1 \(P,P)-几乎获胜。□

跳过6决定结构展望游戏部分

6决定结构性前瞻性游戏

一个广泛研究的问题是确定哪些游戏承认无记忆策略即,在哪些游戏中玩家1赢了F类-如果她有一个成功的无记忆策略[54]. 回想一下,每一个无记忆的策略都是视角。实际上,中的顶点\(V_j)包含在玩家j个因此,支持无记忆策略的游戏(例如,可达性、Büchi、co-Büchi.、Rabin和奇偶游戏[13])也承认P(P)-战略。4

在本节中,我们将研究哪些结构性获胜条件允许P(P)-战略。对于不允许无记忆策略的情况,这个问题特别有趣。让我们回顾一下一般化的比奇和斯特雷特获胜条件,它们不承认无记忆的策略。一条路\(V^\omega中的\rho\)满足:

广义Büchi条件\(\alpha=\lbrace\alpha_1,\ldots,\alpha_k\rbrace\substeq 2^V)iff\(\inf(\rho)\cap\alpha _i\ne\emptyset\)\(1)。

斯特雷特条件\(alpha=\lbrace\langle\beta_1,\alpha_1\rangle,\ldots,\langle\beta_k,\alfa_k\rangle\rbrace\subseteq 2^V\times 2^V\)iff\(\inf(\rho)\cap\beta_i\ne\emptyset\)暗示\(\inf(\rho)\cap\alpha _i\ne\emptyset\)\(1)。

正如我们现在所展示的,虽然广义的Büchi游戏不接受无记忆策略,但它们确实接受透视策略。从直觉上看,这是因为玩家1可以通过维持一个指示她下一个要满足的连接词的计数器,以一种循环的方式满足广义Büchi条件的不同连接词。

定理18。

广义Büchi游戏承认P(P)-战略。

证明。

\(G=langle V{1},V{2},V_0,E\rangle)是一个博弈图,让\(V=V{1}\杯V{2}\)\(|V|=n\),并让\(\alpha=\lbrace\alpha_1,\ldots,\alpha_{k}\rbrace\substeq 2^V)是广义的Büchi获胜条件。对于顶点v(v),我们表示为\(G^v)从通过将初始顶点更改为v(v)。我们证明如果玩家1 F类-获胜\(朗格·G,阿尔法·朗格),然后她也P(P)-赢了。让我们\(f1)获胜F类-战略玩家1在里面\(langle G,alpha rangle),然后让\(U\subseteq V\)是当玩家1根据播放\(第1页)。那就是,\(v在U中)如果有策略\第(f2)页,共页玩家2这样的话v(v)在中\({\sf结果}(f1,f2))。请注意,自U型是可到达顶点的集合,一个顶点\(在U\cap v_{2}中的v\)不能在\(V\set减去U\)。\(f1)是\(\langle G,\alpha\rangle),且获胜条件的满足与有限前缀无关,则\(f_1\)也是\(\langle G^v,\alpha\rangle),每\(v在U中)。因此,对于\(1 \le i \le k)和\(v在U中),战略\(f1)为玩家1在比奇的比赛中\(G^v\)与目标\(\alpha _i\cap U\)。我们用以下方式表示这场比赛\({\mathcal{G}}^{v,i}=\langle G^v,\alpha_i\cap U\rangle\)。由于比奇游戏承认无记忆策略,玩家1拥有无记忆的获胜策略\Büchi游戏的(g_1^{v,i})\({\mathcal{G}}^{v,i}\)\(v\在U\中)和\(1)。考虑以下内容P(P)-战略\(f^{\prime}_1\)用于玩家1。从开始\(i=1\),她根据\(g_1^{v_0,i})并保持一个计数器,该计数器在每次游戏访问中的顶点时都会增加\(V_{1}\)。\(g_1^{v_0,i}\)获胜且无记忆,该剧必须在年达到顶点\(\alpha _i\cap U\)最多在n个轮。当计数器至少为n个游戏达到顶点\(在U\cap v_{1}中为v\),然后玩家1重置计数器,增加\((i\mod{k})+1),并开始根据\(g_1^{v,i}\)(使用新的). 请注意,如果在某个点上播放达到了一些\(v\in\alpha_i\cap U\cap v_{2}),然后留在\(V_{2}\),则该剧必须满足\(阿尔法)根据U型此外,由于中的顶点\(U\cap V_{2}\)在中没有后续项\(V\set减去U\),如果玩家2不停留在\(V_{2}\)访问后无限多轮\(v\in\alpha_i\cap U\cap v_{2}),然后当播放移回顶点时\(v^{prime}\在v_{1}\中),我们有\(在U\中为v^{\prime}\),因此最终该剧达到\当计数器至少为n个因此,\(f^{\prime}_1)获胜P(P)-战略玩家1在里面\(语言G,α)。□

对于Streett条件,维护计数器是不够的,因为玩家1还应注意以下顶点玩家2可能访问过,使P(P)-战略弱于完全可见的战略:

定理19。

街头游戏不承认P(P)-战略。

证明。

我们用指数2证明了斯特雷特游戏的说法。\(G_{mathit{m} 匹配}\)是图中的游戏图1,并让\(\alpha=\lbrace\langle\lbrace v_p\rbrace、\lbrace-u_p\rbace\rangle、\langle\lcrace u_p\rdrace、\ lbrace v _p\rbrace\rangle\rbrace\)是斯特雷特获胜条件。因此,\(\alpha\)要求顶点\当顶点为\(u_p\)被无限频繁地访问。很容易看出这一点玩家1赢了F类-策略,其中从顶点\(v_\#\)她选择继续\(v_p\)每次访问\(v_\#\)之前访问了\(u_p\),并选择继续\(v_q\)每次访问\(v_\#\)之前访问了\(u_q\)。然而,玩家1没有获胜机会P(P)-战略。事实上P(P)-战略玩家1在里面\(G_{mathit{m} 观察}\)必须独立于玩家2以及每一个这样的战略玩家1,玩家2有一个策略\(\alpha\)不满意。□

我们现在可以用决定是否玩家1赢了P(P)-所有常见结构视角游戏中的策略。

定理20。

考虑一个结构视角游戏\({\mathcal{G}}=\langle G,\alpha\rangle\)。k个是的索引\(\alpha\)。决定是否玩家1 P(P)-获胜\({\mathcal{G}}\)可以在\(|G|\)和k个对于\(alpha),即Büchi、co-Büchi-或广义Büchi,以及时间多项式\(|G|\)和指数k个对于\(alpha)即奇偶校验、Rabin或Streett。

证明。

对于Büchi、co-Bu chi、广义Büchi、奇偶性和拉宾,复杂性来自于关于具有完全可见性的游戏的已知结果5[14,38,47,56]. 事实上,所有上述获胜条件都承认P(P)-战略。除了广义Büchi之外,所有的Büchi都承认无记忆策略,这是因为它们遵循定理18.

对于Streett,定理19这意味着我们应该开发一种新的算法。我们表示\(\alpha=\lbrace\langle\beta_1,\alpha_1\rangle,\ldots,\langle\beta_k,\alfa_k\rangle\rbrace\)。首先,我们减少了Streett游戏\(langle G,alpha rangle)到游戏\(\langle G^{\prime},\psi\rangle\),其中\(G^{\prime}\)是从通过给顶点赋值原子命题\(AP=\lbrace p_1,\ldots,p_k,q_1,\tots,q_k\rbrace\),以便\(p_i\ in \ tau(v)\)iff\(v\in\alpha_i\)和\(q_i \ in \ tau(v)\)iff\(v\in\beta_i\)。\(\psi=\bigwedge _{1\le i\le k}\Box\,\Diamond\,q_i\rightarrow\Box\,\Diamond\,p_i\)。显然,玩家1赢了P(P)-中的策略\如果她赢了P(P)-中的策略\(\langle G^{\prime},\psi\rangle\)。现在,根据定理11,这足以表明我们可以减少LTL公式\(\psi\)到UPW\中大小多项式的({\mathcal{A}}\)k个本质上,\({\mathcal{A}}\)由k个不相交的组件,每个组件都有三个状态-th组件负责检查中的th连词\(\psi\)满足要求。正式而言,UPW\({\mathcal{A}}\)这样\(L({\mathcal{A}})=L(\psi)\)我们构造如下:

回想一下\(\psi\)指定Streett获胜条件,因此\(\psi=\bigwedge_{1\lei\lek}\Box\、\Diamond\、q_i\rightarrow\Box\,\Diamone\、p_i\)。我们建立了一个UPW\({\mathcal{A}}\)这样\(L({\mathcal{A}})=L(\psi))。UPW公司\({\mathcal{A}}\)由k个不相交的组件,以及组件负责检查中的th连词\(\psi\)满足要求。每个单词\(w\in(2^{AP})^\omega\)正好有k个磨合\({\mathcal{A}}\),每个组件中运行一次。这个th分量由三个状态组成\(S^i=\lbrace S_q^i,S_p^i,S_{\bot}^i\rbrace\),用于监视带有标签的顶点中的访问\(q_i)和\(p_i\)。奇偶校验接受条件\(\alpha^{\prime}\)是这样的,对于\(1)我们有\(\alpha^{\prime}(s_p^i)=2\),\(alpha^{prime}(s_q^i)=3\)和\(α^{\prime}(s_{\bot}^i)=4\)。如果跑步\(\pi\)包含在然后是第个分量\(\inf(\pi)\subseteq S^i\)。因此,\(\alpha^{\prime}\)要求,如果运行在\(s_q^i\)那么它也应该无限频繁地访问\(s_p^i\)。正式来说,我们有\({\mathcal{A}}=\langle 2^{AP},S,S_0,\delta,\alpha^{\prime}\langle),其中:

\(S=\lbrace S_0\rbrace\cup\bigcup_{1\lei\lek}S^i\)。

\(delta:S\times 2^{AP}\rightarrow S\)定义如下。对于一封信\(2^{AP}中的sigma)我们有:

\(δ(s_0,\sigma)=\lbrace s_{\bot}^i:1\lei\lek\rbrace)。因此,我们开始k个管路,每个组件一个\(S^i\)。

对于每个\(1 \le i \le k)和每个\(在s^i\中)我们有:

*

如果\(p_i\in\sigma\)然后\(\delta(s,\sigma)=\lbrace s_p^i\rbrace)。

*

如果\(p_i\not\in\sigma\)和\(q_i\in\sigma\)然后\(δ(s,σ)=\lbrace s_q^i\rbrace)。

*

如果\(p_i,q_i不在sigma中)然后\(delta(s,\sigma)=\lbrace s_{\bot}^i\rbrace)。

\(\alpha^{\prime}:S\rightarrow\lbrace 1,\ldots,4\rbrace)是这样的\(\alpha^{\prime}(s_0)=1\)并且对于每个\(1)我们有\(\alpha^{\prime}(s_p^i)=2\),\(alpha^{prime}(s_q^i)=3\)和\(\alpha^{\prime}(s_{\bot}^i)=4\)。  

 □

我们注意到,在广义Büchi或Streett博弈的情况下,判定获胜无记忆策略的存在性在博弈图的大小上是NP-完全的,NP-harrdness已经应用于指数为2的广义Búchi获胜条件[31]. 通过定理20,决定获胜视角(而非无记忆)策略存在性的图形复杂度指数更低。

最后,对结构性获胜条件的研究P(P)-策略还诱导LTL片段承认P(P)-行为环境中的策略:

定理21。

考虑一个游戏\({\mathcal{G}}=langle G,\psi\rangle\)。如果\(\psi\)是以下形式的LTL公式\(\bigvee_{1\lei\lek}(\Box\,\Diamond\,p_i\wedge\Diamone\,\Box\、q_i)\)或\命题断言的(\bigwedge_{1\lei\lek}\Box\,\Diamond\,p_i\)\(p_i\)和\(q_i\)结束AP公司,然后玩家1 F类-获胜\({\mathcal{G}}\)iff玩家1 P(P)-获胜\({\mathcal{G}}\)。

跳过7讨论部分

7讨论

传统的部分可见性是纵向的——在所有顶点中,参与者只观察到原子命题的可观察子集的赋值。我们引入并研究了透视博弈,它为多智能体系统中的一种新型局部可见性建模。具有横向不确定性的透视游戏模型设置-玩家观察对所有原子命题的赋值,但仅在他们拥有的顶点上。如第节所述1横向不确定性存在于通信网络、交换系统和其他复合系统中,其中每个底层组件只能查看其控制的系统部分。我们表明,虽然横向不确定性与纵向不确定性具有许多相同的理论性质,但它更容易处理。我们的结果的底线是,除非规范形式是确定性自动机,否则我们研究的问题的复杂性与它们在没有不确定性的情况下的复杂性是一致的,并且对于所有类型的规范,复杂性在游戏图的大小上都是多项式的。直观地说,这是因为横向设置仅增加了与标记所遍历的游程后面的自动机状态有关的不确定性,而这种不确定性无论如何都存在于非确定性或交替自动机中。这与纵向不确定性形成对比,纵向不确定性的算法在博弈图中是指数的。

将部分可见性导致的不确定性与自动机中分支导致的不确定同步并不容易。从技术角度来看,我们没有考虑用NBW给出的目标来决定透视游戏的复杂性。为了处理LTL,我们在UCW上的结果就足够了。调查NBW的复杂性仍然很有意思,因为这一挑战与其他问题中面临的挑战类似,其中LTL的解决方案基于其向UCW的指数转换,当起点是NBW时,这是不合法的(参见无安全合成[30,39]). 我们还没有解决的另一个问题是具有LTL目标的概率透视游戏的可判定性。事实上,DCW的不可判定性结果使用了概率co-Büchi自动机已知的不可确定性结果,并且没有时间逻辑相似性。未来的其他工作包括将结果扩展到战略逻辑[19]以及用于求解透视游戏的符号算法的开发,这些算法在纵向设置中被证明是有趣且有用的[16,18].

从更具概念性的角度来看,我们看到了未来研究的几个有趣方向。如果游戏保持不变,那么扩展到有两个以上玩家的游戏是很简单的零和,因此玩家的目标形成了一个分区\((2^{AP})^\omega\)。一旦我们考虑到每个玩家都有自己的目标并且目标可能重叠的设置,游戏就变成非零和,我们关心它的稳定结果。研究了具有纵向不确定性的非零和对策[22,26]. 理性与不确定性的结合在计算上具有挑战性。例如,在有三个或更多玩家的游戏中,决定纳什均衡是否存在是不确定的[26]. 在后续工作中[34]研究具有横向不确定性的非零和对策,即透视多层对策。研究表明,横向不确定性导致在三个或三个以上参与者(包括联盟或非零和目标)的环境中无法确定。从积极的方面来说,在两层非零和透视游戏中,发现和推理稳定的结果是可以决定的,事实上,与纵向不确定性的情况不同,可以在与完全可视的游戏相同的复杂性中完成。这两种不确定性中另一个有趣的问题是联盟在这方面,应该区分联合目标中体现的协作和知识共享中体现的合作。ATL的几个扩展在部分可见性上下文中形式化不同的协作方案[10,25]可能与玩家的架构或策略的其他限制一起[2,]. 我们推测透视视点的计算优势被继承到这些模型中。计算优势还激发了LTL属性的特征化,这些属性允许透视策略。一般的问题是PSPACE-难,很容易从LTL可满足性中减少,而挑战是扩展我们在第节中描述的语法片段6.

最后,减少不确定性的透视游戏的变体是透视游戏带有通知,学习于[33]. 在那里,不确定性仍然是横向的,但玩家可能会收到关于访问她拥有的顶点之间发生的事件的通知。将纵向和横向不确定性结合起来是很有意思的。因此,考虑到游戏中玩家只能查看她控制的系统部分,甚至在其中,她的可见性是部分的。我们推测,关于这种游戏的推理在图及其获胜条件中都是指数的。

脚注

  1. 1 在节中2.3,我们正式定义了LTL和自动机。对于本节中的示例,我们指定L(左)在LTL中使用时态运算符\(\方框\,\)(始终),\(\钻石\,\)(最终),以及\(\circ\)(下一步)。

    脚注
  2. 2 中的转换[39]从APT到UCT,它涉及到字母表大小的指数放大。扩展的字母表指导UCT解决不确定性问题。因此,在UPT的情况下,字母表不会改变。

    脚注
  3. 复杂性类\(Delta _2^P)包括可由确定性多项式时间图灵机解决的所有问题,该机具有非确定性多项式时间图灵机的预言符,也称为 \({\rm P}^{\rm NP}\)。

    脚注
  4. 4 上述还表明,概率研究P(P)-这些目标的策略并不有趣,因为相应的透视游戏是确定的,因此概率策略与确定性策略相比没有优势。

    脚注
  5. 5 因此,经典游戏设置的改进导致透视游戏的改进。特别是,对于奇偶校验\(O(|G|^{log(k)+6})对拉宾来说是\(O(|G|^{k+1}\cdot k!)\)。

    脚注

参考文献

  1. [1]阿加瓦尔S。,科迪亚拉姆M.S。、和拉克希曼公司。.2013.软件定义网络中的流量工程.英寸第32届IEEE国际计算机通信会议记录.22112219.谷歌学者谷歌学者交叉引用交叉引用
  2. [2]奥戈特斯。.2006.交替时间时序逻辑中的动作和知识.合成 149,2(2006),375407.谷歌学者谷歌学者交叉引用交叉引用
  3. [3]亚历山那州。,洛根B。,Nga N.Hoang村、和拉基布A。.2009.资源有限联盟的逻辑.英寸第21届国际人工智能联合会议记录.659664.谷歌学者谷歌学者数字图书馆数字图书馆
  4. [4]阿尔卑斯山B。施耐德F.B。.1987.认识安全和活力.分布式计算 2, 3 (1987),117126.谷歌学者谷歌学者数字图书馆数字图书馆
  5. [5]阿鲁尔·R。,亨廷格T.A。、和库普夫曼·O。.2002.交替时间时序逻辑.美国医学会杂志 49,5(2002),672713.谷歌学者谷歌学者数字图书馆数字图书馆
  6. [6]氨基f B。,贾科莫·G·德,穆拉诺A。、和鲁宾S。.2018.假设条件下的综合.英寸第16届知识表示与推理原则国际会议论文集.615616.谷歌学者谷歌学者
  7. [7]拜尔C。,伯特兰·N。、和格勒·M。.2008.概率Büchi自动机的决策问题.英寸第十一届软件科学和计算结构基础国际会议论文集.施普林格,287301.谷歌学者谷歌学者
  8. [8]巴雷特·C。,雅各布·R·。、和马拉特·M。.2000.形式语言约束路径问题.SIAM计算机杂志 30,(2000),809837.谷歌学者谷歌学者数字图书馆数字图书馆
  9. [9]贝拉迪内利F。,洛姆西奥A。,穆拉诺A。、和鲁宾S。.2017.根据认知策略逻辑验证广播多智能体系统。第26届国际人工智能联合会议记录,卷。17.9197.谷歌学者谷歌学者交叉引用交叉引用
  10. [10]伯顿·R·。,莫伯特B。,穆拉诺A。,鲁宾S。、和瓦尔迪·M.Y。.2017.信息不完全的战略逻辑.英寸第32届IEEE计算机科学逻辑研讨会论文集.112.谷歌学者谷歌学者交叉引用交叉引用
  11. [11]伯旺格·D·。,查特吉K。,沃尔夫·M·德,Doyen L。、和亨廷格T.A。.2010.不完全信息奇偶博弈的策略构造.信息与计算 208,10(2010),12061220.谷歌学者谷歌学者数字图书馆数字图书馆
  12. [12]布林N。Jamroga W。.2014.比较不同的战略能力:不确定性和记忆如何影响游戏的一般属性.自治代理和多代理系统 28,(2014),474518.谷歌学者谷歌学者数字图书馆数字图书馆
  13. [13]Cachat T。.2002.双向树自动机求解下推游戏.英寸会议记录自动机逻辑与无限游戏.格拉代尔E。,托马斯·W·。、和威尔克T。(编辑),计算机科学课堂讲稿,卷。2500,施普林格,303317.谷歌学者谷歌学者交叉引用交叉引用
  14. [14]Calude C.S.公司。,Jain S。,Khoussainov B。,李伟(Li W.)。、和斯蒂芬·F。.2017.拟多项式时间中奇偶对策的判定.英寸第49届ACM计算理论研讨会论文集.252263.谷歌学者谷歌学者数字图书馆数字图书馆
  15. [15]钱德拉·A·K。斯托克迈耶·L·J。.1976.交替.英寸第17届IEEE计算机科学基础研讨会论文集.98108.谷歌学者谷歌学者数字图书馆数字图书馆
  16. [16]查特吉K。Doyen L。.2010.部分观测奇偶对策的复杂性.英寸第十六届程序设计人工智能和推理逻辑国际会议论文集.施普林格,114.谷歌学者谷歌学者交叉引用交叉引用
  17. [17]查特吉K。,Doyen L。,Gimbert H。、和亨廷格T.A。.2010.免费的随机性.英寸第35届计算机科学数学基础国际研讨会论文集.施普林格,246257.谷歌学者谷歌学者交叉引用交叉引用
  18. [18]查特吉K。,Doyen L。,亨廷格T。、和拉斯金J.-F。.2007.不完全信息下欧米伽规则博弈的算法.计算机科学中的逻辑方法 ,(2007).谷歌学者谷歌学者
  19. [19]查特吉K。,亨廷格T.A。、和皮特曼N。.2010.战略逻辑.信息与计算 208,6(2010),677693.谷歌学者谷歌学者数字图书馆数字图书馆
  20. [20]阿尔法罗·L·德,亨廷格T.A。、和库普夫曼·O。.1998.并发可达性游戏.英寸第39届IEEE计算机科学基础研讨会论文集.564575.谷歌学者谷歌学者交叉引用交叉引用
  21. [21]艾默生E.A。雷氏C-L。.1987.模型检查的模式:分支时间逻辑反击.计算机程序设计科学 8,第3页(1987),275306.谷歌学者谷歌学者数字图书馆数字图书馆
  22. [22]菲利奥特E。,Gentilini R。、和拉斯金J.-F。.2018.不完全信息下的理性综合.英寸第33届IEEE计算机科学逻辑研讨会论文集.ACM公司,422431.谷歌学者谷歌学者数字图书馆数字图书馆
  23. [23]菲斯曼D。库普夫曼·O。.2009.有限状态切换系统的推理.英寸第五届国际海法核查会议闭幕词,计算机科学课堂讲稿,卷。6405.施普林格,7186.谷歌学者谷歌学者
  24. [24]财富S。,霍普克罗夫特J。、和威利J。.1980.有向子图同胚问题.理论计算机科学 10,2(1980),111121.谷歌学者谷歌学者交叉引用交叉引用
  25. [25]戈兰科五世。贾姆罗加·W。.2016.并发多层博弈的状态和路径联盟有效性模型.自治代理和多代理系统 30,(2016),446485.谷歌学者谷歌学者数字图书馆数字图书馆
  26. [26]古铁雷斯·J·。,Perelli G。、和伍尔德里奇M.J。.2018.反应模块游戏中的不完整信息.信息与计算 261, 4 (2018),650675.谷歌学者谷歌学者交叉引用交叉引用
  27. [27]Halpern J.Y.公司。瓦尔迪·M.Y。.1986.知识与时间推理的复杂性:扩展抽象.英寸第18届ACM计算理论研讨会论文集.ACM公司,304315.谷歌学者谷歌学者
  28. [28]伊梅尔曼N。.1981.量词的数量优于磁带单元格的数量.计算机与系统科学杂志 22,(1981),384406.谷歌学者谷歌学者交叉引用交叉引用
  29. [29]贾姆罗加·W。,彭泽克·W·。,德姆宾斯基P。、和Mazurkiewicz A.W.公司。.2018.战略能力的部分订单削减.英寸第17届自治代理和多代理系统国际会议记录.156165.谷歌学者谷歌学者数字图书馆数字图书馆
  30. [30]Jobstmann B。布隆·R。.2006.LTL合成的优化.英寸第六届计算机辅助设计形式方法国际会议论文集.117124.谷歌学者谷歌学者数字图书馆数字图书馆
  31. [31]Jobstmann B。,格雷斯迈耶A。、和布隆·R。.2005.作为游戏修复程序.英寸第十七届计算机辅助验证国际会议记录,计算机科学课堂讲稿,卷。3576.226238.谷歌学者谷歌学者数字图书馆数字图书馆
  32. [32]凯门尼J.G。,斯内尔J.L。、和纳普A.W。.1976.可数马尔可夫链.施普林格.谷歌学者谷歌学者交叉引用交叉引用
  33. [33]库普夫曼·O。Shenwald北。.2020.带有通知的透视游戏.英寸第40届软件技术与理论计算机科学基础会议论文集,卷。182.达格斯图尔-莱布尼兹·泽特鲁姆宫(Schloss Dagstuhl-Leibniz-Zentrum für Informatik),51:1–51:16.谷歌学者谷歌学者
  34. [34]库普夫曼·O。Shenwald北。.2021.透视多层游戏.英寸第36届IEEE计算机科学逻辑研讨会论文集.113.谷歌学者谷歌学者数字图书馆数字图书馆
  35. [35]库普夫曼·O。瓦尔迪·G。.2019.流程逻辑.计算机科学中的逻辑方法 15,4(2019).谷歌学者谷歌学者
  36. [36]库普夫曼·O。瓦尔迪·G。.2019.透视游戏.英寸第34届IEEE计算机科学逻辑研讨会论文集.113.谷歌学者谷歌学者交叉引用交叉引用
  37. [37]库普夫曼·O。瓦尔迪·M.Y。.2000.不完全信息合成.英寸时间逻辑的进展.Kluwer学术出版社,109127.谷歌学者谷歌学者交叉引用交叉引用
  38. [38]库普弗曼O。瓦尔迪·M.Y。.2004.从补充到认证.英寸第十届系统构建与分析工具与算法国际会议论文集,计算机科学课堂讲稿,体积。2988.施普林格,591606.谷歌学者谷歌学者交叉引用交叉引用
  39. [39]库普夫曼·O。瓦尔迪·M.Y。.2005.无安全决策程序.英寸第46届IEEE计算机科学基础研讨会论文集.531540.谷歌学者谷歌学者数字图书馆数字图书馆
  40. [40]利伯松D。.2003.切换系统和控制.比克豪泽.谷歌学者谷歌学者交叉引用交叉引用
  41. [41]Lichtenstein O。普努埃利A。.1985.检查有限状态并发程序是否满足其线性规范.英寸第十二届ACM程序设计语言原理研讨会会议记录.97107.谷歌学者谷歌学者数字图书馆数字图书馆
  42. [42]卢斯蒂格·Y。瓦尔迪·M.Y。.2013.从组件库合成.技术转让软件工具 15,5–6(2013),603618.谷歌学者谷歌学者数字图书馆数字图书馆
  43. [43]马加里奥特·M。.2006.用变分原理分析切换系统的稳定性:简介.Automatica公司 42,12(2006),20592077.谷歌学者谷歌学者数字图书馆数字图书馆
  44. [44]马丁D.A。.1975.Borel确定性.数学年刊102, 2 (1975), 363–371.谷歌学者谷歌学者交叉引用交叉引用
  45. [45]莫伯特B。穆拉诺A。.2018.层次信息下知识与策略的推理.英寸第十六届知识表示与推理原理国际会议论文集.谷歌学者谷歌学者
  46. [46]彼得森·G.L。赖夫·J.H。.1979.多人轮换.英寸第20届IEEE计算机科学基础研讨会论文集.348363.谷歌学者谷歌学者数字图书馆数字图书馆
  47. [47]皮特曼N。普努利A。.2006.rabin和街头游戏的更快解决方案.英寸第21届IEEE计算机科学逻辑研讨会论文集.275284.谷歌学者谷歌学者数字图书馆数字图书馆
  48. [48]普努埃利A。罗斯纳·R。.1990.分布式反应系统很难合成.英寸第31届IEEE计算机科学基础研讨会论文集.746757.谷歌学者谷歌学者数字图书馆数字图书馆
  49. [49]Puchala B。.2010.部分信息异步欧米伽规则游戏.英寸第35届计算机科学数学基础国际研讨会论文集.施普林格,592603.谷歌学者谷歌学者交叉引用交叉引用
  50. [50]赖夫·J.H。.1984.不完全信息两层博弈的复杂性.计算机与系统科学杂志 29, 2 (1984),274301.谷歌学者谷歌学者交叉引用交叉引用
  51. [51]罗斯纳·R。.1992.反应系统的模块化综合.博士论文.以色列魏茨曼科学研究所.UMI订单号:DP17517。谷歌学者谷歌学者
  52. [52]肖本斯P.Y。.2004.具有不完全召回的交替时间逻辑.理论计算机科学电子笔记 85,2(2004),8293.谷歌学者谷歌学者交叉引用交叉引用
  53. [53]Sistla A.P.公司。克拉克E.M。.1985.命题线性时序逻辑的复杂性.ACM学报 32, 3 (1985),733749.谷歌学者谷歌学者数字图书馆数字图书馆
  54. [54]托马斯·W·。.1995.无限对策中策略的综合.英寸第十二届计算机科学理论方面研讨会论文集,计算机科学课堂讲稿,卷。900.施普林格,113.谷歌学者谷歌学者
  55. [55]瓦尔迪·M.Y。.1985.概率并发有限状态程序的自动验证.英寸第26届IEEE计算机科学基础研讨会论文集.327338.谷歌学者谷歌学者数字图书馆数字图书馆
  56. [56]瓦尔迪·M.Y。Wolper P.公司。.1986.程序模态逻辑的自动机理论技术.计算机与系统科学杂志 32,2(1986),182221.谷歌学者谷歌学者数字图书馆数字图书馆
  57. [57]瓦尔迪·M.Y。Wolper P.公司。.1994.关于无限计算的推理.信息与计算 115,1(1994),137.谷歌学者谷歌学者数字图书馆数字图书馆
  58. [58]瓦格纳·K。.1979.打开\(\omega\)-正则集.信息和控制 43,第2页(1979),123177.谷歌学者谷歌学者交叉引用交叉引用
  59. [59]韦奇星G。.1985.关于NP的布尔闭包.英寸计算理论基础国际会议论文集,计算机科学课堂讲稿,体积。199.施普林格,485493.谷歌学者谷歌学者交叉引用交叉引用

索引术语

  1. 透视游戏

      建议

      评论

      登录选项

      请检查您是否可以通过登录凭据或您的机构访问此文章以获得完全访问权限。

      登录

      完全访问权限

      • 发布于

        封面图片ACM计算逻辑事务
        ACM计算逻辑事务 第25卷第1期
        2024年1月
        312页
        国际标准编号:1529-3785
        EISSN公司:1557-945倍
        内政部:10.1145/3613508
        期刊目录

        版权所有©2024版权归所有人/作者所有。

        本作品根据Creative Commons Attribution International 4.0许可证授权。

        出版商

        计算机协会

        美国纽约州纽约市

        出版历史

        • 出版:2024年1月17日
        • 在线AM:2023年10月30日
        • 认可的:2023年9月14日
        • 收到:2023年1月17日
        发布于tocl公司第25卷第1期

        检查更新

        限定符

        • 研究论文
      • 文章指标

        • 下载次数(过去12个月)251
        • 下载次数(最近6周)46

        其他指标

      PDF格式

      以PDF文件查看或下载。

      PDF格式

      电子阅读器

      使用eReader联机查看。

      电子阅读器