×

应对自私的持续行为。 (英语) Zbl 1310.68135号

Clarke,Edmund M.(编辑)等人,《编程逻辑、人工智能和推理》。第16届国际会议,LPAR-16,塞内加尔达喀尔,2010年4月25日至5月1日。修订了选定的论文。柏林:施普林格出版社(ISBN 978-3-642-17510-7/pbk)。计算机科学课堂讲稿6355。《人工智能课堂讲稿》,501-516(2010)。
总结:理性和自私的环境可能会诱使人们欺骗与其交互的系统。欺骗系统相当于报告一系列输入,这些输入与环境的实际行为不同。该系统可能通过对检测到的作弊行为收取罚款来应对作弊行为。在本文中,我们通过加权自动机及其对自私环境的适应性来形式化此设置。自动机已被证明是一种成功的形式主义,用于对系统及其环境之间的持续交互进行建模。特别是,加权有限自动机(WFA)为每个输入词分配一个成本,在建模具有定量结果的交互时非常有用。考虑字母表(Sigma)上的WFA(mathcal{a})。在每一个时刻,环境都可能通过报告与实际生成的字母不同的字母来作弊。惩罚函数\(\eta:\Sigma\times\Sigma \rightarrow\mathbb R^{\geq 0}\)将每个可能的错误重发映射为一个惩罚,每当检测到错误重发时都会收取该惩罚。检测概率函数(p:\Sigma\times\Sigma \rightarrow[0,1]\)给出了检测每个误报的概率。我们说,如果(langle\eta,p\rangle)确保在没有欺骗的情况下实现输入字的最小预期成本,那么(mathcal{A})对欺骗是有弹性的。因此,理性的环境没有诱因去欺骗。
我们研究了在分析这种设置时出现的基本问题。特别地,我们考虑了确定给定的WFA(mathcal{a})相对于给定的惩罚函数(eta)和检测概率函数(p\)是否具有((eta,p)-弹性的问题;以及用最小资源实现弹性的问题,即给定(mathcal{A})和(eta),求最小值(相对于(sum{sigma,sigma{prime}})的检测概率函数(p\),使得(mathcal{A}\)是(eta,p)-弹性的。虽然对于一般WFA,这两个问题都被证明是PSPACE困难的,但我们为确定性WFA提供了多项式时间算法。
关于整个系列,请参见[Zbl 1203.68004号].

MSC公司:

65年第68季度 形式语言和自动机
65年第68季度 算法和问题复杂性分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部