文件Zbl 1310.68135-zbMATH Open

应对自私的持续行为。（英语） Zbl 1310.68135号

Clarke，Edmund M.（编辑）等人，《编程逻辑、人工智能和推理》。第16届国际会议，LPAR-16，塞内加尔达喀尔，2010年4月25日至5月1日。修订了选定的论文。柏林：施普林格出版社（ISBN 978-3-642-17510-7/pbk）。计算机科学课堂讲稿6355。《人工智能课堂讲稿》，501-516（2010）。

总结：理性和自私的环境可能会诱使人们欺骗与其交互的系统。欺骗系统相当于报告一系列输入，这些输入与环境的实际行为不同。该系统可能通过对检测到的作弊行为收取罚款来应对作弊行为。在本文中，我们通过加权自动机及其对自私环境的适应性来形式化此设置。自动机已被证明是一种成功的形式主义，用于对系统及其环境之间的持续交互进行建模。特别是，加权有限自动机（WFA）为每个输入词分配一个成本，在建模具有定量结果的交互时非常有用。考虑字母表（Sigma）上的WFA（mathcal{a}）。在每一个时刻，环境都可能通过报告与实际生成的字母不同的字母来作弊。惩罚函数\（\eta:\Sigma\times\Sigma \rightarrow\mathbb R^{\geq 0}\）将每个可能的错误重发映射为一个惩罚，每当检测到错误重发时都会收取该惩罚。检测概率函数（p:\Sigma\times\Sigma \rightarrow[0,1]\）给出了检测每个误报的概率。我们说，如果（langle\eta，p\rangle）确保在没有欺骗的情况下实现输入字的最小预期成本，那么（mathcal{A}）对欺骗是有弹性的。因此，理性的环境没有诱因去欺骗。
我们研究了在分析这种设置时出现的基本问题。特别地，我们考虑了确定给定的WFA（mathcal{a}）相对于给定的惩罚函数（eta）和检测概率函数（p\）是否具有（（eta，p）-弹性的问题；以及用最小资源实现弹性的问题，即给定（mathcal{A}）和（eta），求最小值（相对于（sum{sigma，sigma{prime}}）的检测概率函数（p\），使得（mathcal{A}\）是（eta，p）-弹性的。虽然对于一般WFA，这两个问题都被证明是PSPACE困难的，但我们为确定性WFA提供了多项式时间算法。
关于整个系列，请参见[Zbl 1203.68004号].

引用于1文件

MSC公司：

65年第68季度	形式语言和自动机
65年第68季度	算法和问题复杂性分析

PDF格式 BibTeX公司 XML格式引用

全文：内政部

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
拉	语言
所以	来源
ab公司	综述，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

应对自私的持续行为。（英语） Zbl 1310.68135号

MSC公司：

示例

领域

操作员

应对自私的持续行为。 （英语） Zbl 1310.68135号

MSC公司：

应对自私的持续行为。（英语） Zbl 1310.68135号