研究论文

具有能量平价目标的MDP

作者信息和声明

LICS’17：第32届ACM/IEEE计算机科学逻辑年会论文集2017年6月条款编号：71第1-12页

出版：2017年6月20日出版历史

LICS’17：第32届ACM/IEEE计算机科学逻辑年会论文集

第1-12页

摘要

能量平价目标结合了ω-规则和奖励MDP的定量目标。控制器需要避免在满足奇偶目标的同时耗尽能量。

我们驳斥了一种普遍的观点，即如果能量平价目标几乎肯定成立，那么这可以通过一些有限记忆策略来实现。我们提供了一个仅使用coBüchi条件的令人惊讶的简单反例。

我们引入了一类新的有界（能量）存储目标，当与奇偶目标结合时，该类目标保持有限存储特性。在此基础上，我们证明了能量奇偶性MDP的近似和极限能量奇偶目标，以及近似和极限存储奇偶性目标都是NP-coNP，可以在伪多项式时间内求解。

工具书类

M.L.Puterman，马尔可夫决策过程。威利，1994年。谷歌学者
K.Chatterjee和L.Doyen，“能量和平均值平价Markov决策过程”MFCS 2011年第6907卷，2011年，第206-218页。谷歌学者数字图书馆
K.Chatterjee，“具有平均值平价和能量平价目标的博弈和马尔可夫决策过程”，in程序。MEMICS的，序列号。LNCS，第7119卷。施普林格，2011年，第37-46页。谷歌学者数字图书馆
A.Chakrabarti、L.De Alfaro、T.A.Henzinger和M.Stoelinga，《资源接口》，in嵌入式软件国际研讨会。斯普林格，2003年，第117-133页。谷歌学者
P.Bouyer、U.Fahrenberg、K.G.Larsen、N.Markey和J.Srba，具有能量约束的加权时间自动机的无穷次运行，序列号。LNCS公司。施普林格，2008年，第5215卷，第33-47页。谷歌学者数字图书馆
R.Bloem、K.Chatterjee、T.A.Henzinger和B.Jobstmann，《通过定量目标提高合成质量》CAV汽车，序列号。LNCS，第5643卷，2009年，第140-156页。谷歌学者数字图书馆
N.Berger、N.Kapur、L.Schulman和V.Vazirani，《偿付能力游戏》FSTTCS公司，序列号。LIPIcs，2008年第2卷，第61-72页。谷歌学者
K.Chatterjee、T.A.Henzinger和M.Jurdzinski，《Mean-payoff平价游戏》低收入国家2005年，第178-187页。谷歌学者数字图书馆
K.Chatterjee和L.Doyen，“能源平价游戏”理论计算机科学，第458卷，第49-60页，2012年。谷歌学者交叉引用
T.Brázdil、A.Kučera和P.Novotní，《优化能源马尔可夫决策过程中的预期平均收益》ATVA公司，序列号。LNCS，第9938卷。Springer，2016年，第32-49页，完整版本见https://arxiv.org/abs/1607.00678。谷歌学者
T.Brázdil、V.Broíek、K.Etessami、A.Kučera和D.Wojtczak，《单计数器马尔可夫决策过程》SODA公司《工业和应用数学学会》，2010年，第863--874页。谷歌学者数字图书馆
T.Brázdil、V.Broíek和K.Etessami，《一对随机游戏》FSTTCS公司，序列号。LIPIcs，2010年第8卷，第108-119页。谷歌学者
R.Mayr、S.Schewe、P.Totzke和D.Wojtczak，“具有能源平价目标的MDP”CoRR公司，第abs/1701.02546卷，2017年。{在线}。可用：http://arxiv.org/abs/1701.02546谷歌学者
P.Billingsley，概率与测度。纽约，NY:Wiley，1995年，第三版。谷歌学者
N.Karmarkar，“线性规划的新多项式时间算法”随机存取存储器1984年，第302-311页。谷歌学者数字图书馆
K.Etessami、D.Wojtczak和M.Yannakakis，“准生灭过程、树状QBD、概率1-计数器自动机和下推系统，”绩效评估，第67卷，第9期，第837--857页，2010年。谷歌学者数字图书馆
T.Brázdil、S.Kiefer和A.Kučera，“使用无限计数器对概率程序进行有效分析”美国计算机学会期刊，第61卷，第6期，第41:1--41:35页，2014年。谷歌学者数字图书馆
R.Durrett、H.Kesten和G.Lawler，《从公平游戏中赚钱》随机行走、布朗运动和相互作用的粒子系统。Springer Science+Business Media，LLC，1991年，第255-267页。谷歌学者
L.De Alfaro，“概率系统的形式验证”，斯坦福大学博士论文，1997年。谷歌学者
K.Chatterjee、M.Jurdziñski和T.A.Henzinger，《定量随机平价游戏》第十五届ACM-SIAM离散算法年会论文集，2004年，第121-130页。谷歌学者数字图书馆
N.Immerman，“量词的数量比磁带单元的数量好，”计算机与系统科学杂志，第22卷，第3期，第384页至第406页，1981年。谷歌学者交叉引用
U.Zwick和M.Paterson，“图上平均回报游戏的复杂性”理论计算机科学，第158卷，第1期，第343-359页，1996年。谷歌学者数字图书馆
P.Abdulla、R.Mayr、A.Sangnier和J.Sproston，《求解整数向量上的奇偶博弈》程序。CONCUR的，序列号。LNCS，第8052卷，2013年。谷歌学者数字图书馆
P.A.Abdulla、R.Ciobanu、R.Mayr、A.Sangnier和J.Sproston，《VASS诱导MDP的定性分析》，摘自FOSSACS公司，序列号。LNCS，第9634卷，2016年。谷歌学者

建议

可数MDP中的平价目标
LICS’17：第32届ACM/IEEE计算机科学逻辑年会论文集

我们研究了具有奇偶目标的可数无限MDP，以及Mostowski层次中颜色数有界的特殊情况（包括可达性、安全性、Büchi和co-Büchi.）。

在有限MDP中总是存在最优无记忆。。。
阅读更多信息
能源平价博弈

能量平价游戏是在加权图上进行的无限两层基于回合的游戏。游戏的目标结合了（定性）奇偶条件和（定量）要求，即权重之和（即能量水平）。。。
阅读更多信息
能量和平均值奇偶马尔可夫决策过程
MFCS’11：第36届计算机科学数学基础国际会议论文集

我们考虑具有平均间隔奇偶性和能量奇偶性目标的马尔可夫决策过程（MDP）。在系统设计中，奇偶性目标用于编码ω-正则规范，而平均路径和能量目标可用于建模ω-正规规范。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

发布于
LICS’17：第32届ACM/IEEE计算机科学逻辑年会论文集
2017年6月
1068页
国际标准图书编号：9781509030187
会议主席：
卢卡·埃特罗
雷克雅维克大学
,
Anna Ingólfsdóttir女士
雷克雅维克大学
赞助商
合作中
出版商
IEEE出版社
出版历史
- 出版：2017年6月20日
检查更新
限定符
- 研究论文
会议

验收费率
总体验收率143属于386提交文件，37%
资金来源
其他指标
查看文章指标

文章指标
- 0
  引文总数
  查看引文
- 17
  总下载次数
- 下载次数（过去12个月）2
- 下载量（最近6周）0
其他指标
查看作者指标
引用人
本出版物尚未被引用

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

具有能量平价目标的MDP

LICS’17：第32届ACM/IEEE计算机科学逻辑年会论文集

摘要

工具书类

引用人

建议

可数MDP中的平价目标

能源平价博弈

能量和平均值奇偶马尔可夫决策过程

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

检查更新

限定符

会议

验收费率

资金来源

其他指标

文章指标

其他指标

引用人

PDF格式

电子阅读器

数字版

解说词

具有能量平价目标的MDP

LICS’17：第32届ACM/IEEE计算机科学逻辑年会论文集

摘要

工具书类

引用人

建议

可数MDP中的平价目标

能源平价博弈

能量和平均值奇偶马尔可夫决策过程

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

检查更新

限定符

会议

验收费率

资金来源

文章指标

其他指标

PDF格式

电子阅读器

数字版

共享此出版物链接

在社交媒体上分享