×

找到84个文档(结果1-84)

海报摘要:符号自动机编码目标的无模型强化学习。 (英语) Zbl 07807734号

第25届ACM混合系统国际会议论文集:计算和控制,HSCC 2022,CPS物联网周的一部分,意大利米兰和虚拟,2022年5月4日至6日。纽约州纽约市:计算机协会(ACM)。第26号论文,第2页(2022年)。
PDF格式BibTeX公司 XML格式引用
全文: 内政部

机器人舞蹈建模方法。 (英语) Zbl 1504.93255号

石鹏(编辑)等,《复杂系统:跨越控制与计算控制论:应用》。在Georgi M.Dimirovski教授周年纪念日致辞。查姆:斯普林格。研究系统。Decis公司。控制415、35-58(2022)。
MSC公司:93C85号 93元65角
PDF格式BibTeX公司 XML格式引用
全文: 内政部

分枝马尔可夫决策过程的无模型强化学习。 (英语) Zbl 1493.93060号

Silva,Alexandra(编辑)等人,《计算机辅助验证》。第33届国际会议,CAV 2021,虚拟活动,2021年7月20日至23日。诉讼程序。第二部分。查姆:斯普林格。莱克特。注释计算。科学。12760, 651-673 (2021).
PDF格式BibTeX公司 XML格式引用

全梯度DQN强化学习:一种可证明收敛的方案。 (英语) Zbl 1471.93287号

Piunovskiy,Alexey(ed.)等人,《受控随机过程的现代趋势:理论与应用》,V.III.基于传统利物浦受控随机过程研讨会上的演讲的论文选集,英国利物浦,2021年7月。查姆:斯普林格。新兴复杂性。计算。41, 192-220 (2021).
PDF格式BibTeX公司 XML格式引用

成本信号对抗操作下的欺骗性强化学习。 (英语) Zbl 1440.68215号

Alpcan,Tansu(编辑)等人,《安全决策与博弈论》。2019年10月30日至11月1日,第十届国际会议,2019年GameSec,瑞典斯德哥尔摩。诉讼程序。查姆:斯普林格。莱克特。注释计算。科学。11836, 217-237 (2019).
PDF格式BibTeX公司 XML格式引用

筛选结果依据…

文档类型

全部的 前5名

作者

全部的 前5名

出版年份