索拉布拉·阿罗拉;普拉珊·多西 反向强化学习综述:挑战、方法和进展。 (英语) Zbl 1519.68207号 Artif公司。智力。 297,文章ID 103500,28 p.(2021).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{S.Arora}和\textit{P.Doshi},Artif。智力。297,文章ID 103500,28 p.(2021;Zbl 1519.68207) 全文: 内政部 arXiv公司
塞巴斯蒂安·荣格斯;詹森,尼尔斯;Joost-Pieter卡托恩;托普库,乌福;张若翰;玛丽·海荷 人类安全航行的模型检查。 (英语) Zbl 1514.68136号 McIver,Annabelle(编辑)等人,《系统的定量评估》。2018年9月4日至7日,第15届QEST国际会议,中国北京。诉讼程序。查姆:斯普林格。莱克特。注释计算。科学。11024, 207-222 (2018).MSC公司:60年第68季度 68T05型 68T42型 90立方厘米 93甲16 93C85号 PDF格式BibTeX公司 XML格式引用 \textit{S.Junges}等人,Lect。注释计算。科学。11024,207--222(2018;Zbl 1514.68136) 全文: 内政部