BibTeX记录conf/iconip/YangLCL17
@进行中{DBLP:conf/iconip/YangLCL17, author={杨佳元和 李彦杰和 Haoyao Chen和 李建刚}, 编辑={刘德荣和 谢胜利和 李元庆和 赵东斌和 El公司 {-}说 M.埃尔 {-}阿尔菲 }, title={半马尔科夫决策过程的平均奖励强化学习}, booktitle={神经信息处理-第24届国际会议,{ICONIP} 2017年,中国广州,2017年11月14-18日,会议记录,第{I}}部分, series={计算机科学讲稿}, 体积={10634}, 页码={768--777}, publisher={Springer}, 年份={2017年}, url={ https://doi.org/10.1007/978-3-319-70087-8 \_79}, doi={10.1007/978-3-319-70087-8\_79}, timestamp={2019年5月14日星期二10:00:42+0200}, biburl={ https://dblp.org/rec/conf/iconip/YangLCL17.bib }, bibsource={dblp计算机科学书目, 网址:https://dblp.org } }