根据线性可解MDP结合学习的控制器实现新目标| IEEE会议出版物| IEEE Xplore