用于马尔可夫链自适应控制的强化学习神经网络| IEEE Journals&Magazine | IEEE Xplore