巴巴克·萨拉马特 丹尼尔·本西奇 格哈德·埃尔斯巴赫 克里斯蒂安·塞德尔 安德烈亚·托内洛 研究整体强化学习以实现欠驱动机械系统的渐近稳定性。 191-198年 2024 一月 9 IEEE机器人自动化。莱特。 1 https://doi.org/10.109/LRA.2023.3332556 db/journals/ral/ral9.html#SalamatBEST24