El Mahdi El Mhamdi马赫迪 拉希德·格雷劳伊 哈德里安·亨德里克 亚历山大·莫勒 分散多智能体强化学习的动态安全中断性。 130-140 2017 NIPS公司 https://proceedings.neurips.cc/paper/2017/hash/812b4ba287f5ee0bc9d43bbf5bbe87fb-Abstract.html http://papers.nips.cc/paper/6618-dynamic-safe-interruptibility-for-decentralized-multi-gent-information-learning conf/nips/2017 db/conf/nips/nips2017.html#MhamdiGHM17