“帮助还是放牧?奖励模式组合缓解但不消除……”
雅各布·艾森斯坦 , Chirag Nagpal公司 , 阿列克·阿加瓦尔 , 艾哈迈德·贝拉米 , 亚历克斯·达穆尔 , Dj Dvijotham博士 , 亚当·菲什 , 凯瑟琳·海勒 , 斯蒂芬·普福尔 , 迪帕克·拉马钱德兰 , 彼得肖 , 乔纳森·贝兰特 :
帮忙还是放牧? 奖励模型集合减轻但不消除奖励黑客攻击。 CoRR公司 abs/2312.09244 ( 2023 )
由于引用数据不可用,以下列表可能不完整, 引用字符串可能未成功映射到dblp中列出的项,并且 我们没有针对这些列表中给出的所有项目的完整和精心策划的元数据。
![](https://dblp.uni-trier.de/img/cog.dark.24x24.png)