AIS安全@IJCAI 2019年:中国澳门
胡斯卡·埃斯皮诺萨 , 韩愈 , 黄晓伟 , 弗雷迪·莱库埃 , 辛西娅·陈 , 何塞·埃尔南德斯·奥拉洛 , Seán Ohéigeartaigh先生 , 理查德·马拉 :
2019年人工智能安全研讨会会议记录与第28届国际人工智能联合会议同期举行, AIS安全@IJCAI 2019年8月11日至12日,中国澳门。 CEUR研讨会记录 2419, CEUR-WS.org公司 2019
邀请的谈话
第1部分: 安全学习
侯赛因·阿布塔莱比 , Doina Precup公司 , 蒂博尔·舒斯特 :
学习Bandit环境中的模块化安全政策,并将其应用于适应性临床试验。 安德烈亚·洛雷吉亚 , 尼古拉斯·马泰 , 弗朗西丝卡·罗西 , 克里斯汀·布伦特·维纳布尔 :
价值一致性的度量学习。
第2部分: 强化学习安全
维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , Miljan Martic公司 , 谢恩·莱格 :
使用逐步相对可达性惩罚副作用。 亚历山大·马特·特纳 , 迪伦·哈德菲尔德-梅内尔 , 普拉萨德·塔德帕利 :
保守机构。 杰森·曼库索 , 托马斯·基谢列夫斯基 , 大卫·林德纳 , 阿洛克·辛格 :
马尔可夫决策过程中的尖峰腐败检测。 汤姆·艾唯瑞特 , 拉马纳·库马尔 , 维多利亚·克拉科夫纳 , 谢恩·莱格 :
使用因果影响图对AGI安全框架进行建模。
第三部分: 安全自动驾驶车辆
梅苏特·奥兹达格 , 桑尼·拉吉 , 史蒂文·劳伦斯·费尔南德斯 , 阿尔瓦罗·贝拉斯克斯 , 劳拉·普勒姆 , 苏米特·库马尔Jha :
深度神经网络对自然扰动的敏感性。 马克西米利安·海恩 , 阿德里安·施瓦格 , 杰里恩·韦斯 :
管理基于人工智能的自治系统感知的不确定性。 卢卡斯·海因兹曼 , 新浪沙菲 , 莫赫德·哈菲兹·奥斯曼 , 克里斯托夫·塞格勒 , 阿洛伊斯·克诺尔 :
自动驾驶中安全违规识别和评估框架。
第4部分: AI价值取向、道德和偏见
安德烈亚·阿勒·塔贝拉 , 弗吉尼亚·迪格纳姆 :
玻璃盒子方法:验证价值观的背景坚持性。 纳迪莎·马里·阿利曼 , 利昂·凯斯特 :
AI价值校准的伦理效用功能的必要多样性。 霍利·威尔逊 , 安德烈亚斯·西奥多罗 :
踩刹车:驾驶困境中道德决策的感知。 拉米亚·斯里尼瓦桑 , 阿杰·钱德 :
使用拓扑数据分析了解数据集中的偏差。
海报纸
张琪(音译) , 埃德蒙·杜菲 , 萨汀德·辛格 :
可信追求的计算策略和概率维护承诺的安全建模。 阿鲁什·马哈 , 萨扬·萨卡尔 , 戴维德·扎加米 :
在部分嵌入式代理中对有线标题进行分类。 瓦希德·贝扎丹 , 威廉·Hsu :
政策模仿的对抗性利用。 穆罕默德·奥朗泽布·艾哈迈德 , 卡莉·埃克特 , 安库尔·特雷德赛 :
可解释人工智能模型中的插补挑战。 弗朗茨·沃塔瓦 :
系统测试对确保AI系统安全的重要性。 巴特·巴斯曼 , 杰奎琳·海纳曼 , 乔尔·雷曼 :
走向移情深度Q学习。 瓦希德·贝扎丹 , 威廉·Hsu :
带有顺序触发器的DRL策略的水印。