跳到主要内容
10.1145/3077257.3077271acm会议文章/章节视图摘要出版物页面国防部会议记录会议集合
研究论文

PALM:迭代调试的机器学习解释

出版:2017年5月14日出版历史

摘要

当深度神经网络做出错误预测时,开发人员可能很难理解原因。虽然在预测特征方面有许多可解释性模型,但分离出对预测影响最大的一小组训练示例可能更为自然。然而,通常情况下,每个训练示例都以某种方式对预测做出贡献,但责任程度不同。我们提出了分区感知局部模型(PALM),这是一个学习和总结此职责结构以帮助机器学习调试的工具。PALM使用两部分代理模型来近似复杂模型(例如深度神经网络):一个划分训练数据的元模型,以及一组近似每个分区内模式的子模型。这些子模型可以任意复杂以捕获复杂的局部模式。然而,元模型被约束为决策树。这样,用户可以检查元模型的结构,确定规则是否符合直觉,并将有问题的测试示例有效地链接到负责的培训数据。在识别相关数据方面,PALM查询比最近邻查询快近30倍,这是交互式应用程序的一个关键属性。

工具书类

  1. Keystone ML公司。http://keystone-ml.org/。谷歌学者谷歌学者
  2. 张量流。https://www.tensorflow.org/。谷歌学者谷歌学者
  3. Peter Bailis、Edward Gan、Samuel Madden、Deepak Narayanan、Kexin Rong和Sahaana Suri,2017年。宏数据库:在快速数据中优先关注。SIGMOD公司。谷歌学者谷歌学者数字图书馆数字图书馆
  4. James Cheney、Laura Chiticariu、Wang Chiew Tan和其他人。2009.数据库起源:为什么、如何和在哪里。《数据库中的基础与趋势》1,4(2009),379--474。谷歌学者谷歌学者数字图书馆数字图书馆
  5. 安德鲁·克罗蒂(Andrew Crotty)、亚历克斯·加拉卡托斯(Alex Galakatos)和蒂姆·克拉斯卡(Tim Kraska)。2014.Tupleware:小型集群上的分布式机器学习。IEEE数据工程公告。网址:http://sites.computer.org/debull/A14sept/p63.pdf谷歌学者谷歌学者
  6. 罗伊·福克斯(Roy Fox)、桑杰·克里希南(Sanjay Krishnan)、肯·戈德伯格(Ken Goldberg)和伊恩·斯托伊卡(Ion Stoica)。2017.多层深期权发现。在审查中的ICML。谷歌学者谷歌学者
  7. Tameru Hailesilassie。2016.深度神经网络规则提取算法:综述。arXiv预印arXiv:1610.05267(2016)。谷歌学者谷歌学者
  8. 约瑟夫·海勒斯坦(Joseph M.Hellerstein)、克里斯托弗·雷(Christopher Re)、弗洛里安·肖普曼(Florian Schoppmann)、戴西·王哲(Daisy Zhe Wang)、尤金·弗拉金(Eugene Fratkin)、亚历山大·戈拉杰克(Aleksander Gorajek)、基·辛格(Kee Siong N。2012.MADlib分析库或MAD技能,SQL。在VLDB中。http://vldb.org/pvldb/vol5/p1700_joehellerstein_vldb2012.pdf谷歌学者谷歌学者数字图书馆数字图书馆
  9. 金圭和约翰·坎尼。2017.通过视觉化因果注意为自驾汽车提供可解释的学习。arXiv预印arXiv:1703.10631(2017)。谷歌学者谷歌学者
  10. 蒂姆·克拉斯卡(Tim Kraska)、阿梅特·塔尔沃卡尔(Amee Talwalkar)、约翰·杜奇(John C.Duchi)、里恩·格里菲斯(Rean Griffith)、迈克尔·富兰克林(Michael J.Franklin)和迈克尔·乔丹(Michael。2013年,MLbase:分布式机器学习系统。在CIDR中。http://www.cidrdb.org/cidr2013/Papers/CIDR13_Paper118.pdf谷歌学者谷歌学者
  11. 桑杰·克里希南(Sanjay Krishnan)、阿尼梅斯·加格(Animesh Garg)、理查德·刘(Richard Liaw)、劳伦·米勒(Lauren Miller)、弗洛里安·波科尼(Florian T.Pokorny)和肯·戈德伯格(Ken Goldberg),2016年。HIRL:用于奖励延迟的长期任务的分层反向强化学习。CoRR abs/1604.06508(2016)。http://arxiv.org/abs/1604.06508谷歌学者谷歌学者
  12. 桑杰·克里希南(Sanjay Krishnan)、王建南(Jiannan Wang)、尤金·吴(Eugene Wu)、迈克尔·富兰克林(Michael J.Franklin)和肯·戈德堡(Ken Goldberg),2016年。ActiveClean:统计建模的交互式数据清理。PVLDB 9,12(2016),948--959。http://www.vldb.org/pvldb/vol9/p948-krishnan.pdf谷歌学者谷歌学者数字图书馆数字图书馆
  13. 陶磊、里贾娜·巴兹雷和托米·贾科拉。2016.合理化神经预测。arXiv预印本arXiv:1606.04155(2016)。谷歌学者谷歌学者
  14. 马可·图利奥·里贝罗(Marco Tulio Ribeiro)、萨米尔·辛格(Sameer Singh)和卡洛斯·盖斯特林(Carlos Guestrin),2016年。我为什么要相信你解释任何分类器的预测。第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集。顶点,1135-1144。谷歌学者谷歌学者数字图书馆数字图书馆
  15. Christian Szegedy、Wojciech Zaremba、Ilya Sutskever、Joan Bruna、Dumitru Erhan、Ian Goodfellow和Rob Fergus。2013.神经网络的有趣特性。arXiv预印arXiv:1312.6199(2013)。谷歌学者谷歌学者
  16. 杰西卡·泰勒(Jessica Taylor)、埃利泽·尤德科夫斯基(Eliezer Yudkowsky)、帕特里克·拉维托伊尔(Patrick LaVictoire)和安德鲁·克里奇(Andrew Critch)。2016年。先进机器学习系统的校准。技术报告。2016年技术报告,MIRI。谷歌学者谷歌学者
  17. 尤金·吴和塞缪尔·马登。2013.蝎子:解释聚合查询中的异常值。在VLDB中。http://www.vldb.org/pvldb/vol6/p553-wu.pdf谷歌学者谷歌学者数字图书馆数字图书馆

建议

评论

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

登录

完全访问权限

  • 发布于

    封面图片ACM会议
    HILDA’17:人在回路数据分析第二次研讨会会议记录
    2017年5月
    89页
    国际标准图书编号:9781450350297
    内政部:10.1145/3077257

    版权所有©2017 ACM

    如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人拥有的本作品组件的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

    出版商

    计算机协会

    美国纽约州纽约市

    出版历史

    • 出版:2017年5月14日

    权限

    请求有关此文章的权限。

    请求权限

    检查更新

    限定符

    • 研究论文
    • 研究
    • 推荐有限公司

    接受率

    总体验收率28属于56提交文件,50%

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader在线查看。

电子阅读器