摘要
菲利普·阿德勒(Philip Adler)、凯西·福尔克(Casey Falk)、索雷尔·弗里德勒(Sorelle A.Friedler)、加布里埃尔·瑞贝克(Gabriel Rybeck)、卡洛斯·谢德格尔(Carlos Scheidegger)、布兰登·史密斯(Brandon Smith)和苏雷什·文卡。 2016年,通过模糊特征审计黑盒模型。 arXiv:1602.07043{cs,统计}(22 2 2016)。 http://arxiv.org/abs/1602.07043 arXiv:1602.07043。 谷歌学者 Charles Antaki和Ivan Leudar。 1992年。对话中的解释:走向一种论证模式。 《欧洲社会心理学杂志》22,2(1992),181-194。 谷歌学者 交叉引用 David Baehrens、Timon Schroeter、Stefan Harmeling、Motoaki Kawanabe、Katja Hansen和Klaus-Robert Müller。 2010年。如何解释个人分类决策。 机器学习研究杂志11,Jun(2010),1803-1831。 谷歌学者 数字图书馆 Solon Barocas和Andrew D.Selbst。 2016年,大数据的不同影响。 《加利福尼亚州法律评论》104,3(2016)。 谷歌学者 奥斯伯特·巴斯塔尼、卡罗琳·金和哈姆萨·巴斯塔尼。 2017.通过模型提取进行解释。 arXiv:1706.09773{cs,stat}(2017年6月29日)。 http://arxiv.org/abs/1706.09773 arXiv:1706.09773。 谷歌学者 贝蒂娜·贝伦特和索伦·普雷布施。 2017.走向负责任的歧视——软件数据挖掘:让人处于循环和观察镜中的重要性。 大数据5,2(1 6 2017),135-152。 谷歌学者 鲁本·宾斯。 2017.算法责任和公共理性。 哲学与技术(2017年5月24日),1-14。 谷歌学者 或者Biran和Kathleen McKeown。 2014.个人分类的理由说明。 《ICML AutoML研讨会论文集》,第2014卷。 谷歌学者 B.Bodo、N.Helberger、K.Irion、F.Zuiderveen Borgesius、J.Moller、B.van de Velde、N.Bol、B.vane Es和C.de Vreese。 2017.应对算法控制危机——算法代理研究的技术、法律和道德挑战。 耶鲁大学JL&Tech.19(2017),133。 谷歌学者 乔治·EP盒子。 1979年,科学建模战略的稳健性。 统计稳健性。 爱思唯尔,201-236。 谷歌学者 詹娜·伯雷尔。 2016.机器“思考方式”:理解机器学习算法中的不透明度。 大数据与社会(2016)。 谷歌学者 R.Caruana、H.Kangarloo、J.D.Dionisio、U.Sinha和D.Johnson。 1999.非案例学习方法的案例解释。 AMIA研讨会论文集(1999),212-215。 PMID:10566351 PMCID:PMC2232607。 谷歌学者 陈俊翔、张耶鲁、布赖恩·霍布斯、彼得·卡斯塔尔迪、迈克尔·乔、埃德温·西尔弗曼和詹妮弗·戴伊,2016年。 基于判别矩形混合模型的可解释聚类。 数据挖掘(ICDM),2016年IEEE第16届国际会议,823--828。 http://ieeexplore.ieee.org/abstract/document/7837910/ {在线;2017-10-16}访问。 谷歌学者 交叉引用 丹妮尔·济慈(Danielle Keats Citron)和弗兰克·帕斯奎尔(Frank Pasquale)。 2014.得分社会:自动预测的正当程序。 《华盛顿州法律》第89版(2014年),1。 谷歌学者 马克·克雷文和裘德·沙夫利克。 1996.提取训练网络的树结构表示。 神经信息处理系统进展,24-30。 http://papers.nips.cc/paper/1152-extraining-tree-structured-representations-of-trained-networks.pdf {在线;已访问2017-10-16}。 谷歌学者 数字图书馆 Anupam Datta、Shayak Sen和Yair Zick。 2016.通过定量输入影响实现算法透明度:学习系统的理论和实验。 IEEE,598--617。 {在线;2016-09-12}访问。 谷歌学者 Finale Doshi-Velez、Mason Kortz、Ryan Budish、Chris Bavitz、Sam Gershman、David O'Brien、Stuart Schieber、James Waldo、David Weinberger和Alexandra Wood。 2017.人工智能在法律下的责任:解释的作用。 arXiv预印本arXiv:1711.01134(2017)。 谷歌学者 Simant Dube。 2018年,高维空间、深度学习和对抗性示例。 arXiv预印本arXiv:1801.00634(2018)。 谷歌学者 Ruth C.Fong和Andrea Vedaldi。 2017年。通过有意义的扰动解释黑箱。 arXiv预印arXiv:1704.03296(2017)。 谷歌学者 约翰·福克斯(John Fox)、大卫·格拉斯普勒(David Glasspool)、丹·格雷库(Dan Grecu)、桑杰·莫吉尔(Sanjay Modgil)、马修·索斯(Matthew South)和维维克·帕特卡尔(Vivek Patkar)。 2007.基于论证的推理和决策——医学视角。 IEEE智能系统22,6(2007)。 谷歌学者 数字图书馆 罗曼·弗里格。 2006.科学表征与理论语义观。 《理论》55(2006),37-53。 谷歌学者 Ian J.Goodfellow、Jonathon Shlens和Christian Szegedy。 2014.解释和利用对抗性示例。 arXiv预印本arXiv:1412.6572(2014)。 谷歌学者 雪莉·格雷戈和伊扎克·本巴萨特。 1999.智能系统的解释:理论基础和实践意义。 MIS季刊(1999),497-530。 谷歌学者 数字图书馆 J.哈贝马斯。 1984年,《交往行为理论:第一卷:理性与社会理性化》。 波士顿比肯。 谷歌学者 William Herfel、Wladiyslaw Krajewski、Ilkka Niiniluoto和Wojcicki(编辑)。 1995年,科学过程中的理论和模型。 罗德比,阿姆斯特丹。 谷歌学者 玛丽·B·黑塞。 1965.科学中的模型和类比。 (1965). 谷歌学者 杰蒙德·赫斯洛。 1988年,因果选择问题。 当代科学与自然解释:因果关系的常识概念(1988),11-32。 谷歌学者 米雷尔·希尔德布兰特(Mireille Hildebrandt)和伯特·贾普·库普斯(Bert-Jaap Koops)。 2010年,《剖析时代环境法和法律保护的挑战》。 《现代法律评论》73,3(2010年5月),428-460。 谷歌学者 交叉引用 丹尼斯·希尔顿。 1990年。对话过程和因果解释。 《心理学公报》107,1(1990),65。 谷歌学者 交叉引用 丹尼斯·希尔顿。 1996.心理模型和因果解释:对可能原因和解释相关性的判断。 思考与推理2,4(1996),273--308。 谷歌学者 交叉引用 丹尼斯·J·希尔顿和本·R·斯拉戈斯基。 基于知识的因果归因:异常情况焦点模型。 《心理学评论》93,1(1986),75。 谷歌学者 乌杰瓦尔·卡安德(Ujwal Kayande)、阿诺德·德布吕恩(Arnaud De Bruyn)、加里·利利安(Gary L.Lilien)、阿文德·兰加斯瓦米(Arvind Rangaswamy)和杰里特·范·布鲁根。 2009年。在决策支持系统中纳入反馈机制如何影响决策支持系统评估。 信息系统研究20,4(2009),527--546。 谷歌学者 数字图书馆 Been Kim、Cynthia Rudin和Julie A.Shah。 2014.贝叶斯案例模型:基于案例推理和原型分类的生成方法。 1952-1960年神经信息处理系统进展。 谷歌学者 数字图书馆 宝琳·T·金。 2016年,数据驱动的工作歧视。Wm.& Mary L.Rev.58(2016),857。 谷歌学者 鲍里斯·凯门特(Boris Kment.)。 2006.反事实和解释。 Mind 115,458(2006),261--310。 谷歌学者 交叉引用 约书亚·A·克罗尔(Joshua A.Kroll)、索伦·巴罗卡斯(Solon Barocas)、爱德华·W·费尔顿(Edward W.Felten)、乔尔·雷登伯格(Joel R.Reidenberg)、大卫·罗宾逊(David G.Robinson)和哈兰·余(Harlan Y。 2016.责任算法。 《美国宾夕法尼亚州法律评论》第165卷(2016年),第633页。 谷歌学者 托德·库莱斯扎、玛格丽特·伯内特、王翁和西蒙·斯塔姆夫。 2015.个性化交互式机器学习的解释性调试原则。 ACM出版社,126-137。 {在线;2018-05-06}访问。 谷歌学者 Himabindu Lakkaraju、Ece Kamar、Rich Caruana和Jure Leskovec。 2017.黑箱模型的可解释和可探索近似。 arXiv:1707.01154{cs}(2017年4月7日)。 http://arxiv.org/abs/1707.01154 arXiv:1707.01154。 谷歌学者 布鲁诺·莱普利(Bruno Lepri)、努里亚·奥利弗(Nuria Oliver)、埃曼纽尔·勒图泽(Emmanuel Letouzé)、亚历克斯·彭特兰(Alex Pentland)和帕特里克·芬克(Patrick Vink。 2017年,公平、透明和负责的算法决策过程:前提、建议的解决方案和公开挑战。 哲学与技术(2017年8月15日)。 {在线;2017-08-25}访问。 谷歌学者 大卫·刘易斯。 1973.反事实。 牛津大学布莱克威尔分校。 谷歌学者 Brian Y.Lim和Anind K.Dey。 2009.评估上下文软件应用中的可理解性需求。 第11届泛在计算国际会议论文集-Ubicomp'09。 美国佛罗里达州奥兰多ACM出版社,195年。 谷歌学者 数字图书馆 彼得·利普顿。 1990年。对比解释。 英国皇家哲学研究所增补27(1990),247-266。 谷歌学者 交叉引用 扎卡里·利普顿(Zachary C.Lipton)。 2016.模型可解释性的神话。 arXiv:1606.03490{cs,统计}(2016年10月6日)。 http://arxiv.org/abs/1606.03490 arXiv:1606.03490。 谷歌学者 保罗·J·里斯本。 2013.机器学习中的可解释性——原理与实践。 在模糊逻辑和应用。 施普林格,15-21岁。 http://link.springer.com/chapter/10.1007/978-3-319-03200-9_2 {在线;访问日期:2015-12-19}。 谷歌学者 塔尼娅·隆布罗佐(Tania Lombrozo)。 2009.解释和分类:“为什么?”如何告知“什么?”。 《认知》110,2(2009),248-253。 谷歌学者 交叉引用 斯科特·伦德伯格(Scott M Lundberg)和苏茵·李(Su-In Lee)。 2017年。解释模型预测的统一方法。 神经信息处理系统进展。 4765--4774. 谷歌学者 数字图书馆 亚历山德罗·曼特勒罗。 2016.分析时代用于决策目的的个人数据:从个人到数据保护的集体维度。 计算机法律与安全审查32,2(2016),238--255。 谷歌学者 David Martens、Bart Baesens、Tony Van Gestel和Jan Vantheenen。 2007.使用支持向量机规则提取的可理解的信用评分模型。 《欧洲运筹学杂志》183,3(2007),1466-1476。 谷歌学者 David Martens和Foster Provost。 2013.解释数据驱动的文档分类。 (2013). https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2282998 {在线;2017-09-22}访问。 谷歌学者 朱利安·麦考利和朱尔·莱斯科维奇。 2013.隐藏因素和隐藏主题:用评论文本理解评级维度。 ACM出版社,165--172。 {在线;2017-09-24}访问。 谷歌学者 约翰·麦克卢尔(John L.McClure)、罗比·萨顿(Robbie M.Sutton)和丹尼斯·希尔顿(Denis J.Hilton)。 2003.基于目标的解释的作用。 《社会判断:内隐和外显过程》5(2003年)。 谷歌学者 蒂姆·米勒。 2017.人工智能解释:来自社会科学的见解。 arXiv预印arXiv:1706.07269(2017)。 谷歌学者 Tim Miller、Piers Howe和Liz Sonenberg,2017年。 可解释的人工智能:当心运行庇护的囚犯或:我如何学会停止担忧并热爱社会和行为科学。 arXiv:1712.00547{cs}(1 12 2017)。 http://arxiv.org/abs/1712.00547 arXiv:1712.00547。 谷歌学者 布伦特·米特尔斯塔特。 2016.自动化、算法和政治|内容个性化系统透明度审计。 《国际传播杂志》10(2016),12。 谷歌学者 格雷戈里·蒙塔冯(Grégoire Montavon)、沃伊西奇·萨梅克(Wojciech Samek)和克劳斯·罗贝特·穆勒(Klaus-Robert Müller)。 2017.深度神经网络的解释和理解方法。 数字信号处理(2017)。 谷歌学者 海伦·尼森鲍姆。 1996.计算机社会中的问责制。 科学与工程伦理学2,1(1996),25-42。 谷歌学者 S.C.Olhede和P.J.Wolfe。 2018年,算法在社会中越来越普遍:含义、影响和创新。 菲尔,跨性别。 R.Soc.A 3762128(2018年9月),20170364。 谷歌学者 交叉引用 弗兰克·帕斯奎尔。 2015年,黑盒社会:控制金钱和信息的秘密算法。 哈佛大学出版社。 谷歌学者 布雷特·鲍林(Brett Poulin)、罗曼·艾斯纳(Roman Eisner)、杜安·萨夫隆(Duane Szafron)、保罗·卢(Paul Lu)、鲁斯·格雷纳(Russ Greiner)、D S威斯哈特(D S Wishart)、阿隆娜·菲什(Alona Fyshe)、布兰登·皮尔西(Brand。 2006.加性分类器证据的视觉解释。 (2006), 8. 谷歌学者 鲍勃·雷德。 2003年,概念表征和分类的因果模型理论。 《实验心理学杂志:学习、记忆和认知》29,6(2003),1141。 谷歌学者 交叉引用 鲍勃·雷德。 2006年,当相似性和因果关系在基于类别的属性概括中竞争时。 记忆与认知34,1(2006),3--16。 谷歌学者 交叉引用 Marco Tulio Ribeiro、Sameer Singh和Carlos Guestrin,2016年。 “我为什么要相信你?”:解释任何分类器的预测。 第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集。 ACM出版社,1135--1144。 {在线;2017-09-24}访问。 谷歌学者 数字图书馆 戴维·希勒尔·鲁本。 2004.解释性解释。 劳特利奇。 谷歌学者 Wojciech Samek、Thomas Wiegand和Klaus-Robert Müller。 2017.可解释人工智能:理解、可视化和解释深度学习模型。 arXiv预印本arXiv:1708.08296(2017)。 https://arxiv.org/abs/1708.08296 {在线;2017-09-22}访问。 谷歌学者 Jana Samland和Michael R.Waldmann。 2014.社会规范是否影响因果推论? 认知科学学会年会论文集36。 谷歌学者 伊万·桑切斯(Ivan Sanchez)、蒂姆·罗克塔舍尔(Tim Rocktaschel)、塞巴斯蒂安·里德尔(Sebastian Riedel)和萨米尔·辛格(Sameer Singh)。 2015.致力于提取潜在变量模型的忠实和描述性表示。 AAAI知识表示与推理春季专题讨论会(KRR):集成符号和神经方法(2015)。 http://www.aaai.org/ocs/index.php/SSS/SSS15/paper/viewFile/10304/10033 {在线;2017-10-16}访问。 谷歌学者 克里斯蒂安·桑德维格(Christian Sandvig)、凯文·汉密尔顿(Kevin Hamilton)、卡里·卡拉哈利奥斯(Karrie Karahalios)和塞德里克·兰博特(Cedric Langbort)。 2014.审计算法:检测互联网平台歧视的研究方法。 《数据与歧视:将关键问题转化为富有成效的调查》(2014年),1-23。 谷歌学者 Andrew D.Selbst和Solon Barocas。 2018年,可解释机器的直观吸引力。 (2018). 谷歌学者 Ramprasaath R.Selvaraju、Michael Cogswell、Abhishek Das、Ramakrishna Vedantam、Devi Parikh和Dhruv Batra。 2016.Grad-CAM:通过基于梯度的本地化从深度网络中进行可视化解释。 请参见 https://arxiv.org/abs/1610.02391 v3(2016年)。 https://pdfs.semanticschoolr.org/5582/bebed97947a41e3ddd9bd1f284b73f1648c2.pdf {在线;2017-10-16}访问。 谷歌学者 阿凡蒂·施里库玛(Avanti Shrikumar)、佩顿·格林赛德(Peyton Greenside)和安舒尔·昆达杰(Anshul Kundaje)。 2017年。通过传播激活差异学习重要特征。 CoRR公司。 谷歌学者 阿凡蒂·施里库玛(Avanti Shrikumar)、佩顿·格林赛德(Peyton Greenside)和安娜·谢尔比纳(Anna Shcherbina)。 2016.不仅仅是一个黑盒子:通过传播激活差异来学习重要特征。 CoRR公司。 谷歌学者 凯伦·西蒙扬(Karen Simonyan)、安德烈亚·维达尔迪(Andrea Vedaldi)和安德鲁·齐瑟曼(Andrew Zisserman)。 2013.深层卷积网络:可视化图像分类模型和显著性图。 arXiv预印本arXiv:1312.6034(2013)。 https://arxiv.org/abs/1122.6034 {在线;2017-09-24}访问。 谷歌学者 Ben R.Slugoski、Mansur Lalljee、Roger Lamb和Gerald P.Gins-burg,1993年。 会话语境中的归因:相互认识对解释-给予的影响。 《欧洲社会心理学杂志》23,3(1993),219--238。 谷歌学者 交叉引用 保罗·塔马尼尼(Paolo Tamagnini)、约书亚·克劳斯(Josua Krause)、阿里特拉·达斯古普塔(Aritra Dasgupta)和恩里科·贝尔蒂尼(Enrico Bertini)。 2017.使用实例级视觉解释解释黑盒分类器。 ACM出版社,1--6。 {在线;2017-09-22}访问。 谷歌学者 数字图书馆 Michael Veale和Lilian Edwards。 2018.第29条工作组关于自动决策和分析的指南草案中的明确性、惊喜和更多问题。 《计算机法律与安全评论》34,2(2018),398-404。 谷歌学者 交叉引用 桑德拉·瓦赫特(Sandra Wachter)、布伦特·米特尔斯塔特(Brent Mittelstadt)和克里斯·罗素(Chris Russell)。 2018.未打开黑匣子的反事实解释:自动决策和GDPR。 《哈佛法律与技术杂志》即将出版(2018年)。 谷歌学者 道格拉斯·沃尔顿。 2004年,一种新的辩证解释理论。 《哲学探索》7,1(2004),71-89。 谷歌学者 交叉引用 道格拉斯·沃尔顿。 2007.解释的对话模型。 ExaCt 2007(2007),1-9。 谷歌学者 富尔顿·王和辛西娅·鲁丁。 2015年,下降规则列表。 人工智能与统计,1013-1022。 谷歌学者 阿德里安·韦勒(Adrian Weller)。 2017年,透明度的挑战。 arXiv:1708.01870{cs}(2017年7月29日)。 http://arxiv.org/abs/11708.01870 arXiv:1708.01870。 谷歌学者 吉姆·伍德沃德。 1997.解释、不变性和干预。 科学哲学64(1997),S26--S41。 https:/www.jstor.org/stable/188387 谷歌学者 交叉引用 詹姆斯·伍德沃德和E.扎尔塔。 2003年,科学解释。 谷歌学者 佩特里·伊利科斯基(Petri Ylikoski)。 2013年,因果和构成解释对比。 Erkentnis 78,2(2013),277--297。 谷歌学者 交叉引用 塔尔·Z·扎尔斯基。 2013年,透明预测。 《美国伊利诺伊州法律评论》(2013),1503。 谷歌学者 曾嘉明(Jiaming Zeng)、伯克·乌斯顿(Berk Ustun)和辛西娅·鲁丁(Cynthia Rudin)。 2017.累犯预测的可解释分类模型。 《皇家统计学会杂志:A辑(社会统计)》180,3(2017),689-722。 谷歌学者 交叉引用
索引术语
解释人工智能中的解释
建议
“这(不是)我期望的结果!”关于最终用户期望在创建人工智能系统解释中的作用 摘要 社会科学的研究表明,期望是解释人类之间使用的一个重要因素:解释者通常会解释另一个事件,而不是解释事件本身的原因。。。 解释能提高人工智能辅助人类决策的质量吗? 事实解释与反事实解释的算法循环分析 AAMAS’23:2023年自治代理和多代理系统国际会议记录 在高风险决策中越来越多地使用人工智能算法辅助工具,这引起了人们对可解释人工智能(xAI)的兴趣,以及反事实解释在增加人机算法协作信任和缓解不公平结果方面的作用。。。