×

可解释机器学习:基本原理和10大挑战。 (英语) 兹伯利07471610

概要:机器学习(ML)中的可解释性对于高风险决策和故障排除至关重要。在这项工作中,我们为可解释的ML提供了基本原则,并消除了淡化这一关键主题重要性的常见误解。我们还确定了可解释机器学习中的10个技术挑战领域,并提供了每个问题的历史和背景。其中一些问题具有典型的重要性,还有一些是最近几年出现的问题。这些问题是:(1)优化决策树等稀疏逻辑模型;(2) 评分系统的优化;(3) 将约束置于广义可加模型中,以鼓励稀疏性和更好的解释性;(4) 现代基于案例的推理,包括用于因果推理的神经网络和匹配;(5) 神经网络的完全监督解缠;(6) 神经网络的完全或部分无监督解缠结;(7) 数据可视化中的降维方法;(8) 可以结合物理和其他生成或因果约束的机器学习模型;(9) 好模型的“Rashomon集”的刻画;和(10)可解释强化学习。这项调查适合作为对可解释机器学习感兴趣的统计学家和计算机科学家的起点。

MSC公司:

68时01分 人工智能的一般主题
62-02 与统计有关的研究展览(专著、调查文章)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aamodt,A.和Plaza,E.(1994年)。基于案例的推理:基础问题、方法变异和系统方法。AI通信7 39-59.
[2] Adebayo,J.、Gilmer,J.,Muelly,M.、Goodfellow,I.、Hardt,M.和Kim,B.(2018年)。显著性地图的健全性检查。神经信息处理系统会议记录.
[3] Adel,T.、Ghahramani,Z.和Weller,A.(2018年)。发现深层生成模型和区分模型的可解释表示。机器学习国际会议论文集50-59之间。
[4] Afnan,M.A.M.、Rudin,C.、Conitzer,V.、Savulescu,J.、Mishra,A.、Liu,Y.和Afnam,M.(2021)。人工智能选择胚胎的伦理实施体外受精.英寸AAAI/ACM人工智能、道德和社会会议记录.
[5] Agarwal,R.、Frosst,N.、Zhang,X.、Caruana,R.和Hinton,G.E.(2020年)。神经加法模型:用神经网络进行可解释的机器学习。ICML机器学习中人类可解释性研讨会会议记录.
[6] Aghaei,S.、Gomez,A.和Vayanos,P.(2020年)。学习最佳分类树:强大的最大流公式。arXiv电子打印arXiv:2002.09142.
[7] Agrawal,D.、Bernstein,P.、Bertino,E.、Davidson,S.、Dayal,U.、Franklin,M.和Widom,J.(2012)。大数据的挑战与机遇:为计算研究协会技术报告(CRA)计算社区联盟委员会编写的白皮书。
[8] 阿伊伏特加,美国,费里,J.,甘姆斯,S.,胡格特,M.-J.和西亚拉,M.(2019年)。学习公平规则列表。arXiv电子打印arXiv:1909.03977.
[9] Amid,E.和Warmuth,M.K.(2019年)。TriMap:使用三元组的大尺度降维。arXiv电子打印arXiv:1910.00204.
[10] Angelino,E.、Larus-Stone,N.、Alabi,D.、Seltzer,M.和Rudin,C.(2017)。学习分类数据的可证明最优规则列表。ACM SIGKDD知识发现和数据挖掘(KDD)国际会议记录. ·Zbl 1473.68134号
[11] Angelino,E.、Larus-Stone,N.、Alabi,D.、Seltzer,M.和Rudin,C.(2018年)。分类数据的可证明最佳规则列表。机器学习研究杂志18 1-78. ·Zbl 1473.68134号
[12] Angelov,P.和Soares,E.(2020年)。面向可解释深度神经网络(xDNN)。神经网络130 185-194年。
[13] Angwin,J.,Larson,J.、Mattu,S.和Kirchner,L.(2016)。机器偏差。可从以下位置获得:https://www.propublica.org/article/machine-bias-risk assessments-in-cremiminal-gramination(https://http://www.propublica.com/article/machine-bias-risk assessment)。
[14] Antman,E.M.、Cohen,M.、Bernink,P.J.、McCabe,C.H.、Horacek,T.、Papuchis,G.、Mautner,B.、Corbalan,R.、Radley,D.和Braunwald,E.(2000)。不稳定型心绞痛/非ST段抬高型心肌梗死的TIMI风险评分:一种预测和治疗决策的方法。美国医学会杂志284 835-842.
[15] Antoràn,J.、Bhatt,U.、Adel,T.、Weller,A.和Hernández Lobato,J.M.(2021)。获得线索:解释不确定性估计的方法。学习代表国际会议记录.
[16] Archambeau,C.、Cornford,D.、Opper,M.和Shawe-Taylor,J.(2007年)。随机微分方程的高斯过程近似。高斯过程在实践中的应用1-16.
[17] Ashoori,M.和Weisz,J.D.(2019年)。我们信任AI?影响人工智能决策过程可信度的因素。arXiv电子打印arXiv:1912.02675.
[18] Atrey,A.、Clary,K.和Jensen,D.(2020年)。探索性而非解释性:深度强化学习显著图的反事实分析。学习代表国际会议记录.
[19] Badgley,M.A.、Zech,J.R.、Oakden Rayner,L.、Glicksberg,B.S.、Liu,M.、Gale,W.、McConnell,M.V.、Percha,B.、Snyder,T.M.和Dudley,J.T.(2019)。深度学习使用混杂的患者和医疗变量预测髋部骨折。npj数字医学2
[20] Barnes,J.和Hut,P.(1986年)。一种分层的力计算算法。自然324 446-449.
[21] Barnett,A.J.、Schwartz,F.R.、Tao,C.、Chen,C.、Ren,Y.、Lo,J.Y.和Rudin,C.(2021)。IAIA-BL:数字乳腺造影中肿块病变分类的基于案例的可解释深度学习模型。自然机器智能3 1061-1070.
[22] Bastani,O.、Pu,Y.和Solar-Lezama,A.(2018年)。通过策略提取进行可验证的强化学习。神经信息处理系统会议记录2499-2509.
[23] Baumgart,B.G.(1974)。《计算机视觉几何建模技术报告》,斯坦福大学计算机科学系。
[24] Belkin,M.和Niyogi,P.(2001年)。拉普拉斯特征映射和用于嵌入和聚类的光谱技术神经信息处理系统会议记录14 585-591. 麻省理工学院出版社。
[25] Belkina,A.C.、Ciccolella,C.O.、Anno,R.、Halpert,R.,Spidlen,J.和Snyder-Capipione,J.E.(2019年)。T分布随机邻居嵌入的自动优化参数改进了大型数据集的可视化和分析。自然通信10
[26] Bengio,Y.(2009年)。学习AI的深层架构Now Publishers公司·Zbl 1192.68503号
[27] Bengio,Y.、Courville,A.和Vincent,P.(2013年)。表征学习:回顾和新观点。IEEE模式分析和机器智能汇刊35 1798-1828.
[28] Bennett,K.P.和Blue,J.A.(1996年)。最优决策树技术报告,R.P.I.数学报告第214号,伦斯勒理工学院。
[29] Bertsimas,D.和Dunn,J.(2017)。最佳分类树。机器学习106 1039-1082. ·Zbl 1455.68159号
[30] Bezdek,J.C.、Chuah,S.K.和Leep,D.(1986年)。广义k-最近邻规则。模糊集与系统18 237-256. ·Zbl 0608.62073号
[31] Bhatt,U.、Xiang,A.、Sharma,S.、Weller,A.、Taly,A.、Jia,Y.、Ghosh,J.、Puri,R.、Moura,J.M.F.和Eckersley,P.(2020年)。部署中的可解释机器学习。2020年公平、问责制和透明度会议记录648-657. 计算机协会。
[32] Bibal,A.、Lognoul,M.、de Streel,A.和Frénay,B.(2020年)。机器学习中可解释性的法律要求。人工智能与法律7月30日。
[33] Bien,J.和Tibshirani,R.(2011)。可解释分类的原型选择。应用统计学年鉴2403-2424. ·Zbl 1234.62096号
[34] Billiet,L.、Van Huffel,S.和Van Belle,V.(2017)。较大问题的区间编码评分扩展。IEEE计算机与通信研讨会论文集198-203. IEEE标准。
[35] Billiet,L.、Van Huffel,S.和Van Belle,V.(2018)。区间编码评分:可解释评分系统的工具箱。PeerJ计算机科学4 e150。
[36] Binder,H.和Tutz,G.(2008年)。广义可加模型拟合方法的比较。统计与计算18 87-99.
[37] Böhm,J.N.、Berens,P.和Kobak,D.(2020)。吸引-排斥谱上邻域嵌入的统一观点。arXiv电子打印arXiv:2007.08902.
[38] Bone,R.C.,Balk,R.A.,Cerra,F.B.,Dellinger,R.P.,Fein,A.M.,Knaus,W.A.,Schein,R.M.和Sibbald,W.J.(1992)。脓毒症和器官衰竭的定义以及脓毒症创新疗法的使用指南。胸部101 1644-1655.
[39] Bousquet,O.和Elisseeff,A.(2002年)。稳定性和泛化。机器学习研究杂志2 499-526·Zbl 1007.68083号
[40] Breiman,L.、Friedman,J.H.、Olshen,R.A.和Stone,C.J.(1984)。分类和回归树华兹华斯·Zbl 0541.62042号
[41] Breiman,L.等人(2001年)。统计建模:两种文化(作者的评论和反驳)。统计科学16 199-231. ·Zbl 1059.62505号
[42] Brundage,M.、Avin,S.、Wang,J.、Belfield,H.、Krueger,G.等人,G.H.(2020年)。走向值得信赖的人工智能开发:支持可验证声明的机制。arXiv电子打印arXiv:2004.07213.
[43] Brunton,S.L.、Proctor,J.L.和Kutz,J.N.(2016)。通过非线性动力系统的稀疏辨识从数据中发现控制方程。国家科学院学报113 3932-3937. ·Zbl 1355.94013号
[44] 伯吉斯,E.W.(1928年)。决定假释成败的因素。伊利诺伊州无限期徒刑法和假释制度的运作221-234.
[45] Cao,H.E.、Sarlin,R.和Jung,A.(2020年)。通过最大可满足性学习可解释决策规则。IEEE接入8 218180-218185.
[46] Card,D.、Zhang,M.和Smith,N.A.(2019年)。深度加权平均分类器。公平、问责制和透明度会议记录369-378.
[47] Carrizosa,E.、Molero-Río,C.和Romero Morales,D.(2021年)。分类和回归树中的数学优化。TOP,西班牙统计与运营研究学会官方期刊29 5-33. ·兹比尔1467.90021
[48] Carrizosa,E.、Nogales-Gómez,A.和Romero Morales,D.(2016)。强烈同意还是强烈反对支持向量机中的评级功能。信息科学329 256-273. 《发现科学》特刊。
[49] Caruana,R.、Lou,Y.、Gehrke,J.、Koch,P.、Sturm,M.和Elhadad,N.(2015)。医疗保健智能模型:预测肺炎风险和医院30天再入院。ACM SIGKDD知识发现和数据挖掘(KDD)国际会议记录1721-1730.
[50] Chan,D.M.、Rao,R.、Huang,F.和Canny,J.F.(2019)。GPU加速了t分布随机邻域嵌入。并行与分布式计算杂志131 1-13.
[51] Chapman,P.等人(2000年)。CRISP-DM 1.0:逐步数据挖掘指南技术报告,SPSS。
[52] Chaudhari,P.、Choromanska,A.、Soatto,S.、LeCun,Y.、Baldassi,C.、Borgs,C.、Chayes,J.、Sagun,L.和Zecchina,R.(2019年)。Entropy-SGD:倾斜梯度下降到宽山谷。统计力学杂志:理论与实验2019 124018. ·Zbl 1459.65091号
[53] Chen,C.、Li,O.、Tao,D.、Barnett,A.、Rudin,C.和Su,J.K.(2019年)。这看起来像是:可解释图像识别的深度学习。神经信息处理系统会议记录8930-8941.
[54] Chen,C.、Lin,K.、Rudin,C.,Shaposhnik,Y.、Wang,S.和Wang,T.(2021)。具有全球一致的信贷风险解释的可解释模型。决策支持系统.
[55] Chen,C.和Rudin,C.(2018)。学习下降规则列表的优化方法。人工智能与统计学报(AISTATS)604-612.
[56] Chen,R.T.Q.,Li,X.,Grosse,R.B.和Duvenaud,D.K.(2018年)。变分自编码器中分离解纠缠源。神经信息处理系统会议记录(S.Bengio、H.Wallach、H.Larochelle、K.Grauman、N.Cesa-Bianchi和R.Garnett编辑)31。
[57] Chen,X.、Duan,Y.、Houthooft,R.、Schulman,J.、Sutskever,I.和Abbeel,P.(2016)。Infogan:通过信息最大化生成性对抗网络进行可解释表示学习。神经信息处理系统会议记录2172-2180.
[58] Chen,Z.、Bei,Y.和Rudin,C.(2020年)。用于可解释图像识别的概念白化。自然机器智能2 772-782.
[59] Chen,Z.、Ogren,A.、Lin,A.、Daraio,C.、Brinson,C.和Rudin,C.(2021)。如何使用可解释机器学习查看元材料中的隐藏模式。(正在进行中)。
[60] Chevaleyre,Y.、Koriche,F.和Zucker,J.-D.(2013)。离散线性分类的舍入方法。机器学习国际会议论文集651-659.
[61] Christodoulou,E.、Ma,J.、Collins,G.S.、Steyerberg,E.W.、Verbakel,J.Y.和Van Calster,B.(2019年)。一项系统性研究表明,在临床预测模型中,机器学习没有比逻辑回归更好的性能优势。临床流行病学杂志110 12-22.
[62] Clark,P.和Boswell,R.(1991年)。CN2的规则归纳:最近的一些改进。欧洲学习工作会议151-163. 斯普林格。
[63] Clark,P.和Niblett,T.(1989)。CN2归纳算法。机器学习3 261-283.
[64] Coenen,A.和Pearce,A.(2019年)。了解UMAP。https://pair-code.github.io/understanding-umap/。
[65] Cohen,W.W.(1995)。快速有效的规则归纳。第十二届机器学习国际会议(ICML)会议记录115-123.
[66] Coppens,Y.、Efthymiadis,K.、Lenaerts,T.、Nowé,A.、Miller,T.,Weber,R.和Magazzeni,D.(2019年)。在软决策树中提取深度强化学习策略。IJCAI可解释人工智能研讨会论文集1-6.
[67] Coston,A.、Rambachan,A.和Chouldechova,A.(2021)。描述选择性标签下良好模型集的公平性。机器学习国际会议论文集.
[68] Cover,T.和Hart,P.(1967年)。最近邻模式分类。IEEE信息理论汇刊13 21-27. ·Zbl 0154.44505号
[69] Craven,M.W.(1996)。从训练好的神经网络中提取可理解模型,威斯康星大学麦迪逊分校计算机科学系博士论文。
[70] Craven,M.W.和Shavlik,J.W.(1995)。提取训练网络的树结构表示。神经信息处理系统会议记录24-30.
[71] Crawford,E.和Pineau,J.(2019年)。基于卷积神经网络的空间不变无监督目标检测。AAAI人工智能会议记录(AAAI)33 3412-3420.
[72] ⑩eyda Ertekin和Rudin,C.(2011年)。分类和排序算法之间的等价关系。机器学习研究杂志12 2905-2929. ·Zbl 1280.68165号
[73] Dahlin,N.、Kalagarla,K.C.、Naik,N.,Jain,R.和Nuzzo,P.(2020年)。用软决策树设计可解释的近似深度强化学习。arXiv电子打印arXiv:2010年14月785日。
[74] D'Amour,A.、Heller,K.、Moldovan,D.、Adlam,B.、Alipanahi,B.、Beutel,A.、Chen,C.、Deaton,J.、Eisenstein,J.和Hoffman,M.D.等人(2020年)。规范不足对现代机器学习的可信度提出了挑战。arXiv电子打印arXiv:2011.03395.
[75] Das,S.、Cashman,D.、Chang,R.和Endert,A.(2019年)。BEAMES:回归任务的交互式多模型指导、选择和检查。IEEE计算机图形和应用39 20-32.
[76] Das,S.、Natarajan,S.,Roy,K.、Parr,R.和Kersting,K.(2020年)。关系域的匹配Q学习。arXiv电子打印arXiv:2006.05595.
[77] Dash,S.、Günlük,O.和Wei,D.(2018年)。通过列生成的布尔决策规则。神经信息处理系统会议记录31 4655-4665。
[78] Demirović,E.、Lukina,A.、Hebrard,E.、Chan,J.、Bailey,J.,Leckie,C.、Ramamohanarao,K.和Stuckey,P.J.(2020年)。MurTree:通过动态规划和搜索的最佳分类树。arXiv电子打印arXiv:2007.12652.
[79] Desjardins,G.、Courville,A.和Bengio,Y.(2012年)。通过生殖缠绕分离变异因子。arXiv电子打印arXiv:1210.5474.
[80] Dhamnani,S.、Singal,D.、Sinha,R.、Mohandoss,T.和Dash,M.(2019年)。快速:快速准确的可解释决策集。2019 IEEE国际大数据会议(大数据)1292-1301. IEEE标准。
[81] Dhebar,Y.、Deb,K.、Nageshrao,S.、Zhu,L.和Filev,D.(2020年)。离散动作系统中使用进化非线性决策树的可解释AI策略。arXiv电子打印arXiv:2009.09521.
[82] Dimanov,B.、Bhatt,U.、Jamnik,M.和Weller,A.(2020年)。你不应该相信我:从多种解释方法中隐藏不公平的学习模式。第24届欧洲人工智能会议(ECAI).
[83] Dinh,L.、Pascanu,R.、Bengio,S.、Benjio,Y.(2017年)。尖锐极小值可以推广到深网。机器学习国际会议(ICML)会议记录1019-1028号。
[84] Do,K.和Tran,T.(2019年)。学习分离表征的理论和评估指标。学习代表国际会议记录.
[85] Dobkin,D.、Fulton,T.、Gunopulos,D.、Kasif,S.和Salzberg,S.(1997)。浅决策树的归纳。IEEE模式分析和机器智能汇刊.
[86] Dong,J.和Rudin,C.(2020年)。探索所有好模型集合的可变重要性云。自然机器智能2 810-824.
[87] Donoho,D.L.和Grimes,C.(2003)。黑森特征映射:高维数据的局部线性嵌入技术。美国国家艺术与科学院院刊100 5591-5596. ·Zbl 1130.62337号
[88] Dua,D.和Graff,C.(2017年)。UCI机器学习库。
[89] 杜达尼,S.A.(1976年)。距离加权k-最近邻规则。IEEE系统、人与控制论汇刊SMC-6 325-327。
[90] Díeroski,S.、De Raedt,L.和Blockeel,H.(1998)。关系强化学习。国际归纳逻辑程序设计会议11-22. 斯普林格。
[91] Díeroski,S.、De Raedt,L.和Driessens,K.(2001)。关系强化学习。机器学习43 7-52. ·Zbl 0988.68088号
[92] Eastwood,C.和Williams,C.K.(2018年)。一个量化评估非纠缠表示的框架。学习代表国际会议记录.
[93] Elomaa,T.(1994)。为C4.5辩护:学习一级决策树的注意事项。机器学习国际会议论文集62-69. 摩根·考夫曼。
[94] Farhangfar,A.、Greiner,R.和Zinkevich,M.(2008)。一种快速生成最佳固定深度决策树的方法。国际人工智能与数学研讨会(ISAIM).
[95] Fayyad,U.、Piatetsky-Shapiro,G.和Smyth,P.(1996年)。从数据挖掘到数据库中的知识发现。人工智能杂志17 37-54.
[96] Finney,S.、Gardiol,N.H.、Kaelbling,L.P.和Oates,T.(2002)。我们尝试的方法效果不太好:强化学习中的指示表征。人工智能不确定性会议记录154-161.
[97] Fisher,A.、Rudin,C.和Dominici,F.(2019年)。所有模型都是错误的,但许多模型都是有用的:通过同时研究一整类预测模型来了解变量的重要性。机器学习研究杂志20 1-81. ·Zbl 1436.62019年
[98] Fix,E.和Hodges,J.L.(1951年)。判别分析,非参数判别:一致性特性技术报告第4号,德克萨斯州伦道夫菲尔德美国空军航空医学院·Zbl 0715.62080号
[99] Frank,E.和Witten,I.H.(1998年)。生成精确的规则集而不进行全局优化。国际机器学习会议记录144-151.
[100] Freitas,A.A.(2014)。可理解的分类模型:立场文件。ACM SIGKDD探索新闻稿15 1-10.
[101] Freund,Y.和Schapire,R.E.(1997)。在线学习的决策理论推广及其在助推中的应用。计算机与系统科学杂志55 119-139. ·Zbl 0880.68103号
[102] Friedman,J.H.(2001)。贪婪函数近似:梯度提升机。统计年鉴1189-1232. ·Zbl 1043.62034号
[103] Friedman,J.H.(2002)。随机梯度增强。计算统计学和数据分析38 367-378. ·Zbl 1072.65502号
[104] Friedman,J.H.和Fisher,N.I.(1999)。高维数据中的凹凸搜索。统计与计算9 123-143.
[105] Fu,C.,Zhang,Y.,Cai,D.和Ren,X.(2019)。AtSNE:通过层次优化在GPU上实现高效且稳健的可视化。ACM SIGKDD知识发现和数据挖掘(KDD)国际会议记录176-186年。
[106] Fukunaga,K.和Hostetler,L.(1973)。优化k个最近邻密度估计。IEEE信息理论汇刊19 320-326. ·Zbl 0276.62039号
[107] Gage,B.F.、Waterman,A.D.、Shannon,W.、Boechler,M.、Rich,M.W.和Radford,M.J.(2001)。预测中风的临床分类方案的验证:来自国家心房颤动登记处的结果。美国医学会杂志285 2864-2870.
[108] Gaines,B.R.和Compton,P.(1995年)。归纳应用于大型数据库建模的涟漪下降规则。智能信息系统杂志5 211-228.
[109] Ghosh,B.和Meel,K.S.(2019年)。IMLI:基于MaxSAT的可解释分类规则学习的增量框架。AAAI/ACM人工智能、道德和社会会议记录203-210中。
[110] Goh,S.T.和Rudin,C.(2014)。使用不平衡数据进行学习的方框图。ACM SIGKDD知识发现和数据挖掘(KDD)国际会议记录333-342.
[111] Gomez,O.、Holter,S.、Yuan,J.和Bertini,E.(2020年)。ViCE:机器学习模型的可视化反事实解释。第25届智能用户界面国际会议(IUI'20)会议记录.
[112] Goodfellow,I.、Pouget-Abadie,J.、Mirza,M.、Xu,B.、Warde-Farley,D.、Ozair,S.、Courville,A.和Bengio,Y.(2014)。生成对抗网。神经信息处理系统会议记录27 2672-2680.
[113] Gosiewska,A.和Biecek,P.(2020年)。不要相信附加解释。arXiv电子打印arXiv:1903.11420年。
[114] Gray,J.B.和Fan,G.(2008年)。使用TARGET进行分类树分析。计算统计与数据分析52 1362-1372. ·Zbl 1452.62445号
[115] Gross,C.C.(2002)。“祖母细胞”的谱系。神经学家8 512-518.
[116] Guan,L.、Verma,M.、Guo,S.、Zhang,R.和Kambhampati,S.(2020)。通过解释和上下文软件数据增强,拓宽人类引导强化学习的渠道。
[117] Guez,A.、Vincent,R.D.、Avoli,M.和Pineau,J.(2008)。通过批处理模式强化学习自适应治疗癫痫。人工智能(AAAI)会议记录1671-1678.
[118] Günlük,O.,Kalagnanam,J.,Li,M.,Menickelly,M.和Scheinberg,k.(2021)。基于整数规划的分类数据最优决策树。全球优化杂志1-28. ·Zbl 1475.90039号
[119] 滨本,R.,素瓦尔纳,K.,山田,M.,小林,K.、新开,N.,三宅一生,M.高桥,M.、金奈,S.、下山,R.、酒井,A.,高泽一郎,K.Bolatkan,A.,Shozu,K.Dozen,A.、Machino,H.,Takahashi,S.,Asada,K.Komatsu,M.和Sese,J.以及Kaneko,S..(2020年)。人工智能技术在肿瘤学中的应用:迈向建立精确医学。癌症12
[120] Hammond,K.(1989)。第二届基于案例推理研讨会(DARPA)会议记录.摩根·坎夫曼出版公司,加利福尼亚州圣马特奥。
[121] Haris,A.、Simon,N.和Shojaie,A.(2019)。广义稀疏可加模型。arXiv电子打印arXiv:1903.04641.
[122] Hastie,T.J.和Tibshirani,R.J.(1990年)。广义可加模型43.CRC出版社·Zbl 0747.62061号
[123] Higgins,I.、Amos,D.、Pfau,D.、Racaniere,S.、Matthey,L.、Rezende,D.和Lerchner,A.(2018)。朝向解纠缠表示的定义。arXiv电子打印arXiv:1812.02230.
[124] Higgins,I.、Matthey,L.、Pal,A.、Burgess,C.、Glorit,X.、Botvinick,M.、Mohamed,S.和Lerchner,A.(2017)。beta-VAE:使用约束变分框架学习基本的视觉概念学习代表国际会议记录.
[125] Hinton,G.(2021年)。如何在神经网络中表示部分-整体层次结构。arXiv电子打印arXiv:2102.12627.
[126] Hinton,G.E.、Krizhevsky,A.和Wang,S.D.(2011年)。转换自动编码器。人工神经网络国际会议论文集44-51. 斯普林格。
[127] Hochreiter,S.和Schmidhuber,J.(1997)。平坦的最小值。神经计算9 1-42. ·Zbl 0872.68150号
[128] Holte,R.C.(1993)。非常简单的分类规则在最常用的数据集上表现良好。机器学习11 63-91. ·Zbl 0850.68278号
[129] Hong,D.、Baek,S.S.和Wang,T.(2020年)。基于原型轨迹的可解释序列分类。arXiv电子打印arXiv:2007.01777.
[130] Hu,H.、Siala,M.、Hébrard,E.和Huguet,M.-J.(2020年)。用MaxSAT学习最优决策树及其在AdaBoost中的集成。IJCAI-PRICAI 2020,第29届国际人工智能联合会议和第17届环太平洋国际人工智能会议.
[131] Hu,X.,Rudin,C.和Seltzer,M.(2019年)。最优稀疏决策树。神经信息处理系统会议记录.
[132] Ignatiev,A.、Pereira,F.、Narodytska,N.和Marques-Silva,J.(2018)。一种基于SAT的学习可解释决策集的方法。国际自动推理联合会议627-645. ·Zbl 1511.68249号
[133] 史密森学会(2020年)。原始猛犸(Blumbach)。https://3d.si.edu/object/3d/mammuthus-primigenius-blumbach:341c96cd-f967-4540-8ed1-d3fc56d31f12。
[134] Jacomy,M.、Venturini,T.、Heymann,S.和Bastian,M.(2014)。ForceAtlas2是为Gephi软件设计的用于方便网络可视化的连续图形布局算法。公共科学图书馆一号9 1-12.
[135] Jaderberg,M.、Simonyan,K.、Zisserman,A.和Kavukcuoglu,K..(2015)。空间变压器网络。神经信息处理系统会议记录2017-2025.
[136] Javad,M.O.M.、Agboola,S.O.、Jethwani,K.、Zeid,A.和Kamarthi,S.(2019年)。一种基于强化学习的1型糖尿病管理方法:探索性研究。JMIR糖尿病4 e12905。
[137] Johnson,J.、Hariharan,B.、van der Maaten,L.、Fei-Fei,L.,Lawrence Zitnick,C.和Girshick,R.(2017)。CLEVR:合成语言和基本视觉推理的诊断数据集。IEEE计算机视觉和模式识别会议记录.
[138] Juozapaitis,Z.、Koul,A.、Fern,A.、Erwig,M.和Doshi-Velez,F.(2019年)。通过奖励分解进行可解释的强化学习。IJCAI/ECAI可解释人工智能研讨会会议记录.
[139] Kabra,R.、Burgess,C.、Matthey,L.、Kaufman,R.L.、Greff,K.、Reynolds,M.和Lerchner,A.(2019年)。多对象数据集。https://github.com/deepmind/multi-object-datasets/。
[140] Kakade,S.M.、Sridharan,K.和Tewari,A.(2009年)。线性预测的复杂性:风险边界、边际边界和正则化。神经信息处理系统会议记录793-800.
[141] Kaur,H.、Nori,H.,Jenkins,S.、Caruana,R.、Wallach,H.和Wortman Vaughan,J.(2020年)。解释可解释性:理解数据科学家对机器学习可解释性工具的使用。2020年CHI计算机系统人为因素会议记录1-14.
[142] Keller,J.M.、Gray,M.R.和Givens,J.A.(1985年)。一种模糊k近邻算法。IEEE系统、人与控制论汇刊4 580-585.
[143] Kersting,K.和Driessens,K.(2008)。非参数政策梯度:命题域和关系域的统一处理。第25届机器学习国际会议论文集456-463.
[144] Keskar,N.S.、Mudigere,D.、Nocedal,J.、Smelyanskiy,M.和Tang,P.T.P.(2017)。关于深度学习的大范围训练:泛化差距和显著极小值。学习代表国际会议记录.
[145] Kim,B.、Khanna,R.和Koyejo,O.O.(2016)。榜样不够,学会批评!对可解释性的批评。神经信息处理系统会议记录(D.Lee、M.Sugiyama、U.Luxburg、I.Guyon和R.Garnett编辑)29 2280-2288。
[146] Kim,B.、Rudin,C.和Shah,J.A.(2014年)。贝叶斯案例模型:基于案例推理和原型分类的生成方法。神经信息处理系统会议记录(NeurIPS)27 1952-1960.
[147] Kim,B.、Wattenberg,M.、Gilmer,J.、Cai,C.、Wexler,J.和Viegas,F.等人(2018年)。超越特征属性的可解释性:用概念激活向量(tcav)进行定量测试。机器学习国际会议论文集2668-2677.
[148] Kim,H.和Mnih,A.(2018年)。通过因子分解分解。国际机器学习会议记录2649-2658.
[149] Kingma,D.P.和Welling,M.(2013)。自动编码变分贝叶斯。学习代表国际会议记录.
[150] Kiran,B.R.、Sobh,I.、Talpaert,V.、Mannion,P.、Al-Sallab,A.A.、Yogamani,S.和Pérez,P.(2021)。针对自动驾驶的深度强化学习:一项调查。IEEE智能交通系统汇刊1-18.
[151] Kissel,N.和Mentch,L.(2021)。前向稳定性和模型路径选择。arXiv电子打印arXiv:2103.03462.
[152] Knaus,W.A.、Draper,E.A.、Wagner,D.P.和Zimmerman,J.E.(1985)。APACHE II:疾病严重程度分类系统。重症医学13 818-829.
[153] Knaus,W.A.、Wagner,D.P.、Draper,E.A.、Zimmerman,J.E.、Bergner,M.、Bastos,P.G.、Sirio,C.A.、Murphy,D.J.、Lotring,T.、Damiano,A.等人(1991年)。APACHE III预后系统:危重住院成人住院死亡率的风险预测。胸部100 1619-1636.
[154] Knaus,W.A.、Zimmerman,J.E.、Wagner,D.P.、Draper,E.A.和Lawrence,D.E.(1981)。APACHE-急性生理学和慢性健康评估:基于生理学的分类系统。重症医学9 591-597.
[155] Kobak,D.和Berens,P.(2019年)。将t-SNE用于单细胞转录组学的艺术。自然沟通10 5416.
[156] Kober,J.、Bagnell,J.A.和Peters,J.(2013)。机器人强化学习:一项调查。国际机器人研究杂志32 1238-1274.
[157] Kodratoff,Y.(1994年)。可理解性宣言。KDD掘金新闻稿94
[158] Koh,P.W.、Nguyen,T.、Tang,Y.S.、Mussmann,S.、Pierson,E.、Kim,B.和Liang,P.(2020)。概念瓶颈模型。机器学习国际会议论文集5338-5348.
[159] Kohonen,T.(1995)。学习向量量化。大脑理论和神经网络手册537-540.
[160] Kolodner,J.L.(1988)。基于案例的推理研讨会(DARPA)会议记录.Morgan Kaufmmnn Publishers,Inc.,加利福尼亚州圣马特奥。
[161] Koltchinskii,V.和Panchenko,D.(2002年)。经验边缘分布和组合分类器泛化误差的边界。统计年鉴30 1-50. ·兹比尔1012.62004
[162] Komorowski,M.、Celi,L.A.、Badawi,O.、Gordon,A.C.和Faisal,A.A.(2018)。人工智能临床医生学习重症监护中脓毒症的最佳治疗策略。自然医学24 1716-1720.
[163] Kosiorek,A.、Sabour,S.、Teh,Y.W.和Hinton,G.E.(2019年)。堆叠胶囊自动编码器。神经信息处理系统会议记录15512-15522.
[164] Krizhevsky,A.、Sutskever,I.和Hinton,G.E.(2017年)。使用深度卷积神经网络进行ImageNet分类。ACM通信60
[165] Kulkarni,T.D.、Whitney,W.、Kohli,P.和Tenenbaum,J.B.(2015)。深度卷积逆图形网络。In神经信息处理系统会议记录.
[166] Kursuncu,U.、Gaur,M.和Sheth,A.(2020年)。知识注入式学习(K-IL):走向知识在深度学习中的深度融合。AAAI 2020春季研讨会论文集:机器学习与知识工程实践相结合(AAAI-MAKE 2020)一、。
[167] Kutz,J.N.、Brunton,S.L.、Brunton,B.W.和Proctor,J.L.(2016)。动态模式分解:复杂系统的数据驱动建模.暹罗·Zbl 1365.65009号
[168] Lagaris,I.E.、Likas,A.和Fotiadis,D.I.(1998)。用于求解常微分方程和偏微分方程的人工神经网络。IEEE神经网络汇刊9 987-1000.
[169] Lagaris,I.E.、Likas,A.C.和Papageorgiou,D.G.(2000年)。不规则边界边值问题的神经网络方法。IEEE神经网络汇刊11 1041-1049。
[170] Lakkaraju,H.、Bach,S.H.和Leskovec,J.(2016)。可解释决策集:描述和预测的联合框架。ACM SIGKDD知识发现和数据挖掘(KDD)国际会议记录1675-1684.
[171] Lakkaraju,H.和Bastani,O.(2020年)。“我怎么愚弄你?”:通过误导性黑盒解释操纵用户信任。AAAI/ACM人工智能、道德和社会会议记录79-85.
[172] Lapuschkin,S.、Wäldchen,S.、Binder,A.、Montavon,G.、Samek,W.和Müller,K.-R.(2019)。揭开聪明汉斯(Clever Hans)的神秘面纱,并评估机器真正学到了什么。自然通信10
[173] Laugel,T.、Lesot,M.-J.、Marsala,C.、Renard,X.和Detyniecki,M.(2019年)。事后解释的危险:不合理的反事实解释。第二十八届国际人工智能联合会议记录2801-2807.
[174] Laurent,H.和Rivest,R.L.(1976年)。构造最优二叉决策树是NP完全的。信息处理信件5 15-17. ·Zbl 0333.68029号
[175] Le Gall,J.-R.、Lemeshow,S.和Saulnier,F.(1993)。基于欧洲/北美多中心研究的新简化急性生理学评分(SAPS II)。美国医学会杂志270 2957-2963.
[176] LeCun,Y.、Bengio,Y.和Hinton,G.(2015)。深度学习。自然521 436-444. ·doi:10.1038/nature14539
[177] LeCun,Y.、Cortes,C.和Burges,C.(2010年)。MNIST手写数字数据库。ATT实验室[在线]。可用:http://yann.lecun.com/exdb/mnist2
[178] Lee,H.和Kang,I.S.(1990年)。求解微分方程的神经算法。计算物理杂志91 110-131. ·Zbl 0717.65062号
[179] Lee,J.、Lee,Y.、Kim,J.,Kosiorek,A.、Choi,S.和Teh,Y.W.(2019年)。集合变换器:基于注意力的排列变异神经网络框架。机器学习国际会议论文集3744-3753.
[180] Letham,B.、Rudin,C.、McCormick,T.H.、Madigan,D.等人(2015)。使用规则和贝叶斯分析的可解释分类器:构建更好的笔画预测模型。应用统计学年鉴9 1350-1371. ·Zbl 1454.62348号
[181] Li,H.,Xu,Z.,Taylor,G.,Studer,C.和Goldstein,T.(2018年)。可视化神经网络的损失景观。神经信息处理系统会议记录.
[182] Li,J.、Monroe,W.、Ritter,A.、Galley,M.、Gao,J.和Jurafsky,D.(2016)。针对对话生成的深度强化学习。自然语言处理经验方法会议记录.
[183] Li,O.、Liu,H.、Chen,C.和Rudin,C.(2018)。通过原型进行基于案例推理的深度学习:解释其预测的神经网络。人工智能(AAAI)会议记录.
[184] Li,W.,Han,J.和Pei,J.(2001)。CMAR:基于多类关联规则的准确高效分类。2001年IEEE数据挖掘国际会议论文集(ICDM)369-376. IEEE标准。
[185] Lin,J.,Zhong,C.,Hu,D.,Rudin,C.和Seltzer,M.(2020年)。广义和可扩展的最优稀疏决策树。机器学习国际会议论文集6150-6160.
[186] Lin,Y.,Zhang,H.H.等人(2006)。多元非参数回归中的成分选择与平滑。统计年鉴34 2272-2297. ·Zbl 1106.62041号
[187] Linderman,G.C.、Rachh,M.、Hoskins,J.G.、Steinerberger,S.和Kluger,Y.(2019年)。基于快速插值的t-SNE用于改进单细胞RNA-seq数据的可视化。自然方法16 243-245.
[188] Liu,B.、Hsu,W.、Ma,Y.等人(1998年)。集成分类和关联规则挖掘。ACM SIGKDD知识发现和数据挖掘(KDD)国际会议记录98 80-86.
[189] Liu,G.、Schulte,O.、Zhu,W.和Li,Q.(2018)。利用线性模型u树实现可解释的深层强化学习。欧洲机器学习和数据库知识发现联合会议414-429. 斯普林格。
[190] Liu,Y.、Logan,B.、Liu,N.、Xu,Z.、Tang,J.和Wang,Y.(2017)。针对医学注册数据的动态治疗方案的深度强化学习。2017 IEEE医疗信息学国际会议(ICHI)380-385. IEEE标准。
[191] Locatello,F.、Weissenborn,D.、Unterthiner,T.、Mahendran,A.、Heigold,G.、Uszkoreit,J.、Dosovitskiy,A.和Kipf,T.(2020年)。以目标为中心的学习与时隙注意力。神经信息处理系统会议记录.
[192] Loh,W.-Y和Shih,Y.-S.(1997)。分类树的拆分选择方法。中国统计局7 815-840. ·Zbl 1067.62545号
[193] Losch,M.、Fritz,M.和Schiele,B.(2019年)。分类输出之外的可解释性:语义瓶颈网络。arXiv电子打印arXiv:1907.10882.
[194] Lou,Y.、Bien,J.、Caruana,R.和Gehrke,J.(2016)。稀疏部分线性可加模型。计算与图形统计杂志25 1126-1140.
[195] Lou,Y.、Caruana,R.和Gehrke,J.(2012)。分类和回归的智能模型。ACM SIGKDD知识发现和数据挖掘(KDD)国际会议记录150-158.
[196] Lou,Y.、Caruana,R.、Gehrke,J.和Hooker,G.(2013)。具有成对交互的精确可理解模型。ACM SIGKDD知识发现和数据挖掘(KDD)国际会议记录623-631.
[197] Malioutov,D.和Meel,K.S.(2018年)。MLIC:基于MaxSAT的学习可解释分类规则的框架。约束编程原理与实践国际会议312-327. 斯普林格。
[198] Malioutov,D.和Varshney,K.(2013)。通过布尔压缩感知实现精确规则学习。机器学习国际会议论文集765-773.
[199] Marchand,M.和Shawe-Taylor,J.(2002年)。成套覆盖机。机器学习研究杂志3 723-746. ·Zbl 1112.68392号
[200] Marchand,M.和Sokolova,M.(2005年)。学习数据相关功能的决策列表。机器学习研究杂志6 427-451. ·Zbl 1222.68257号
【201】 Marx,C.、Calmon,F.和Ustun,B.(2020年)。分类中的预测多重性。机器学习国际会议论文集6765-6774.
[202] Matthey,L.、Higgins,I.、Hassabis,D.和Lerchner,A.(2017)。dSprites:解纠缠测试精灵数据集。https://github.com/deepmind/dsprites-dataset/。
[203] McGough,M.(2018)。萨克拉门托的空气到底有多糟糕?有人说,谷歌搜索结果似乎与现实不符。萨克拉门托蜜蜂报.
[204] McInnes,L.、Healy,J.和Melville,J.(2018)。UMAP:用于降维的均匀流形近似和投影。arXiv电子打印arXiv:1802.03426.
[205] Mehta,M.、Agrawal,R.和Rissanen,J.(1996年)。SLIQ:用于数据挖掘的快速可扩展分类器。扩展数据库技术国际会议18-32. 斯普林格。
[206] Meier,L.、Van de Geer,S.、Bühlmann,P.等人(2009年)。高维加性建模。统计年鉴37 3779-3821. ·Zbl 1360.62186号
[207] Meng,X.、Li,Z.、Zhang,D.和Karniadakis,G.E.(2020年)。PPINN:用于时间相关PDE的准真实物理信息神经网络。应用力学与工程中的计算机方法370 113250. ·Zbl 1506.65181号
[208] Miller,G.(1956年)。神奇的数字七,加或减二:我们处理信息的能力受到了一些限制。心理学评论63 81-97.
[209] Ming,Y.,Xu,P.,Qu,H.和Ren,L.(2019年)。通过原型进行可解释和可控制的序列学习。ACM SIGKDD知识发现和数据挖掘(KDD)国际会议记录903-913.
[210] Mnih,V.、Kavukcuoglu,K.、Silver,D.、Rusu,A.A.、Veness,J.、Bellemare,M.G.、Graves,A.、Riedmiller,M.、Fidjeland,A.K.、Ostrovski,G.等人(2015)。通过深度强化学习进行人性化控制。自然518 529-533.
[211] Moreno,R.P.、Metnitz,P.G.、Almeida,E.、Jordan,B.、Bauer,P.、Campos,R.A.、Iapichino,G.、Edbrooke,D.、Capuzzo,M.、Le Gall,J.-R等人(2005年)。SAPS 3-从患者评估到重症监护室评估。第2部分:建立ICU入院时医院死亡率的预测模型。重症监护医学31 1345-1355.
[212] Morgan,J.N.和Sonquist,J.A.(1963年)。调查数据分析中的问题,并提出建议。J.Amer。统计师。协会。58 415-434. ·Zbl 0114.10103中
[213] Mott,A.、Zoran,D.、Chrzanowski,M.、Wierstra,D.和Rezende,D.J.(2019年)。使用注意力增强代理进行可解释的强化学习。神经信息处理系统会议记录12350-12359.
[214] Narodytska,N.、Ignatiev,A.、Pereira,F.和Marques-Silva,J.(2018)。用SAT.In学习最优决策树第二十八届国际人工智能联合会议(IJCAI)会议记录1362-1368. ·Zbl 1511.68249号
[215] Nauta,M.、Jutte,A.、Provost,J.和Seifert,C.(2020)。看起来是这样的,因为。。。解释可解释图像识别的原型。arXiv电子打印arXiv:2011.02863.
[216] Nauta,M.、van Bree,R.和Seifert,C.(2021)。可解释细粒度图像识别的神经原型树。IEEE计算机视觉和模式识别会议记录.
[217] Nelder,J.A.和Wedderburn,R.W.(1972年)。广义线性模型。英国皇家统计学会杂志:A辑(综述)135 370-384.
[218] Netzer,Y.、Wang,T.、Coates,A.、Bissacco,A.、Wu,B.和Ng,A.Y.(2011年)。利用无监督特征学习阅读自然图像中的数字。NeurIPS深度学习和无监督特征学习研讨会会议记录.
[219] Newell,A.,Simon,H.A.等人(1972年)。人的问题解决新泽西州普伦蒂斯·霍尔·恩格尔伍德悬崖。
[220] Nijssen,S.和Fromont,E.(2007年)。从项集格挖掘最优决策树。ACM SIGKDD知识发现和数据挖掘(KDD)国际会议记录530-539. ACM公司。
[221] Nijssen,S.和Fromont,E.(2010年)。基于项目集格的最优约束决策树归纳。数据挖掘与知识发现21 9-51.
[222] Nijssen,S.、Schaus,P.等人(2020年)。使用缓存分枝定界搜索学习最优决策树。人工智能(AAAI)会议记录.
[223] Nori,H.、Jenkins,S.、Koch,P.和Caruana,R.(2019年)。InterpretML:机器学习可解释性的统一框架。arXiv电子打印arXiv:1909.09223.
[224] Northpointe(2013)。《COMPAS核心技术报告从业者指南》,Northpointe。
[225] O'Connor,M.(2021)。算法的“意外”弱点引发了人们对人工智能在更广泛人群中的潜力的更大担忧。健康成像、人工智能部分4月5日。
[226] Pang,G.、Lu,L.和Karniadakis,G.E.(2019)。fPINNs:分数物理信息神经网络。SIAM科学计算杂志41 A2603-A2626·兹比尔1420.35549
[227] Pang,G.,Yang,L.和Karniadakis,G.E.(2019年)。函数逼近和PDE解的神经网络诱导高斯过程回归。计算物理杂志384 270-288. ·Zbl 1451.68242号
[228] Papagelis,A.和Kalles,D.(2000年)。GA树:遗传进化的决策树。第12届IEEE人工智能工具国际会议记录(ICTAI)203-206. IEEE标准。
[229] Papernot,N.和McDaniel,P.(2018年)。Deep k最近邻:走向自信、可解释和稳健的深度学习。arXiv电子打印arXiv:1803.04765.
[230] Parbhoo,S.、Bogojeska,J.、Zazzi,M.、Roth,V.和Doshi Velez,F.(2017)。结合基于核和模型的学习进行HIV治疗选择。AMIA翻译科学论文集峰会2017 239.
[231] Parikh,H.、Rudin,C.和Volfovsky,A.(2019年)。学习拉伸后匹配(MALTS)在ACIC 2018因果推断挑战数据中的应用。观察研究118-130.
[232] Pearson,K.(1901年)。与空间点系最接近的直线和平面。哲学杂志2 559-572.
[233] 佩德雷戈萨(Pedregosa,F.)、瓦罗佐(Varoqueux,G.)、格兰福特(Gramfort,A.)、米歇尔(Michel,V.)、提里昂(Thirion,B。Scikit-learn:Python中的机器学习。机器学习研究杂志12 2825-2830. ·Zbl 1280.68189号
[234] Petersen,A.、Witten,D.和Simon,N.(2016)。融合套索加法模型。计算与图形统计杂志25 1005-1025.
[235] Lo Piano,S.(2020年)。机器学习和人工智能中的伦理原则:来自该领域的案例和可能的前进方向。人文社会科学共同体7
[236] Poličar,P.G.、Straíar,M.和Zupan,B.(2019年)。openTSNE:用于t-SNE降维和嵌入的模块化Python库。生物Rxiv.
[237] Poursabzi Sangdeh,F.、Goldstein,D.G.、Hofman,J.M.、Vaughan,J.W.和Wallach,H.M.(2021)。操纵和测量模型的可解释性。计算机系统人为因素会议记录.
[238] Psichogios,D.C.和Ungar,L.H.(1992年)。过程建模的混合神经网络第一原理方法。美国化学工程师会志38 1499-1511.
[239] Quinlan,J.R.(1993)。C4.5:机器学习程序摩根·考夫曼(Morgan Kaufmann)。
[240] Raissi,M.(2018)。深层隐藏的物理模型:非线性偏微分方程的深层学习。机器学习研究杂志19 1-24. ·Zbl 1439.68021号
[241] Raissi,M.、Perdikaris,P.和Karniadakis,G.E.(2018年)。非线性动力系统数据驱动发现的多步神经网络。arXiv电子打印arXiv:1801.01236. ·Zbl 1386.65030号
[242] Raissi,M.、Perdikaris,P.和Karniadakis,G.E.(2019年)。基于物理的神经网络:用于解决涉及非线性偏微分方程的正问题和逆问题的深度学习框架。计算物理杂志378 686-707. ·Zbl 1415.68175号
[243] Raissi,M.、Yazdani,A.和Karniadakis,G.E.(2020年)。隐藏流体力学:从流动可视化中学习速度和压力场。科学类367 1026-1030. ·Zbl 1478.76057号
[244] Rao,C.、Sun,H.和Liu,Y.(2021)。无标记数据的计算弹性动力学物理信息深度学习。工程力学杂志147 04021043.
[245] Ravikumar,P.、Lafferty,J.、Liu,H.和Wasserman,L.(2009年)。稀疏加法模型。英国皇家统计学会杂志:B辑(统计方法)71 1009-1030. ·Zbl 1411.62107号
[246] Riesbeck,C.K.和Schank,R.S.(1989)。基于案例的内部推理Lawrence Erlbaum Assoc.,Inc.,新泽西州希尔斯代尔。
[247] Rivest,R.L.(1987)。学习决策列表。机器学习2 229-246。
[248] Roth,A.M.、Topin,N.、Jamshidi,P.和Veloso,M.(2019年)。保守Q改进:可解释决策树策略的强化学习。arXiv电子打印arXiv:1907.01180.
[249] Roweis,S.T.和Saul,L.K.(2000)。局部线性嵌入的非线性降维。科学类290 2323-2326.
[250] Rudin,C.(2019)。停止解释高风险决策的黑盒机器学习模型,而使用可解释模型。自然机器智能1 206-215.
[251] Rudin,C.和Ertekin,S.(2018年)。通过数学编程学习自定义和优化的规则列表。数学规划C(计算)10 659-702. ·Zbl 1411.90234号
[252] Rudin,C.、Letham,B.和Madigan,D.(2013年)。关联规则和序列事件预测的学习理论分析。机器学习研究杂志14 3441-3492·Zbl 1317.68184号
[253] Rudin,C.和Radin,J.(2019年)。为什么我们不需要在AI中使用黑盒模型?一场可解释的人工智能竞赛的教训。哈佛数据科学评论1
[254] Rudin,C.和Schapire,R.E.(2009年)。基于Margin的排名以及AdaBoost和RankBoost之间的等价性。机器学习研究杂志10 2193-2232. ·Zbl 1235.68186号
[255] Rudin,C.和Shaposhnik,Y.(2019年)。机器学习模型的全球一致性基于规则的摘要解释:应用于信用风险评估。2019年5月28日。SSRN提供:https://ssrn.com/abstract=3395422。
[256] Rudin,C.和Ustun,B.(2018年)。优化的评分系统:为医疗和刑事司法提供机器学习方面的信任。接口48 449-466。
[257] Rudin,C.和Wagstaff,K.L.(2014)。科学与社会机器学习。机器学习95
[258] Rudin,C.、Wang,C.和Coker,B.(2020年)。累犯预测中的保密和不公平年龄。哈佛数据科学评论2
[259] Rudy,S.H.、Brunton,S.L.、Proctor,J.L.和Kutz,J.N.(2017)。偏微分方程的数据驱动发现。科学进展3 e1602614。
[260] Rymarczyk,D.,Struski,Ł。,Tabor,J.和Zielin ski,B.(2020年)。ProtoPShare:可解释图像分类和相似性发现的原型共享。arXiv电子打印arXiv:2011.14340.
[261] Sabour,S.、Frosst,N.和Hinton,G.E.(2017年)。胶囊之间的动态路由。神经信息处理系统会议记录3856-3866.
[262] Sadhanala,V.、Tibshirani,R.J.等人(2019年)。具有趋势过滤功能的加性模型。统计年鉴47 3032-3068. ·Zbl 1436.62450号
[263] Sahli Costabal,F.、Yang,Y.、Perdikaris,P.、Hurtado,D.E.和Kuhl,E.(2020年)。用于心脏激活映射的物理信息神经网络。物理学前沿8 42.
[264] Salakhuttinov,R.和Hinton,G.(2007年)。通过保持类邻域结构学习非线性嵌入。人工智能与统计(AISTATS)412-419.
[265] Sallab,A.E.,Abdou,M.,Perot,E.和Yogamani,S.(2017年)。用于自动驾驶的深度强化学习框架。电子成像2017 70-76.
[266] Schapire,R.E.、Freund,Y.、Bartlett,P.、Lee,W.S.等人(1998年)。提高利润率:投票方法有效性的新解释。统计年鉴26 1651-1686. ·Zbl 0929.62069号
[267] Schmidhuber,J.(1992)。通过可预测性最小化学习阶乘码。神经计算4 863-879.
[268] Schramowski,P.、Stammer,W.、Teso,S.、Brugger,A.、Herbert,F.、Shao,X.、Luigs,H.-G.、Mahlein,A.-K.和Kersting,K.(2020年)。通过与深度神经网络的解释相互作用,使其符合正确的科学理由。自然机器智能2 476-486.
[269] Semenova,L.、Rudin,C.和Parr,R.(2019年)。Rashomon曲线和体积研究:机器学习中泛化和模型简化的新视角。arXiv电子打印arXiv:1908.01755.
[270] Seo,S.、Meng,C.和Liu,Y.(2019年)。稀疏观测动力学的物理感知差分图网络。国际学习代表大会论文集.
[271] Shu,T.、Xiong,C.和Socher,R.(2018)。多任务强化学习中的分层和可解释技能习得。学习代表国际会议记录.
[272] Silva,A.、Gombolay,M.、Killian,T.、Jimenez,I.和Son,S.-H.(2020年)。可解释微分决策树的优化方法在强化学习中的应用。国际人工智能与统计会议(AISTATS)1855-1865.
[273] Silver,D.,Huang,A.,Maddison,C.J.,Guez,A.,Sifre,L.,Van Den Driessche,G.,Schrittwieser,J.,Antonoglou,I.,Panneershelvam,V.,Lanctot,M.等人(2016年)。通过深度神经网络和树搜索掌握围棋游戏。自然529 484-489.
[274] Six,A.、Backus,B.和Kelder,J.(2008)。急诊室胸痛:心脏评分值。荷兰心脏杂志16 191-196.
[275] Sokolova,M.、Marchand,M.,Japkowicz,N.和Shawe-taylor,J.S.(2003)。决策列表机器。神经信息处理系统会议记录945-952中描述。
[276] Sokolovska,N.、Chevaleyre,Y.、Clément,K.和Zucker,J.-D.(2017)。学习可解释医疗评分系统的融合套索惩罚。2017年国际神经网络联合会议(IJCNN)4504-4511. IEEE标准。
[277] Sokolovska,N.、Chevaleyre,Y.和Zucker,J.-D.(2018年)。一种学习可解释评分系统的可证明算法。机器学习研究论文集第84卷:人工智能与统计(AISTATS)566-574.
[278] Spiegelhalter,D.(2020年)。我们应该相信算法吗?哈佛数据科学评论2
[279] Srebro,N.、Sridharan,K.和Tewari,A.(2010年)。平滑、低噪音、速度快。神经信息处理系统会议记录2199-2207.
[280] Sreedharan,S.、Chakraborti,T.和Kambhampati,S.(2018年)。通过模型调和处理解释中的模型不确定性和多重性。自动化规划和调度国际会议记录28 518-526.
[281] Struck,A.F.、Ustun,B.、Ruiz,A.R.、Lee,J.W.、LaRoche,S.M.、Hirsch,L.J.、Gilmore,E.J.、Vlachy,J.、Haider,H.A.、Rudin,C.和Westover,M.B.(2017年)。住院患者基于脑电图的风险评分与癫痫发作概率的相关性。神经病学74 1419-1424.
[282] Sutton,R.S.和Barto,A.G.(2018年)。强化学习:简介麻省理工学院出版社·Zbl 1407.68009号
[283] Tai,L.、Zhang,J.、Liu,M.、Boedecker,J.和Burgard,W.(2016)。机器人学习控制的深层网络解决方案综述:从强化到模仿。arXiv电子打印arXiv:1612.07139.
[284] Tang,J.,Liu,J.、Zhang,M.和Mei,Q.(2016)。可视化大规模和高维数据。第25届万维网国际会议记录287-297. 国际万维网会议指导委员会。
[285] Tenenbaum,J.B.、de Silva,V.和Langford,J.C.(2000)。非线性降维的整体几何框架。科学类290 2319-2323.
[286] Than,M.,Flaws,D.,Sanders,S.,Doust,J.,Glassiou,P.,Kline,J.、Aldous,S.、Troughton,R.、Reid,C.、Parsonage,W.A.等人(2014)。制定和验证急诊部胸痛评分评估和2h加速诊断方案。澳大利亚急救医学26 34-44.
[287] Thiebes,S.、Lins,S.和Sunyaev,A.(2020)。值得信赖的人工智能。电子市场.
[288] Tomsett,R.、Preece,A.、Braines,D.、Cerutti,F.、Chakraborty,S.、Srivastava,M.、Pearson,G.和Kaplan,L.(2020年)。通过可解释且具有不确定性的人工智能快速进行信任校准。模式1 100049.
[289] 托格森·W(1952)。多维标度:理论与方法。心理测量学17 401-419. ·Zbl 0049.37603号
[290] Trinh,L.、Tsang,M.、Rambhatla,S.和Liu,Y.(2021)。通过动态原型进行可解释且值得信赖的深度伪造检测。IEEE/CVF计算机视觉应用冬季会议记录1973-1983.
[291] Ustun,B.和Rudin,C.(2016年)。优化医疗评分系统的超解析线性整数模型。机器学习102 349-391·Zbl 1406.62144号
[292] Ustun,B.和Rudin,C.(2017年)。优化风险评分。ACM SIGKDD知识发现和数据挖掘(KDD)国际会议记录1125-1134. ·Zbl 1440.68242号
[293] Ustun,B.和Rudin,C.(2019年)。学习优化风险评分。机器学习研究杂志20 1-75. ·Zbl 1440.68242号
[294] Ustun,B.、Traca,S.和Rudin,C.(2013年)。预测评分系统的超解析线性整数模型。AAAI研讨会最新进展.
[295] Ustun,B.、Westover,M.B.、Rudin,C.和Bianchi,M.T.(2016)。睡眠呼吸暂停的临床预测模型:病史对症状的重要性。临床睡眠医学杂志12 161-168.
[296] van der Maaten,L.(2014)。使用基于树的算法加速t-SNE。机器学习研究杂志15 3221-3245. ·Zbl 1319.62134号
[297] van der Maaten,L.和Hinton,G.(2008)。使用t-SNE可视化数据。机器学习研究杂志9 2579-2605. ·Zbl 1225.68219号
[298] Vanhoof,K.和Depaire,B.(2010年)。关联规则分类器的结构:综述。2010年IEEE智能系统与知识工程国际会议(ISKE)9-12. IEEE标准。
[299] Vapnik,V.和Chervonenkis,A.Y.(1971)。事件相对频率与其概率的一致收敛性。概率论及其应用16 264. ·Zbl 0247.60005号
[300] Verma,A.、Murali,V.、Singh,R.、Kohli,P.和Chaudhuri,S.(2018年)。可编程解释的强化学习。机器学习国际会议论文集5045-5054.
[301] Verwer,S.和Zhang,Y.(2019年)。使用二进制线性规划公式学习最优分类树。人工智能(AAAI)会议记录.
[302] Vilas Boas,M.G.、Santos,H.G.,Merschmann,L.H.d.C.和Vanden Berghe,G.(2019年)。算法选择问题的最优决策树:基于整数规划的方法。运筹学国际交易.
[303] Wachter,S.、Mittelstadt,B.和Floridi,L.(2017年)。为什么《通用数据保护条例》中不存在对自动决策的解释权。国际数据隐私法.
[304] Wagstaff,K.L.(2012)。重要的机器学习。机器学习国际会议论文集529-536.
[305] Wah,C.、Branson,S.、Welinder,P.、Perona,P.和Belongie,S.(2011年)。Caltech-UCSD Birds-200-2011数据集技术报告编号CNS-TR-2011-001,加利福尼亚理工学院。
[306] Wang,F.和Rudin,C.(2015)。下降规则列表。人工智能与统计学报(AISTATS)1013-1022.
[307] Wang,J.,Oh,J.、Wang,H.和Wiens,J.(2018)。学习可信模型。ACM SIGKDD知识发现和数据挖掘(KDD)国际会议记录2417-2426.
[308] Wang,S.、Teng,Y.和Perdikaris,P.(2020年)。理解和缓解物理信息神经网络中的梯度病理。arXiv电子打印arXiv:2001.04536. ·Zbl 1530.68232号
[309] Wang,T.(2019)。使用可解释的部分替换获得免费或低成本的可解释性。第36届机器学习国际会议(ICML)会议记录97 6505-6514。
[310] Wang,T.、Morucci,M.、Awan,M.U.、Liu,Y.、Roy,S.、Rudin,C.和Volfovsky,A.(2021)。火焰:一种快速的大尺度几乎完全匹配因果推理方法。机器学习研究杂志22 1-41. ·Zbl 07370548号
[311] Wang,T.和Rudin,C.(2015)。学习优化的“与”的“或”。arXiv电子打印arXiv:1511.02210.
[312] Wang,T.、Yang,J.、Li,Y.和Wang,B.(2021)。部分可解释估计量(PIE):黑盒定义的可解释机器学习。arXiv电子打印2105.02410 arXiv:2105.02410.
[313] Wang,Y.、Huang,H.、Rudin,C.和Shaposhnik,Y.(2021)。了解降维工具的工作原理:破译t-SNE、UMAP、TriMap和PaCMAP数据可视化的经验方法。机器学习研究杂志·Zbl 07626716号
[314] Wattenberg,M.、Viégas,F.和Johnson,I.(2016)。如何有效使用t-SNE。蒸馏1 e2。
[315] Weathers,F.W.、Litz,B.T.、Keane,T.M.、Palmieri,P.A.、Marx,B.P.和Schnurr,P.P.(2013)。DSM-5(PCL-5)-标准[测量仪器]的创伤后应激障碍检查表。创伤后应激障碍国家中心提供的量表,网址:www.PTSD.va.gov。
[316] Weinberger,K.Q.和Saul,L.K.(2009年)。大幅度最近邻分类的距离度量学习。机器学习研究杂志10. ·Zbl 1235.68204号
[317] Wexler,R.(2017)。当电脑程序把你关在监狱里:电脑是如何危害刑事司法的。《纽约时报》.
[318] Wood,S.N.(2017)。广义可加模型:R引言CRC按下·Zbl 1368.62004号
[319] Wu,C.和Tabak,E.G.(2017年)。原型分析和原型回归。arXiv电子打印arXiv:1701.08916.
[320] Xie,F.、Chakraborty,B.、Ong,M.E.H.、Goldstein,B.A.和Liu,N.(2020年)。AutoScore:一种基于机器学习的自动临床评分生成器及其在使用电子健康记录进行死亡率预测中的应用。JMIR医学信息学8 e21798。
[321] Yang,H.、Rudin,C.和Seltzer,M.(2017)。可伸缩的贝叶斯规则列表。机器学习国际会议论文集3921-3930.
[322] Yang,Y.、Morillo,I.G.和Hospedales,T.M.(2018)。深层神经决策树。ICML机器学习中人类可解释性研讨会会议记录.
[323] Yang,Y.和Perdikaris,P.(2019年)。随机、高维和多保真系统的条件深度代理模型。计算力学64 417-434. ·Zbl 1471.74074号
[324] Yin,J.和Yu,Y.(2017)。凸约束稀疏加性建模及其扩展。人工智能不确定性会议.
[325] Yin,X.和Han,J.(2003)。CPAR:基于预测关联规则的分类。2003年SIAM国际数据挖掘会议记录331-335. 暹罗。
[326] Yu,C.、Liu,J.和Nemati,S.(2019年)。医疗保健中的强化学习:一项调查。arXiv电子打印arXiv:1908.08796.
[327] Yu,J.、Ignatiev,A.、Bodic,P.L.和Stuckey,P.J.(2020年)。使用SAT的最佳决策列表。arXiv电子打印arXiv:2010.09919. ·Zbl 1522.68489号
[328] Yu,J.、Ignatiev,A.、Stuckey,P.J.和Le Bodic,P.(2020年)。用SAT.In计算最优决策集约束编程原理与实践国际会议952-970. 斯普林格·Zbl 1522.68489号
[329] Zahavy,T.、Ben-Zrihem,N.和Mannor,S.(2016)。灰色黑盒子:理解DQN。机器学习国际会议1899-1908.
[330] Zambardi,V.、Raposo,D.、Santoro,A.、Bapst,V.、Li,Y.、Babuschkin,I.、Tuyls,K.、Reichert,D.、Lillicrap,T.、Lockhart,E.等人(2019)。关系深层强化学习。学习代表国际会议记录.
[331] Zech,J.R.等人(2018年)。在胸片中检测肺炎的深度学习模型的可变泛化性能:一项横断面研究。公共科学图书馆-医学。15
[332] Zhang,K.,Wang,Y.,Du,J.,Chu,B.,Celi,L.A.,Kindle,R.和Doshi-Velez,F.(2021)。确定低血压治疗中安全和可解释强化学习的决策点。NeurIPS健康机器学习研讨会会议记录.
[333] Zhang,Q.,Nian Wu,Y.和Zhu,S.-C.(2018)。可解释的卷积神经网络。IEEE计算机视觉和模式识别会议记录8827-8836.
[334] Zhang,Y.、Song,K.、Sun,Y.,Tan,S.和Udell,M.(2019年)。“你为什么要相信我的解释?”理解LIME解释中的不确定性。ICML AI社会公益研讨会会议记录.
[335] Zhao,H.、Jin,R.、Wu,S.和Shi,J.(2011)。线锯切片过程中材料去除率的PDE约束高斯过程模型。制造科学与工程杂志133
[336] Zhou,B.、Bau,D.、Oliva,A.和Torralba,A.(2018)。通过网络解剖解释深层视觉表现。IEEE模式分析和机器智能汇刊.
[337] Zhou,B.、Khosla,A.、Lapedriza,A.、Oliva,A.和Torralba,A.(2014)。目标探测器出现在深场景CNN中。学习代表国际会议记录.
[338] Zhou,B.、Sun,Y.、Bau,D.和Torralba,A.(2018)。可视化解释的可解释基础分解。欧洲计算机视觉会议记录119-134.
[339] 周大新(2002)。学习理论中的覆盖数。复杂性杂志18 739-767. ·Zbl 1016.68044号
[340] Zhu,Y.,Zabaras,N.,Koutsourelakis,P.-S.和Perdikaris,P.(2019年)。物理约束的深度学习用于高维代理建模和不确定性量化,无需标记数据。计算物理杂志394 56-81. ·Zbl 1452.68172号
[341] Zhu,Z.,Luo,P.,Wang,X.和Tang,X..(2014)。多视图感知器:用于学习人脸身份和视图表示的深层模型。神经信息处理系统会议记录217-225.
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。