×

用统计关联度解释分类器。 (英语) Zbl 07710192号

摘要:提出了一类新的概率敏感性度量,它量化了分类中使用的协变量与一般目标之间的关联程度,并证明了此类度量具有零相关性。引入了相应的估计量,证明了渐近一致性,并使用bootstrap量化估计中的不确定性。说明了在统计机器学习环境中使用新的依赖性度量作为解释。由此产生的方法称为Xi-method,通过涉及不同数据格式的应用程序进行了演示:表格、可视和文本。

MSC公司:

62-08 统计学相关问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 巴伯,R.F。;Candés,E.J.,《通过仿冒品控制虚假发现率》,《Ann.Stat.》,第43期,2055-2085年(2015年)·Zbl 1327.62082号
[2] 粘合剂A。;巴赫,S。;蒙塔文,G。;穆勒,K.R。;Samek,W.,《深层神经网络架构的分层相关传播》,Lect。注释Electr。工程,376,913-922(2016)
[3] 博尔戈诺沃,E。;Hazen,G。;Plischke,E.,《全球敏感性度量及其估计的共同原理》,《风险分析》。,1871-1895年(2016年)
[4] 博尔戈诺沃,E。;南卡罗来纳州塔兰托拉。;Plischke,E。;Morris,M.D.,《计算机实验灵敏度分析中的变换和不变性》,J.R.Stat.Soc.,Ser。B、 76925-947(2014)·Zbl 1411.62227号
[5] Breiman,L.,《随机森林》,马赫。学习。,45, 5-32 (2001) ·Zbl 1007.68152号
[6] 布雷曼,L。;弗里德曼,J.H。;Olshen,R.A。;Stone,C.,《分类和回归树》(1984),查普曼和霍尔出版社·Zbl 0541.62042号
[7] 坎迪斯,E。;范,Y。;Janson,L。;Lv,J.,淘金:高维受控变量选择的“X型”仿制品,J.R.Stat.Soc.,Ser。B、 统计方法。,80, 551-577 (2018) ·Zbl 1398.62335号
[8] Chan,K。;Saltelli,A。;Tarantola,S.,《缠绕楼梯:计算敏感性指数的抽样工具》,《统计计算》。,187-196年10月(2000年)
[9] Chatterjee,S.,《一个新的相关系数》,美国统计协会,1162009-2022(2021)·Zbl 0941.81627号
[10] 乔杜里,A。;Hu,W.,计算距离相关性的快速算法,计算。统计数据分析。,135, 15-24 (2019) ·Zbl 1507.62026号
[11] Da Veiga,S.,《依赖性度量的全球敏感性分析》,J.Stat.Compute。模拟。,851283-1305(2015)·Zbl 1457.62188号
[12] Da Veiga,S.,基于核的ANOVA分解和Shapley效应:在全球敏感性分析中的应用(2021),1-44
[13] 杜瓦,D。;Graff,C.,UCI机器学习库(2017),网址:
[14] 邓森,D.B.,《大数据时代的统计:机器的故障》,Stat.Probab。莱特。,136, 4-9 (2018) ·Zbl 1489.62411号
[15] 埃夫隆,B。;Gong,G.,《从容地看引导、折刀和交叉验证》,《美国统计》,第37卷,第36-48页(1983年)
[16] 范,J。;Lv,J.,超高维特征空间的确定独立筛选,J.R.Stat.Soc.,Ser。B、 统计方法。,70, 849-911 (2008) ·Zbl 1411.62187号
[17] 费希尔,A。;鲁丁,C。;Dominici,F.,所有模型都是错误的,但许多模型都是有用的:通过同时研究一整类预测模型来了解变量的重要性,J.Mach。学习。决议,20,1-81(2019)·Zbl 1436.62019年
[18] Gamboa,F。;Gremaud,P。;Klein,T。;Lagnoux,A.,《全球敏感性分析:基于秩统计的新一代强大估计量》(2020年),1-27
[19] Gamboa,F。;Janon,A。;Klein,T。;拉格努克斯,A。;Prieur,C.,Sobol pick-freeze Monte Carlo方法的统计推断,统计学,50881-902(2016)·Zbl 1355.62010号
[20] Gamboa,F。;Klein,T。;Lagnoux,A.,基于Cramér von Mises距离的敏感性分析,SIAM/ASA J.不确定性。量化。,6, 522-548 (2018) ·Zbl 1392.62091号
[21] 格利克,N.,概率密度或随机变量之间的分离测量,加拿大。J.Stat.,3,267-276(1975)·Zbl 0371.62087号
[22] 格雷顿,A。;O.布斯克。;Smola,A。;Schölkopf,B.,用Hilbert-Schmidt规范测量统计相关性。算法学习理论,(第16届国际会议,ALT 2005(2005)),63-77·Zbl 1168.62354号
[23] 哈斯蒂,T.J。;Tibshirani,R。;Friedman,J.H.,《统计学习的要素》(2009),斯普林格·弗拉格出版社·兹比尔1273.62005
[24] Hotelling,H.,两组变量之间的关系,生物统计学,28,321-377(1936)·Zbl 0015.40705号
[25] Kuiper,N.H.,关于圆上随机点的测试,Proc。K.内德.阿卡德。潮湿。,序列号。A、 63、38-47(1960)·Zbl 0096.12504号
[26] 乐村,Y。;博图,L。;Y.本吉奥。;Haffner,P.,《基于梯度的学习应用于文档识别》,Proc。IEEE,86,2278-2324(1998)
[27] 伦德伯格,S。;埃里昂,G。;Lee,S.I.,《树集合的一致个性化特征归因》(2019),1-9
[28] 伦德伯格,S.M。;Lee,S.I.,解释模型预测的统一方法,高级神经信息处理。系统。,2017, 4766-4775 (2017)
[29] Marrel,A。;Charibon,V.,《目标和条件敏感性分析的统计发展:在核反应堆安全研究中的应用》,Reliab。工程系统。安全。,2014年,第107711条pp.(2021)
[30] 默多克·W·J。;Signh,C。;Kumbier,K。;Abbasi-Asl,R。;Yu,B.,可解释机器学习中的定义、方法和应用,Proc。国家。阿卡德。科学。,11622071-22080(2019)·Zbl 1431.62266号
[31] 潘·W。;王,X。;张,H。;朱,H。;Zhu,J.,Ball协方差:巴拿赫空间依赖性的一般度量,美国统计协会,115,307-317(2020)·Zbl 1437.62287号
[32] Pearson,K.,双亲回归和遗传注释,Proc。英国皇家学会。,58, 240-242 (1895)
[33] Pearson,K.,《关于斜相关和非线性回归的一般理论》(《进化论的数学贡献》,伦敦,1905年)
[34] Plischke,E。;博尔戈诺沃,E。;Smith,C.,《给定数据的全球敏感性测量》,欧洲期刊Oper。研究,226536-550(2013)·Zbl 1292.90290号
[35] Renyi,A.,《关于统计相关性的度量》,《数学学报》。阿卡德。科学。洪。,10, 441-451 (1959) ·Zbl 0091.14403号
[36] 里贝罗,M.T。;辛格,S。;Guestrin,C.,“我为什么要相信你?”解释任何分类器的预测,(《知识发现和数据挖掘国际会议论文集》(2016),1135-1144
[37] Rudin,C.,停止解释高风险决策的黑箱机器学习模型,转而使用可解释的模型,Nat.Machi。智力。,1, 206-215 (2019)
[38] Sah,P。;Fokoué,E.,亚洲宗教有什么共同点?无监督文本分析探索(2019),1-34
[39] Saltelli,A.,《充分利用模型估值计算敏感性指数》,计算。物理学。社区。,145, 280-297 (2002) ·Zbl 0998.65065号
[40] Soofi,E.S.,《捕捉信息的无形概念》,《美国法律总汇》,第89卷,第1243-1254页(1994年)·2012年10月8日Zbl
[41] 斯皮尔曼,C.,《两个事物之间关联的证明和测量》,美国心理学杂志。,15, 72-101 (1904)
[42] 斯特朗,M。;Oakley,J.,《计算相关输入的完美信息部分期望值的有效方法》,Med.Decis。制造商。,33, 755-766 (2013)
[43] 斯特朗,M。;奥克利,J.E。;Chilcott,J.,《卫生经济决策模型中的结构不确定性管理:差异方法》,J.R.Stat.Soc.,Ser。C、 61、25-45(2012)
[44] 谢凯利,G.J。;Rizzo,M.L.,布朗距离协方差,Ann.Appl。统计,31236-1265(2009)·Zbl 1196.62077号
[45] 塞克利,G.J。;Rizzo,M.L。;Bakirov,N.K.,《通过距离相关性测量和测试相关性》,《Ann.Stat.》,35,2769-2794(2007)·Zbl 1129.62059号
[46] Taverniers,S。;霍尔,E.J。;Katsoulakis,医学硕士。;Tartakovsky,D.M.,《多尺度系统可解释深度学习的互信息》,J.Compute。物理。,444,第110551条pp.(2021)·Zbl 07515452号
[47] Wiesel,J.C.,《测量与Wasserstein距离的关系》,伯努利,28,2816-2832(2022)·Zbl 07594079号
[48] Xiao,H。;拉苏尔,K。;Vollgraf,R.,Fashion-MNIST:用于基准机器学习算法的新型图像数据集(2017),1-20
[49] 赵(Q.Zhao)。;Hastie,T.,《黑箱模型的因果解释》,J.Bus。经济。统计,39,272-281(2021)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。