×

高维数据的可解释近似。 (英语) Zbl 1476.65023号

总结:在本文中,我们应用了之前介绍的近似方法[作者SIAM J.Numer.Anal.59,No.5,2393–2429(2021;Zbl 1476.65022号); J.计算。申请。数学。403,文章ID 113821,19 p.(2022;Zbl 1476.65024号)]基于对合成数据和实际数据的方差分析(ANOVA)分解和分组变换。这种方法的优点是近似的可解释性,即对属性相互作用或变量耦合的重要性进行排序的能力。此外,我们能够生成一个属性排序,以识别不重要的变量并降低问题的维数。我们将该方法与公开可用基准数据集上的其他方法进行了比较。

MSC公司:

65日第15天 函数逼近算法
41A55型 近似正交
41A63型 多维问题
42B05型 傅里叶级数和多变量系数
62J10型 方差和协方差分析(ANOVA)
65吨40 三角逼近和插值的数值方法
65T50型 离散和快速傅里叶变换的数值方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] C.C.Aggarwal,ed.,《数据分类:算法和应用》,CRC出版社,佛罗里达州博卡拉顿,2015年·Zbl 1297.68009号
[2] F.Bartel、D.Potts和M.Schmischke,高维可解释方差分析近似中的分组变换,预印本,https://arxiv.org/abs/2010.10199, 2020.
[3] F.Bartel和M.Schmischke,ANOVA约为Julia包,https://github.com/NFFT/ANOVApprox网站/, 2020.
[4] G.Beylkin、J.Garcke和M.Mohlenkamp,多元回归和可分离函数和的机器学习,SIAM J.Sci。计算。,31(2009),第1840-1857页,https://doi.org/10.1137/070710524。 ·兹比尔1190.62135
[5] P.Binev、W.Dahmen和P.Lamby,稀疏占用树的快速高维近似,J.Compute。申请。数学。,235(2011),第2063-2076页,https://doi.org/10.1016/j.cam.2010.10.005。 ·Zbl 1209.65018号
[6] C.M.Bishop,模式识别和机器学习,Springer,纽约,2006年·Zbl 1107.68072号
[7] R.Caflisch、W.Morokoff和A.Owen,《使用布朗桥降低有效维数的抵押贷款支持证券估值》,J.Comput。《金融》,第1期(1997年),第27-46页,https://doi.org/10.21314/jcf.1997.005。
[8] R.Chitta、R.Jin和A.K.Jain,使用随机傅里叶特征的高效内核聚类,第12届IEEE数据挖掘国际会议论文集,IEEE,华盛顿特区,2012年,第161-170页,https://doi.org/10.109/icdm.2012.61。
[9] P.G.Constantine、E.Dow和Q.Wang,理论和实践中的主动子空间方法:在克里格曲面上的应用,SIAM J.Sci。计算。,36(2014),第A1500-A1524页,https://doi.org/10.1137/10916138。 ·Zbl 1464.62049号
[10] P.G.Constantine、A.Eftekhari、J.Hokanson和R.A.Ward,脊近似的近稳态子空间,计算。方法应用。机械。工程,326(2017),第402-421页,https://doi.org/10.1016/j.cma.2017.07.038。 ·Zbl 1439.65023号
[11] R.DeVore、G.Petrova和P.Wojtaszczyk,高维少变量函数的近似,Constr。约,33(2010),第125-143页,https://doi.org/10.1007/s00365-010-9105-8。 ·兹比尔1210.41009
[12] D.Dua和C.Graff,UCI机器学习知识库,2017年,http://archive.ics.uci.edu/ml。
[13] M.Fornasier、K.Schnass和J.Vybiral,《高维少数任意线性参数的学习函数》,Found。计算。数学。,12(2012),第229-262页,https://doi.org/10.1007/s10208-012-9115-y。 ·Zbl 1252.65036号
[14] M.Goyal、M.Pandey和R.Thakur,《机器学习技术预测建筑能效的探索性分析》,载于《第八届可靠性、信息通信技术和优化(趋势和未来方向)国际会议论文集》(ICRITO),IEEE,华盛顿特区,2020年,第1033-1037页,https://doi.org/10.109/icrito48877.2020.9197976。
[15] I.G.Graham、F.Y.Kuo、J.A.Nichols、R.Scheichl、C.Schwab和I.H.Sloan,对数正态随机系数椭圆偏微分方程的拟蒙特卡罗有限元方法,数值。数学。,131(2014),第329-368页,https://doi.org/10.1007/s00211-014-0689-y。 ·Zbl 1341.65003号
[16] I.G.Graham、F.Y.Kuo、D.Nuyens、R.Scheichl和I.H.Sloan,用QMC嵌入循环:对数正态系数椭圆偏微分方程的分析,数值。数学。,140(2018),第479-511页,https://doi.org/10.1007/s00211-018-0968-0。 ·Zbl 1417.65203号
[17] C.Gu,《平滑样条方差分析模型》,第二版,施普林格出版社,纽约,2013年,https://doi.org/10.1007/978-1-4614-5369-7。 ·Zbl 1269.62040号
[18] I.Guyon和A.Elisseeff,变量和特征选择简介,J.Mach。学习。研究,3(2003),1157–1182·Zbl 1102.68556号
[19] A.Hashemi、H.Schaeffer、R.Shi、U.Topcu、G.Tran和R.Ward,稀疏随机特征扩展的广义界,预印本,https://arxiv.org/abs/20103.03191, 2021.
[20] T.Hastie、R.Tibshirani和J.Friedman,《统计学习的要素:数据挖掘、推断和预测》,第二版,纽约斯普林格出版社,2009年·Zbl 1273.62005年
[21] M.Holtz,《高维稀疏网格求积及其在金融和保险中的应用》,Lect。注释计算。科学。工程77,Springer-Verlag,柏林,2011年,https://doi.org/10.1007/978-3-642-16004-2。 ·Zbl 1221.65080号
[22] J.Keiner、S.Kunis和D.Potts,使用NFFT 3-a软件库进行各种非等间距快速傅立叶变换,ACM Trans。数学。软件,36(2009),19,https://doi.org/10.1145/1555386.1555388。 ·Zbl 1364.65303号
[23] Y.Kokkinos和K.G.Margaritis,回归任务的多线程局部学习正则化神经网络,《神经网络的工程应用》,Springer,Cham,2015年,第129-138页,https://doi.org/10.1007/978-3-319-23983-5_13。
[24] A.Kraskov、H.Sto¨gbauer和P.Grassberger,《估计相互信息》,《物理学》。E版,69(2004),066138,https://doi.org/10.103/physreve.69.066138。
[25] F.Y.Kuo和D.Nuyens,拟蒙特卡罗方法在具有随机扩散系数的椭圆偏微分方程中的应用:分析和实现综述,Found。计算。《数学》,16(2016),第1631-1696页,https://doi.org/10.1007/s10208-016-9329-5。 ·Zbl 1362.65015号
[26] F.Y.Kuo、C.Schwab和I.H.Sloan,一类随机系数椭圆偏微分方程的拟蒙特卡罗有限元方法,SIAM J.Numer。分析。,50(2012),第3351-3374页,https://doi.org/10.1137/10845537。 ·Zbl 1271.65017号
[27] F.Y.Kuo、I.H.Sloan、G.W.Wasilkowski和H.Wozíniakowski,《多元函数分解》,数学。公司。,79(2010),第953-966页,https://doi.org/10.1090/s0025-5718-09-02319-9。 ·Zbl 1196.41022号
[28] Z.Li、J.-F.Ton、D.Oglic和D.Sejdinovic,《走向随机傅里叶特征的统一分析》,载《第36届国际机器学习会议论文集》,K.Chaudhuri和R.Salakhutdinov编辑,《机器学习研究论文集》97,PMLR,2019年,第3905-3914页,http://proceedings.mlr.press/v97/li19k.html。 ·Zbl 07370625号
[29] R.Liu和A.B.Owen,估计方差分解分析的平均维数,J.Amer。统计师。协会,101(2006),第712-721页,https://doi.org/10.1198/0162145000001410。 ·Zbl 1119.62343号
[30] D.Meyer、F.Leisch和K.Hornik,测试中的支持向量机,神经计算,55(2003),第169-186页,https://doi.org/10.1016/S0925-2312(03)00431-4.
[31] M.Moeller和T.Ullrich\({五十} _2\)-范数抽样离散化和从有限迹RKHS中恢复函数,Sampl。理论信号处理。数据分析。,19 (2021), 13, https://doi.org/10.1007/s43670-021-00013-3。 ·兹比尔1506.41015
[32] G.Montavon、W.Samek和K.-R.Muöller,解释和理解深层神经网络的方法,数字信号处理。,73(2018),第1-15页,https://doi.org/10.1016/j.dsp.2017.10.101。
[33] A.Owen,具有主要混合偏导数的加权前Sobolev空间的有效维数,SIAM J.Numer。分析。,57(2019),第547-562页,https://doi.org/10.1137/17m1158975。 ·Zbl 1412.41027号
[34] C.C.Paige和M.A.Saunders,LSQR:稀疏线性方程组和稀疏最小二乘的算法,ACM Trans。数学。《软件》,8(1982),第43-71页,https://doi.org/10.1145/355984.355989。 ·Zbl 0478.65016号
[35] F.Pedregosa、G.Varoqueaux、A.Gramfort、V.Michel、B.Thirion、O.Grisel、M.Blondel、P.Prettenhofer、R.Weiss、V.Dubourg、J.Vanderplas、A.Passos、D.Cournapeau、M.Brucher、M.Perrot和E.Duchesnay,《Scikit-learn:Python中的机器学习》,J.Mach。学习。Res.,12(2011),第2825-2830页·Zbl 1280.68189号
[36] G.Plonka、D.Potts、G.Steidl和M.Tasche,《数值傅里叶分析》,应用。数字。哈蒙。分析。,Birkha¨user,Cham,2018年,https://doi.org/10.1007/978-3-030-04306-3。 ·兹比尔1412.65001
[37] D.Potts和M.Schmischke,用基于傅立叶的方法逼近高维周期函数,SIAM J.Numer。分析。,59(2021),第2393-2429页,https://arxiv.org/abs/1907.11412。 ·Zbl 1476.65022号
[38] D.Potts和M.Schmischke,使用多项式基学习低维结构的多元函数,预印本,https://arxiv.org/abs/1912.03195, 2019. ·Zbl 1476.65024号
[39] H.Rabitz和O.F.Alis,高维模型表示的一般基础,J.Math。化学。,25(1999),第197-233页,https://doi.org/10.1023/A:1019188517934。 ·Zbl 0957.93004号
[40] A.Rahimi和B.Recht,大型内核机器的随机特征,《神经信息处理系统进展》,第20卷,J.Platt、D.Koller、Y.Singer和S.Roweis编辑,Curran Associates,Red Hook,NY,2008年,https://proceedings.neurips.cc/paper/2007/file/013a006f03dbc5392effeb8f18fda755-paper.pdf。
[41] B.C.Ross,离散和连续数据集之间的相互信息,《公共科学图书馆·综合》,9(2014),e87357,https://doi.org/10.1371/journal.pone.0087357。
[42] A.Saltelli、M.Ratto、T.Andres、F.Campolongo、J.Cariboni、D.Gatelli、M.Saisana和S.Tarantola,《全球敏感性分析:初级读本》,英国奇切斯特John Wiley&Sons出版社,2008年·Zbl 1161.00304号
[43] W.Samek、T.Wiegand和K.-R.Muöller,《可解释的人工智能:理解、可视化和解释深度学习模型》,预印本,https://arxiv.org/abs/1708.08296, 2017.
[44] M.Schmischke,ANOVA近似数值实验,https://github.com/NFFT/AttributeRanking示例, 2021.
[45] I.M.Sobol,《关于非线性数学模型的灵敏度估计》,Matem。国防部。,2(1990),第112-118页·Zbl 0974.00506号
[46] I.M.Sobol’,非线性数学模型的全局敏感性指数及其蒙特卡罗估计,数学。计算。模拟。,55(2001),第271-280页,https://doi.org/10.1016/s0378-4754(00)00270-6. ·Zbl 1005.65004号
[47] L.Torgo,回归数据集,https://www.dcc.fc.up.pt/ltorgo/Regression/DataSets.html·Zbl 1032.62065号
[48] J.A.Tropp,《发现随机矩阵和的用户友好尾部界限》。计算。数学。,12(2011),第389-434页,https://doi.org/10.1007/s10208-011-9099-z。 ·Zbl 1259.60008号
[49] C.F.J.Wu和M.S.Hamada,《实验:规划、分析和优化》,John Wiley&Sons,纽约,2011年·Zbl 1460.62003年
[50] T.Yang,Y.-F.Li,M.Mahdavi,R.Jin,Z.-H.Zhou,Nystrom方法与随机傅里叶特征:理论和实证比较,摘自《第25届神经信息处理系统国际会议论文集》(NIPS’12),第1卷,Curran Associates,Red Hook,NY,2012年,第476-484页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。