×

机器学习回归的数据驱动多项式混沌展开。 (英语) Zbl 1453.62565号

总结:我们提出了一种基于多项式混沌展开(PCE)的数据驱动问题回归技术。PCE是不确定性量化(UQ)领域中的一种流行技术,它通常用于用廉价的多项式函数替换受随机输入影响的可运行但昂贵的计算模型。获得的元模型能够可靠地估计输出的统计数据,前提是输入的适当概率模型可用。机器学习(ML)回归是一个研究领域,专注于提供纯数据驱动的输入-输出图,重点是逐点预测准确性。我们表明,纯基于数据训练的PCE元模型可以生成逐点预测,其精度与其他ML回归模型(如神经网络和支持向量机)相当。对文献中的基准数据集进行了比较。该方法还能够量化输出不确定性,并对噪声具有鲁棒性。此外,它还具有其他所需的特性,例如对于较小的训练集具有良好的性能,并且构造简单,只需要很少的参数调整。

MSC公司:

62J02型 一般非线性回归
62小时05 多元概率分布的表征与结构理论;连接线
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aas,K.,《金融应用的双copula构造:综述》,《计量经济学》,4,4,43(2016)
[2] Aas,K。;Czado,C。;弗里吉斯,A。;Bakkend,H.,多重依赖的对copula结构,Insur。数学。经济。,44, 2, 182-198 (2009) ·Zbl 1165.60009号
[3] Applegate,D.L。;比克斯比,R.E。;查塔尔,V。;库克,W.J.,《旅行推销员问题:一项计算研究》(2006年),普林斯顿大学出版社:普林斯顿大学新泽西出版社·Zbl 1130.90036号
[4] 贝德福德,T。;Cooke,R.M.,Vines–相依随机变量的新图形模型,Ann.Stat.,30,4,1031-1068(2002)·Zbl 1101.62339号
[5] Bishop,C.,模式识别和机器学习(2009),Springer
[6] 布拉特曼,G。;Sudret,B.,基于最小角度回归的自适应稀疏多项式混沌展开,J.Compute。物理。,230, 2345-2367 (2011) ·Zbl 1210.65019号
[7] Can,A.,《特征房价模型的规范和估算》,Reg.Sci。城市经济。,22, 3, 453-474 (1992)
[8] Chan,S。;Elsheikh,A.H.,《使用多尺度方法进行有效不确定性量化的机器学习方法》,J.Compute。物理。,354, 493-511 (2018) ·Zbl 1380.65331号
[9] 克莱森,M。;Moor,B.D.,机器学习中的超参数搜索(2015),arXiv
[10] 科尔特斯,P。;Cerdeira,A。;阿尔梅达,F。;马托斯,T。;Reis,J.,通过物理化学特性数据挖掘建模葡萄酒偏好,Decis。支持系统。,47, 547-553 (2009)
[11] Czado,C.,多元Copula的对Copula构造,93-109(2010),施普林格-柏林-海德堡:施普林格
[12] 迪·曼,J。;Brechmann,E.C。;Czado,C。;Kurowicka,D.,《选择和估算规则藤蔓交配及其在财务回报中的应用》,计算。统计数据分析。,59, 52-69 (2013) ·Zbl 1400.62114号
[13] 埃夫隆,B。;哈斯蒂,T。;约翰斯通,I。;Tibshirani,R.,《最小角度回归》,《Ann.Stat.》,32,407-499(2004)·Zbl 1091.62054号
[14] M.Eldred,C.Webster,P.Constantine,Wiener-Askey广义多项式混沌的非侵入方法评估,AIAA 2008-1892,462008。;M.Eldred,C.Webster,P.Constantine,Wiener-Askey广义多项式混沌的非侵入方法评估,AIAA 2008-1892,462008。
[15] Ernst,O.G。;马格勒,A。;Starkloff,H.-J。;Ullmann,E.,关于广义多项式混沌展开式的收敛性,ESAIM:M2AN,46,2,317-339(2012)·Zbl 1273.65012号
[16] 福尔曼,G。;Cohen,I.,《从小事中学习:很少接受训练的分类器的比较》(Boulicaut,J.-F.;Esposito,F.;Giannotti,F.和Pedreschi,D.,《数据库中的知识发现:PKDD 2004》(2004),斯普林格·柏林-海德堡:斯普林格尔·柏林-海德堡-柏林,海德堡),161-172
[17] Gautschi,W.,《关于生成正交多项式》,SIAM J.Sci。统计计算。,3, 3, 289-317 (1982) ·Zbl 0482.65011号
[18] Genest,C。;Nešlehová,J.,计数数据的连接线引物,ASTIN Bull。,37, 475-515 (2007) ·Zbl 1274.62398号
[19] 加尼姆,R。;Spanos,P.-D.,随机有限元中的多项式混沌,J.Appl。机械。,57, 197-202 (1990) ·Zbl 0729.73290号
[20] 吉利,O.W。;Pace,R.K.,用不等式限制估计改进特征估计,Rev.Econ。Stat.,77,4,609-621(1995)
[21] 哈夫,I.H。;Aas,K。;Frigessi,A.,《关于简化的对连接词结构——简单有用还是过于简单?》?,J.多变量。分析。,101, 1296-1310 (2010) ·Zbl 1184.62079号
[22] 哈里森,D。;Rubinfeld,D.L.,《Hedonic房价与清洁空气需求》,J.Environ。经济。管理。,5,81-102(1978年)·Zbl 0375.90023号
[23] Ishigami,T。;Homma,T.,《计算机模型不确定性分析中的一种重要量化技术》,(ISUMA'90年,《第一国际交响乐团学模型》(1990年),马里兰大学),398-403
[24] Joe,H.,具有给定边距和(m(m-1)/2)二元依赖参数的(m)-变量分布族,(Rüschendorf,L.;Schweizer,B.;Taylor,m.D.,《带固定边距的分布及相关主题》,《带定边距的分布及其相关主题》(distributions with Fixed Marginals and Related Topics),讲义-专题丛书,第28卷(1996),数学统计研究所),120-141
[25] (Joe,H.,《用Copulas进行依赖建模》(2015),CRC出版社)·Zbl 1346.62001号
[26] Kandasamy,K。;Yu,Y.,通过SALSA的高维非参数回归中的加性近似,48,69-78(2016)
[27] Kasiviswanathan,K.S。;Sudheer,K.P。;He,J.,《人工神经网络模型中预测不确定性的量化》,145-159(2016),Springer International Publishing:Springer国际出版公司Cham
[28] Kirk,J.,《旅行推销员问题——遗传算法》(2014)
[29] Kurowicka,D。;Cooke,R.M.,《无分布连续贝叶斯信念网》,(Wilson,A.;Limnios,N.;Keller-McNulty,S.;Armijo,Y.,《可靠性的现代统计和数学方法》(2005),世界科学出版社),309-322,第10章·Zbl 1083.62054号
[30] Kurz,M.,Vine copulas与matlab(2015)
[31] 勒布伦,R。;Dutfoy,A.,Rosenblatt和Nataf等概率变换真的不同吗?,普罗巴伯。工程机械。,24, 577-584 (2009)
[32] Lichman,M.,UCI机器学习库(2013)
[33] 曼奇,L。;胡克,G.,《通过置信区间和假设检验量化随机森林中的不确定性》,J.Mach。学习。决议,17,1-41(2016)·兹比尔1360.62095
[34] 莫拉莱斯·纳波尔斯(Morales-Nápoles,O.),《计算藤蔓》(Counting vines),(库洛威克卡(Kurowicka,D.);乔(Joe,H.),《依赖建模:藤蔓Copula手册》(2011),世界科学出版社,189-218,第9章)
[35] 米勒,D。;Czado,C.,《用拉索选择高维稀疏藤蔓结合部》,统计计算。,1-19 (2018)
[36] 纳瓦罗,M。;Witteveen,J。;Blom,J.,带相关变量的一般多元分布的多项式混沌展开(2014),arXiv
[37] Nelsen,R.,《Copulas简介》,《统计学中的Springer系列》(2006年),Springer-Verlag:Springer-Verlag纽约·Zbl 1152.62030
[38] Oladyshkin,S。;Nowak,W.,使用任意多项式混沌展开的数据驱动的不确定性量化,Reliab。工程系统。安全。,106, 179-190 (2012)
[39] Oladyshkin,S。;Nowak,W.,不完整的统计信息限制了高阶多项式混沌展开式的效用,Reliab。工程系统。安全。,169, 137-148 (2018)
[40] Panagiotelis,A。;Czado,C。;Joe,H.,《多元离散数据的配对copula构造》,美国统计协会,107,1063-1072(2012)·Zbl 1395.62114号
[41] Panagiotelis,A。;Czado,C。;Joe,H。;Stöber,J.,离散正则藤连接的模型选择,计算。统计数据分析。,106, 138-152 (2017) ·Zbl 1466.62171号
[42] Parzen,E.,《关于概率密度函数和模式的估计》,《数学年鉴》。Stat.,33,3,1065-1076(1962)·Zbl 0116.11302号
[43] Paulson,J.A。;Buehler,E.A。;Mesbah,A.,动态系统中相关随机变量不确定性传播的任意多项式混沌,IFAC-PapersOnLine,50,1,3548-3553(2018)
[44] 普格,B。;Poirion,F。;Soize,C.,使用Hermite多项式展开的非高斯模拟:收敛性,Probab。工程机械。,17, 253-264 (2002)
[45] Quinlan,J.R.,结合基于实例和基于模型的学习,(第十届国际机器学习会议论文集(1993)),236-243
[46] 凯利·佩斯,R。;Gilley,O.W.,利用数据的空间配置来改进估计,J.房地产金融经济学。,14, 3, 333-340 (1997)
[47] Rosenblatt,M.,《关于多元变换的评论》,《数学年鉴》。统计,23,470-472(1952)·Zbl 0047.13104号
[48] Rosenblatt,M.,《关于密度函数的一些非参数估计的评论》,《数学年鉴》。Stat.,27,3,832-837(1956年)·Zbl 0073.14602号
[49] (Saltelli,A.;Chan,K.;Scott,E.,敏感性分析(2000),J.Wiley&Sons)·Zbl 0961.62091号
[50] Schepsmeier,U.,《带固定边际的藤系模型基于信息的有效有效性检验》,J.Multivar。分析。,138(C),34-52(2015)·Zbl 1328.62355号
[51] Schölkopf,B。;Smola,A.,《用内核学习》(2002),麻省理工学院出版社
[52] Sklar,A.,《(n)维与勒尔市场划分函数》,Publ。巴黎国立大学,8229-231(1959)·Zbl 0100.14202号
[53] 斯诺克,J。;拉罗谢尔,H。;Adams,R.P.,机器学习算法的实用贝叶斯优化,(第25届神经信息处理系统国际会议论文集,第2卷)。《第25届神经信息处理系统国际会议论文集》,第2卷,NIPS’12,美国(2012),Curran Associates Inc.,2951-2959
[54] Sobol’,I.,非线性数学模型的灵敏度估计,数学。模型。计算。实验,1407-414(1993)·Zbl 1039.65505号
[55] Sobol’,I.M.,《关于立方体中点的分布和积分的近似计算》,苏联计算机。数学。数学。物理。,7, 4, 86-112 (1967) ·Zbl 0185.41103号
[56] Soize,C。;Ghanem,R.,《具有随机不确定性的物理系统:具有任意概率测度的混沌表示》,SIAM J.Sci。计算。,26, 2, 395-410 (2004) ·Zbl 1075.60084号
[57] Stöber,J。;乔,H。;Czado,C.,《简化的双copula构造-限制和扩展》,J.Multivar。分析。,119, 101-118 (2013) ·兹比尔1277.62139
[58] Stuart,A。;Ord,K.,Kendall的高级统计理论第1卷-分布理论(1994),Arnold·Zbl 0880.62012号
[59] Sudret,B.,使用多项式混沌展开的全局灵敏度分析,Reliab。工程系统。安全。,93, 964-979 (2008)
[60] 苏德雷特,B。;马雷利,S。;Lataniotis,C.,作为机器学习回归技术的稀疏多项式混沌展开,(大数据和预测计算建模国际研讨会(2015)),受邀演讲
[61] Tibshirani,R.,《通过LASSO回归收缩和选择》,J.R.Stat.Soc.,58,1,267-288(1996)·Zbl 0850.62538号
[62] 托多尔,R.-A。;Schwab,C.,随机系数椭圆问题稀疏混沌近似的收敛速度,IMA J.Numer。分析。,27, 232-261 (2007) ·Zbl 1120.65004号
[63] 托瑞,E。;马雷利,S。;Embrechts,P。;Sudret,B.,《使用藤蔓连接函数在复杂输入依赖下进行数据驱动不确定性量化的一般框架》,Probab。工程机械。,55, 1-16 (2019)
[64] Tüfekci,P.,使用机器学习方法预测基本负荷运行联合循环发电厂的满载电力输出,国际电工杂志。电力能源系统。,60, 126-140 (2014)
[65] Vapnik,V.,《统计学习理论的本质》(1995),Springer-Verlag:Springer-Verlag纽约·Zbl 0833.62008号
[66] 万,X。;Karniadakis,G.E.,《超越Wiener-Askey扩展:处理任意PDF》,科学杂志。计算。,27, 455-464 (2006) ·Zbl 1102.65006号
[67] Wei,Z。;Kim,D。;Conlon,E.M.,大数据copula参数估计的并行计算:模拟研究(2016),arXiv
[68] Wiener,N.,《齐次混沌》,美国数学杂志。,60, 897-936 (1938)
[69] Witten,I.H。;弗兰克,E。;霍尔,医学硕士。;Pal,C.J.,《数据挖掘》,第四版:实用机器学习工具和技术(2016年),摩根·考夫曼出版社:摩根·考夫曼出版社,美国加利福尼亚州旧金山
[70] 秀,D。;Karniadakis,G.,随机微分方程的Wiener-Askey多项式混沌,SIAM J.Sci。计算。,24, 2, 619-644 (2002) ·Zbl 1014.65004号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。