×

主成分分析和判别分析中变量选择的模拟退火算法的比较。 (英语) Zbl 1506.62029号

摘要:变量选择是多元统计中一个古老的问题。模拟退火是一种可用于变量选择的多种元启发式算法之一;然而,它的有效性受到算法设计特征的影响,例如初始子集的构造、最高和最低温度、冷却方案以及在现有子集附近生成试验子集的过程。对这些设计特征进行操作,以生成24个版本的模拟退火算法,用于从(m)个候选变量中准确选择(p)个变量。然后在主成分分析和判别分析的背景下对这些版本进行比较。结果表明,设计特征之间存在一些复杂而有趣的交互作用,但这两项研究建立了一些稳健的版本。

MSC公司:

62-08 统计问题的计算方法
62H25个 因子分析和主成分;对应分析
62H30型 分类和区分;聚类分析(统计方面)
第62页,共15页 统计学在心理学中的应用
90 C59 数学规划中的近似方法和启发式
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿尔茨,E。;Korst,J。;Michiels,W.,《模拟退火》(Burke,E.K.;Kendall,G.,《搜索方法学》(2005),纽约施普林格出版社),187-210·Zbl 1140.90015号
[2] 巴拉宾,R.M。;Smirnov,S.V.,《近红外光谱中的变量选择:生物柴油数据特征选择方法的基准测试》,Ana。蜂鸣器。《学报》,69263-72,(2011)
[3] Beale,E.M.L。;Kendall,M.G。;Mann,D.W.,《多元分析中变量的丢弃》,Biometrika,54,357-366,(1967)
[4] Brusco,M.J.,《关于大规模L2一维标度的模拟退火性能》,J.Classification,23,255-268,(2006)·Zbl 1336.62174号
[5] 布鲁斯科,M.J。;Jacobs,L.W.,循环人员调度问题的模拟退火方法,Nav。Res.Logist.公司。,40, 69-84, (1993) ·Zbl 0769.90056号
[6] 布鲁斯科,M.J。;雅各布斯,L.W。;Bongiorno,R.J。;Lyons,D.V。;Tang,B.,《改进航空站人员调度》,Oper。第43741-751号决议,(1995年)·Zbl 0843.90069号
[7] 布鲁斯科,M.J。;雅各布斯,L.W。;汤普森,G.M.,《一种变形程序,用于补充成本和覆盖相关集覆盖问题的模拟退火启发式》,《Ann.Oper》。决议,86,611-627,(1999)·Zbl 0922.90112号
[8] 布鲁斯科,M.J。;Köhn,H.-F.,《通过模拟退火实现基于示例的聚类》,《心理测量学》,74457-475,(2009)·Zbl 1272.62112号
[9] 布鲁斯科,M.J。;辛格,R。;Steinley,D.,《在主成分分析中选择变量子集的可变邻域搜索启发法》,《心理测量学》,74705-726,(2009)·Zbl 1179.62085号
[10] 布鲁斯科,M.J。;Steinley,D.,线性判别分析中变量选择的精确和近似算法,计算。统计师。数据分析。,55, 123-131, (2011) ·Zbl 1247.62153号
[11] 布鲁斯科,M.J。;斯坦利,D。;Cradit,J.D.,二阶多项式回归中层次结构良好子集的精确算法,技术计量学,51,306-315,(2009)
[12] Cadima,J.,Cerdeira,J.O.,Duarte Silva,P.,Minhoto,M.,2012,《子选择R包》,检索自:http://cran.r-project.org/web/packages/subselect/subselect.pdf。
[13] Cadima,J。;Cerdeira,J.O。;Minhoto,M.,《主成分背景下变量选择算法的计算方面》,计算。统计师。数据分析。,47, 225-236, (2004) ·Zbl 1429.62216号
[14] Cadima,J。;Jolliffe,I.T.,《主成分解释中的荷载和相关性》,J.Appl。统计,22,203-214,(1995)
[15] Cadima,J。;Jolliffe,I.T.,变量选择和主子空间的解释,J.Agric。生物与环境。《法律总汇》,6,62-79,(2001)
[16] Cerny,V.,《旅行推销员问题的热力学方法》,J.Optim。理论应用。,45,41-51,(1985年)·Zbl 0534.90091号
[17] Ceulemans,E。;Van Mechelen,I.,CLASSI:研究序列过程及其个体差异的分类模型,Psycholometrika,73107-124,(2008)·Zbl 1143.62092号
[18] Ceulemans,E。;Van Mechelen,I。;Leenen,I.,《分层类分析中的局部极小问题:模拟退火算法和各种多阶段程序的评估》,《心理测量学》,72,377-391,(2007)·Zbl 1286.62102号
[19] Chiyoshi,F。;Galváo,D.,《应用于(p)-中值问题的模拟退火统计分析》,《Ann.Oper》。决议,96,61-74,(2000)·Zbl 0997.90042号
[20] Dray,S.,《关于主成分的数量:基于矩阵之间相似性度量的维度测试》,计算。统计师。数据分析。,52, 2228-2237, (2008) ·Zbl 1452.62409号
[21] Drezner,Z。;马库利德斯,G.A.,《在多元回归分析中使用模拟退火进行选择》。线性回归视图。,25, 1-4, (1999)
[22] Duarte Silva,A.P.,多元分析的有效变量筛选,《多元分析杂志》。,76, 35-62, (2001) ·Zbl 0996.62063号
[23] Duarte Silva,A.P.,《丢弃主成分分析中的变量:所有子集比较的算法》,计算。统计人员。,17, 251-271, (2002) ·Zbl 1010.62052号
[24] Efroymson,M.A.,多元回归分析,(Ralston,A.;Wilf,H.S.,《数字计算机数学方法》,(1960),威利纽约),191-203·Zbl 0089.12602号
[25] Fisher,R.A.,《多重测量在分类问题中的应用》,《优生学年鉴》,第7期,第179-188页,(1936年)
[26] Fisher,R.A.,《多重测量的统计利用》,《优生学年鉴》,8,376-386,(1938)·Zbl 0019.35703号
[27] Fouskakis,D。;Draper,D.,《比较二元结果预测中变量选择的随机优化方法及其在卫生政策中的应用》,J.Amer。统计师。协会,103,1367-1381,(2008)·Zbl 1286.62065号
[28] Furnival,G.M。;Wilson,R.W.,《跨越式回归》,《技术计量学》,第16期,第499-512页,(1974年)·Zbl 0294.62079号
[29] Ganeshanandam,S。;Krzanowski,W.J.,《关于在线性判别分析中选择变量并评估其性能》,奥斯汀。《美国法律总汇》第31卷,第433-447页,(1989年)·Zbl 0707.62120号
[30] 加图,C。;Kontoghiorghes,E.J.,计算最佳子集回归模型的分枝定界算法,J.Comput。图表。统计人员。,15, 139-156, (2006)
[31] 加图,C。;Yanev,P。;Kontoghiorghes,E.J.,生成所有可能子集回归子模型的图形方法,计算。统计师。数据分析。,52, 799-815, (2007) ·Zbl 1452.62061号
[32] 手套,F。;Laguna,M.,Tabu search,(Reeves,C.,《组合问题的现代启发式技术》,(1993),Blackwell Oxford出版社),70-141·Zbl 0942.90500
[33] Goldberg,D.E.,《搜索、优化和机器学习中的遗传算法》,(1989),Addison-Wesley New York·Zbl 0721.68056号
[34] 哈贝马,J.D.F。;Hermans,J.,通过统计和错误率在判别分析中选择变量,技术计量学,19487-493,(1977)·Zbl 0369.62002号
[35] 霍夫曼,M。;加图,C。;Kontoghiorghes,E.J.,计算大规模问题最佳子集回归模型的高效算法,计算。统计师。数据分析。,52, 16-29, (2007) ·Zbl 1452.62497号
[36] 霍加蒂,K.Y。;Kromrey,J.D。;Ferron,J.M。;Hines,C.V.,探索性因素分析中变量的选择:逐步和传统方法的实证比较,《心理测量学》,69,593-611,(2004)·Zbl 1306.62428号
[37] 霍顿,I.F。;罗素·J·S。;Moore,A.W.,《多元协方差和规范分析:在多元情况下选择最有效判别器的方法》,《生物计量学》,24845-858,(1968)
[38] Huberty,C.J.,《判别分析的使用和解释问题》,《心理学》。公牛。,95, 156-171, (1984)
[39] Jolliffe,I.T.,主成分分析,(2002),Springer New York·Zbl 1011.62064号
[40] Jolliffe,I.T.,《在主成分分析中丢弃变量》,I:人工数据,应用。Stat.,21,160-173,(1972)
[41] Jolliffe,I.T.,在主成分分析中丢弃变量,II:实际数据,Appl。《统计》,第22卷,第21-31页,(1973年)
[42] 卡诺,Y。;Harada,A.,因子分析中的逐步变量选择,《心理测量学》,65,7-22,(2000)·兹比尔1291.62219
[43] 柯克帕特里克,S。;盖拉特,C.D。;Vecchi,M.P.,《模拟退火优化》,《科学》,220671-680,(1983)·兹比尔1225.90162
[44] Krzanowski,W.J.,《使用主成分保存多元数据结构的变量选择》,Appl。Stat.,36,22-33,(1987)
[45] Krzanowski,W.J。;Hand,D.J.,微阵列数据聚类前筛选变量的简单方法,计算。统计师。数据分析。,53, 2747-2753, (2009) ·Zbl 1453.62127号
[46] Lee,J.-S。;帕克,C.H。;易卜拉希米,T.,《混合模拟退火的理论与应用》(Zelinka,I.;Snasel,V.;Abraham,A.,《优化手册:从经典到现代方法》,(2012),柏林施普林格出版社),395-422
[47] 使用MATLAB(第7版),(2005),The MathWorks,Inc Natick,MA
[48] McCabe,G.P.,主要变量,技术计量学,26,137-144,(1984)·Zbl 0548.62037号
[49] McCabe,G.P.,判别分析中变量选择的计算,技术计量学,17,103-109,(1975)·Zbl 0295.62068号
[50] McHenry,C.E.,选择最佳子集的有效计算程序,应用。Stat.,27,291-296,(1978)·Zbl 0436.62057号
[51] McKay,R.J。;坎贝尔,N.A.,《判别分析中的变量选择技术:I.描述》,英国数学杂志。统计师。心理学,35,1-29,(1982)·Zbl 0491.62048号
[52] McKay,R.J。;坎贝尔,N.A.,《判别分析中的变量选择技术:II。分配,英国数学杂志。统计师。心理学,35,30-41,(1982)·Zbl 0491.62049号
[53] McLachlan,G.J.,选择线性判别函数变量的标准,生物统计学,32,529-534,(1976)·Zbl 0334.62023号
[54] 北卡罗来纳州大都会。;罗森布鲁斯,A。;罗森布鲁斯,M。;出纳员,A。;Teller,E.,快速计算机器的状态方程计算,J.Chem。物理。,211087-1092,(1953年)·Zbl 1431.65006号
[55] Mladenović,N。;Hansen,P.,可变邻域搜索,计算机。操作。Res.,241097-1100,(1997年)·Zbl 0889.90119号
[56] Mori,Y。;Iizuka,M。;塔鲁米,T。;Tanaka,Y.,《主成分分析中的变量选择》,(Härdle,W.;Mori,Y.;Vieu,P.,《生物统计及相关领域的统计方法》,(2007),柏林施普林格出版社),265-284
[57] Murillo,A。;维拉,J.-F。;Heiser,W.J.,《(L_1)和(L_2)一维标度的置换-平移模拟退火算法》,J.分类,22,119-138,(2005)·Zbl 1084.62055号
[58] Murray,G.D.,《判别分析中变量选择的警示说明》,应用。《统计》,第26卷,第246-250页,(1977年)
[59] 努拉尼,Y。;Andresen,B.,《模拟退火冷却策略的比较》,J.Phys。A: 数学Gen.,318373-8385,(1998)·Zbl 0962.82068号
[60] ?rkcü,H.H.,多元线性回归模型中的子集选择:遗传和模拟退火算法的混合,应用。数学。计算。,219, 11018-11028, (2013) ·Zbl 1302.62159号
[61] 帕切科,J。;卡萨多,S。;Nunez,L.,基于逻辑回归模型禁忌搜索的变量选择方法,欧洲期刊Oper。研究,199,506-511,(2009)·Zbl 1176.90268号
[62] 帕切科,J。;卡萨多,S。;努内兹,L。;Gomez,O.,《判别分析中新变量选择方法的分析》,计算。统计师。数据分析。,51, 1463-1478, (2006) ·Zbl 1157.62442号
[63] 帕切科,J。;卡萨多,S。;Porras,S.,《主成分分析中变量选择的精确方法:指导函数和预选》,计算。统计师。数据分析。,57, 95-111, (2013) ·Zbl 1365.62224号
[64] 彭达尔卡,P。;Nanda,S.,错误分类成本最小化进化神经分类方法,Nav。Res.Logist.公司。,53432-447(2006年)·Zbl 1127.62088号
[65] J.O.拉姆齐。;ten Berge,医学博士。;Styan,G.P.H.,矩阵相关性,《心理测量学》,49,403-423,(1984)·Zbl 0581.62048号
[66] 罗伯特,P。;Escoufier,Y.,线性多元统计方法的统一工具,应用。Stat.,25,257-265,(1976)
[67] 罗伊,J.,多元统计中的逐步下降过程,《数学年鉴》。Stat.,29,177-187,(1958)
[68] 希曼,S.L。;Young,D.M.,用于分配判别分析的非参数变量选择算法,教育。精神病。测量。,50, 837-841, (1990)
[69] Snappin,S.N。;Knoke,J.D.,用变量选择进行判别分析时的错误率估计,生物计量学,45289-299,(1989)·Zbl 0715.62116号
[70] Swierenga,H。;de Groot,P.J。;de Weijer,A.P。;Derksen,M.W.J。;Buydens,L.M.C.,通过稳健波长改进PLS模型可传递性,化学计量学。智力。实验室系统。,41, 237-248, (1998)
[71] 田中,Y。;Mori,Y.,基于变量子集的主成分分析:变量选择和敏感性分析,Amer。数学杂志。管理科学。,17, 61-89, (1997) ·Zbl 1007.62517号
[72] 新墨西哥州特伦达菲洛夫。;Jolliffe,I.T.,DALASS:通过套索进行判别分析的变量选择,计算。统计师。数据分析。,51, 3718-3736, (2007) ·Zbl 1161.62379号
[73] Urbakh,V.Y.,《线性判别分析:忽略变量时识别能力的丧失》,《生物计量学》,27531-534,(1971)
[74] Vande Gaer,E。;Ceulemans,E。;Van Mechelen,I。;Kuppens,P.,《研究连续过程的CLASSI-N方法》,《心理测量学》,77,85-105,(2012)·Zbl 1284.62756号
[75] van Rosmalen,J。;格罗南,P.J.F。;Trejos,J。;Castillo,W.,双模分区的优化策略,分类,26155-181,(2009)·Zbl 1337.62145号
[76] 维拉,J.-F。;海斯,W.J。;Murillo,A.,《任何Minkowski度量的全局优化:多维缩放的置换转换模拟退火算法》,J.Classification,24,277-301,(2007)·Zbl 1159.91469号
[77] 韦纳,J.M。;Dunn,O.J.,消除线性歧视问题中的变量,生物计量学,22268-275,(1966)
[78] 伍德,M。;麻省理工学院Jolliffe。;Horgan,G.W.,《使用矩阵相关性对鱼类声音进行判别分析的变量选择》,J.Agric。生物与环境。统计,10,1-16,(2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。