×

高维相关数据的两组分类:因子模型方法。 (英语) Zbl 1218.62064号

摘要:提出了一类专门针对高维问题设计的线性分类规则。新规则基于高斯因子模型,能够成功合并样本相关性中包含的信息。渐近结果表明,当假设模型为真时,所提出规则的最坏可能预期错误率收敛于最佳贝叶斯规则的错误,这使得变量数量的增长速度快于观测值的增长速度,当这个模型是数据生成过程的合理近似值时,则为稍大的常数。数值比较表明,当结合适当的变量选择策略时,单因素模型得出的规则在其设计条件下的表现与现有最成功的替代方案相当或更好。建议的方法被实现为一个名为HiDimDA公司,可从CRAN存储库获得。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62H25个 因子分析和主成分;对应分析
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿龙,美国。;北巴尔凯。;诺特曼,D.A。;吉什,K。;伊巴拉,S。;麦克,D。;Levine,A.J.,通过寡核苷酸阵列探测的肿瘤和正常结肠组织的聚类分析揭示的广泛基因表达模式,国家科学院学报,96,6745-6750(1999)
[2] Y.本杰米尼。;Hochberg,Y.,《控制错误发现率:一种实用而有力的多重测试方法》,《皇家统计学会杂志》。B系列,57,1,289-300(1995)·Zbl 0809.62014号
[3] Y.本杰米尼。;Yekutieli,D.,《依赖性下多重测试中错误发现率的控制》,《统计年鉴》,29,4,1165-1188(2001)·Zbl 1041.62061号
[4] Bickel,P.J。;Levina,E.,Fisher线性判别函数的一些理论,“朴素贝叶斯”和变量多于观测值时的一些替代方法,Bernoulli,10,6,989-1010(2004)·Zbl 1064.62073号
[5] Chakraborty,S。;Guo,R.,贝叶斯混合Huberized支持向量机及其在高维医学数据中的应用,计算统计与数据分析,55,3,1342-1356(2011)·Zbl 1328.62584号
[6] Chang,C.C.,Lin,C.J.,2010年。LIBSVM:支持向量机库。未出版的手稿。网址:网址:http://www.csie.ntu.edu.tw/cjlin/pers/libsvm.ps.gz;Chang,C.C.,Lin,C.J.,2010年。LIBSVM:支持向量机库。未出版的手稿。网址:网址:http://www.csie.ntu.edu.tw/cjlin/papers/libsvm.ps.gz
[7] Choi,H。;Yeo,D。;Kwon,S。;Kim,Y.,使用支持向量机和拒绝选项进行癌症分类的基因选择和预测,计算统计和数据分析,55,5,1897-1908(2011)·Zbl 1328.62586号
[8] 多明戈斯,P。;Pazzani,M.,关于零损失下简单贝叶斯分类器的最优性,机器学习,29,103-130(1997)·Zbl 0892.68076号
[9] 多诺霍,D。;Jin,J.,《检测稀疏非均匀混合物的更高批评》,《统计年鉴》,32,3,962-994(2004)·Zbl 1092.62051号
[10] 多诺霍,D。;Jin,J.,《更高的批评阈值》。当有用特征稀少且较弱时的最佳特征选择,《美国国家科学院院刊》,105,14790-14795(2008)·兹比尔1357.62212
[11] 多诺霍,D。;Jin,J.,通过更高的批评阈值进行特征选择,获得最佳相图,《皇家学会哲学学报》。系列A,367,4449-4470(2009)·Zbl 1185.62113号
[12] Duarte Silva,A.P.,多元分析的有效变量筛选,多元分析杂志,76,1,35-62(2001)·Zbl 0996.62063号
[13] 杜阿尔特·席尔瓦(Duarte Silva),A.P.,《变量多于观察值的线性判别分析:一种不那么天真的方法》(罗加雷克·荣格(Locarek-Junge),赫尔曼(Hermann);魏斯(Weihs),克劳斯(Claus),《分类作为研究工具》(Classification as A Tool for Research)。《分类、数据分析和知识组织研究》(Studies in Classification,Data analysis,and Knowled
[14] 杜阿尔特·席尔瓦,美联社。;斯塔姆·A。;Neter,J.,《两组分类中误分类成本和偏态分布的影响》,《统计学中的通信:模拟和计算》,31,3,401-423(2002)·Zbl 1079.62519号
[15] Dudoit,S。;Fridlyand,J。;Speed,T.P.,《使用基因表达数据对肿瘤进行分类的判别方法比较》,《美国统计协会杂志》,97,457,77-87(2002)·Zbl 1073.62576号
[16] Efron,B.,《大尺度同步假设检验:无效假设的选择》,《美国统计协会杂志》,99,465,96-104(2004)·Zbl 1089.62502号
[17] Efron,B.,《规模、权力和错误发现率》,《统计年鉴》,35,4,1351-1377(2007)·Zbl 1123.62008年
[18] 范,J。;Fan,Y.,使用特征退火独立规则的高维分类,《统计年鉴》,36,6,2605-2637(2008)·Zbl 1360.62327号
[19] 费希尔·T·J。;Sun,X.,高维多元正态协方差矩阵的改进Stein型收缩估计量,计算统计与数据分析,55,5,1909-1918(2011)·Zbl 1328.62336号
[20] Golub,T.R。;Slonim,D.K。;Tamayo,P。;华德,C。;加森贝克,M。;梅西洛夫,J.P。;科勒,H。;Loh,M.L。;唐宁,J.R。;Caligiuri,医学硕士。;哥伦比亚特区布隆菲尔德。;Lander,E.S.,《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》,286,5439,531-537(2009)
[21] Golub,G.H。;Van Loan,C.F.,《矩阵计算》(1996),约翰霍普金斯出版社:巴尔的摩·Zbl 0865.65009号
[22] Greenshtein,E。;Park,J.,通过变量选择和条件MLE进行正则化,并应用于高维分类,《统计规划与推断杂志》,139,2385-395(2009)·Zbl 1149.62052号
[23] 郭,Y。;哈斯蒂,T。;Tibshirani,R.,正则化判别分析及其在微阵列中的应用,生物统计学,8,1,86-100(2007)·Zbl 1170.62382号
[24] Johnstone,I.M.,2002年。函数估计和高斯序列模型。未出版的专著。http://www-stat.stanford.edu/国际货币基金组织;Johnstone,I.M.,2002年。函数估计和高斯序列模型。未出版的专论。http://www-stat.stanford.edu/国际货币基金组织
[25] O.莱多特。;Wolf,M.,《大维协方差矩阵的良好估计》,《多元分析杂志》,88,2,365-411(2004)·Zbl 1032.62050
[26] Luenberger,D.G.,线性和非线性规划(1984),Addison-Wesley·Zbl 0571.90051号
[27] McLachlan,G.J.,《判别分析与统计模式识别》(1992),威利出版社:威利纽约·Zbl 0850.62481号
[28] R开发核心团队,2011年。R: 一种用于统计计算的语言和环境。R统计计算基金会,奥地利维也纳。ISBN:3-900051-07-0。网址:网址:http://www.R-project.com; R开发核心团队,2011年。R: 一种用于统计计算的语言和环境。R统计计算基金会,奥地利维也纳。ISBN:3-900051-07-0。网址:网址:http://www.R-project.com
[29] 谢弗,J。;Strimmer,K.,大规模协方差矩阵估计的收缩方法及其对功能基因组学的影响,遗传学和分子生物学中的统计应用,4,1(2005),第32条
[30] Seber,G.A.F.,《多元观察》(1984),威利出版社:威利纽约·Zbl 0627.62052号
[31] 辛格,D。;Febbo,P.G。;Ross,K。;Jackson,D.G。;马诺拉,J。;拉德,C。;Tamayo,P。;Renshaw,A.A。;阿米科公司。;Richie,J.P。;兰德,E.S。;Loda,K。;坎托夫,P.W。;Golub,T.R.(戈卢布,T.R.)。;Sellers,W.R.,基因表达与前列腺癌临床行为的相关性,《癌症细胞》,1,2,203-220(2002)
[32] Tibshirani,R。;哈斯蒂,B。;纳里斯曼,B。;Chu,G.,最近收缩质心的类别预测及其在DNA微阵列中的应用,统计科学,18,1,104-117(2003)·Zbl 1048.62109号
[33] Vapnik,V.,《统计学习理论的本质》(1996),施普林格出版社:纽约施普林格·Zbl 0934.62009号
[34] 徐,P。;布洛克,G.N。;Parrish,R.S.,用于高维微阵列数据分类的改进线性判别分析方法,计算统计学和数据分析,53,51674-1687(2009)·Zbl 1453.62255号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。