×

判别分析中的正则化:综述。 (英语) Zbl 0875.62266号

摘要:本文综述了正则化技术在判别分析中的应用。首先处理连续变量的情况,然后处理离散变量的情况。区分了三种方法:组合标准方法、约束模型和贝叶斯建模。我们通过数值实验来评估正则化版本预测判别的效率,并说明正则化在小样本环境下变量子集选择上的优势。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 艾奇逊,J。;Aitken,C.G.G.:用核方法进行多元二进制判别。《生物特征》63,413-420(1976)·Zbl 0344.62035号
[2] Anderson,J.A.:独立样本逻辑判别。《生物特征》66,19-35(1972)·Zbl 0231.62080号
[3] Anderson,J.A.:逻辑歧视。统计手册,2:分类、模式识别和降维,169-191(1982)·Zbl 0505.62046号
[4] Bahadur,R.R.:n个二分项目反应的联合分布表示。项目分析和预测研究,158-168(1961)·Zbl 0103.36701号
[5] Banfield,J.D。;Raftery,A.E.:基于模型的高斯和非高斯聚类。生物统计学49,803-821(1993)·兹比尔0794.62034
[6] Bayne,J.J。;波尚,V.E。;凯恩,V.E。;Mccabe,G.P.:Fisher和logistic线性和二次判别模型的评估。计算。中央集权主义者。数据分析。1, 257-273 (1983)
[7] Bensmail,H。;Celeux,G.:通过特征值分解的正则高斯判别分析。技术报告278(1994)·Zbl 0885.62068号
[8] Bmdp;统计软件公司:BMDP统计软件。(1988)
[9] 坎贝尔,N.A.:判别和典型变量分析中的收缩估计量。申请。中央集权主义者。29, 5-14 (1980) ·Zbl 0454.62053号
[10] Celeux,G。;Govaert,G.:高斯简约聚类模型。模式识别28,781-793(1995)
[11] Celeux,G。;Mkhadri,A.:离散正则判别分析。统计师。计算机。2, 143-175 (1992)
[12] 勒塞西,S。;Van Houwelingen,S.C.:逻辑回归中的岭估计量。申请。中央集权主义者。41, 191-201 (1992) ·Zbl 0825.62593号
[13] Chow,C.K。;Liu,C.N.:用依赖树逼近离散概率分布。IEEE传输。通知。理论14462-467(1968)·Zbl 0165.22305号
[14] Clogg,C.C。;鲁宾,D.B。;Schenker,N。;B.舒尔茨。;Weidman,L.:使用贝叶斯逻辑回归对行业和职业代码普查公共用途样本进行多重插补。J.阿莫尔。统计师。assoc.8668-78(1991)
[15] Copas,J.B.:回归、预测和收缩(附讨论)。J.罗伊。统计师。社会服务。B 45311-354(1983)·Zbl 0532.62048号
[16] Cox,D.R.:回归模型和生命表(含讨论)。J.罗伊。统计师。社会服务。B 32,443-448(1972)
[17] Day,东北部。;Kerridge,D.F.:一般最大似然判别法。生物统计学23,313-323(1967)
[18] 戴伊,D.K。;Srinivasan,C.:关于判别系数的估计。统计师。可能。莱特。11, 189-193 (1991) ·Zbl 0716.62058号
[19] Di Pillo,P.J.:偏差在判别分析中的应用。通信统计学家。理论方法5843-854(1976)·Zbl 0439.62042号
[20] 埃夫隆,B。;Morris,C.:多元经验贝叶斯和协方差矩阵的估计。安。统计师。4, 22-32 (1976) ·Zbl 0322.62041号
[21] Firth,D.:最大似然估计的偏差减少。《生物特征》80,27-38(1993)·Zbl 0769.62021号
[22] Flury,B.:常见主成分和相关多元模型。(1988) ·兹比尔1081.62535
[23] Flury,B.W。;施密德,M.J。;Narayanan,A.:协方差矩阵约束下二次判别的错误率。J.分类11,101-120(1993)·Zbl 0825.62538号
[24] Friedman,J.H.:正则化判别分析。J.阿默尔。统计师。协会84、165-175(1989)
[25] Geisser,S.:预测性歧视。程序。国际。交响乐团。关于多元分析,149-163(1966)·Zbl 0216.48001号
[26] Greene,T。;Rayens,W.:判别分析中的部分合并协方差矩阵估计。通信统计学家。理论方法18,3679-3702(1989)·Zbl 0696.62256号
[27] Haff,L.R.:多元正态协方差矩阵的经验Bayes估计。统计年鉴。8, 586-597 (1980) ·Zbl 0441.62045号
[28] 霍尔,P.:用于判别分析的最佳近邻估计量。《生物特征》68、572-575(1981)·Zbl 0477.62024号
[29] Hand,D.J.:核判别分析。(1982) ·Zbl 0562.62041号
[30] Hills,M.:离散数据的区分和分配。申请。中央集权主义者。16, 237-250 (1967)
[31] Kirby,S.P.J。;西奥博尔德,C.M。;派珀,J。;Carothers,A.D.:在人类染色体分类的多元正态判别中组合类别信息的一些方法。统计师。医学10,141-149(1991)
[32] 科科拉基斯,G.E。;Johnson,W.O.:二元分类问题中多项式概率的贝叶斯估计和平滑参数。技术报告(1989)
[33] Krzanowski,W.J。;Jonathan,P。;麦卡蒂,W.V。;Thomas,M.R.:奇异协方差矩阵的判别分析:光谱数据的方法和应用。申请。中央集权主义者。44, 101-115 (1995) ·Zbl 0821.62032号
[34] 关颖珊(Kwan,W.)。;Kowalski,B.R.:感官评分的数据分析:小组成员和葡萄酒评分卡的评估。食品科学杂志。45, 213-216 (1980)
[35] 拉文,M。;West,M.:用于分类和区分的贝叶斯方法。加拿大统计学杂志。20, 451-461 (1992) ·Zbl 0765.62062号
[36] Loh,W.L.:关于采用自适应岭分类规则的线性判别分析。J.多元分析。53, 264-278 (1995) ·Zbl 0877.62062号
[37] Mclachlan,G.J.:判别分析和统计模式识别。(1992) ·Zbl 1108.62317号
[38] Mkhadri,A.:两种离散正则判别分析方法的比较研究。Compstat 92 1,185-190(1992)
[39] Mkhadri,A.:修正线性判别分析的收缩参数。模式识别等。16, 267-276 (1995)
[40] Mkhadri,A。;Bochi,S.:具有依赖树的正则离散概率分布。INRIA研究报告,#2210(1994)
[41] 奥特·J。;Kronmal,R.A.:使用正交函数对二进制数据进行分类的一些程序。J.阿默尔。统计师。相关71,391-399(1976年)·Zbl 0336.62044号
[42] 佩克·R。;Van Ness,J.:线性判别分析中收缩估计器的使用。IEEE传输。帕特。肛门。马赫英特尔。,530-537 (1982)
[43] Randles,R.H。;布罗菲特,J.D。;Ramberg,J.S.:基于等级的判别分析。J.阿默尔。统计师。协会73,379-384(1978)
[44] Rayens,W。;Greene,T.:分类协方差池和稳定化。计算。中央集权主义者。数据分析。11, 17-42 (1991) ·Zbl 0850.62472号
[45] Scott,J.R.:二次判别分析中的降维。计算。中央集权主义者。数据分析。16, 161-174 (1993) ·Zbl 0937.62607号
[46] A.F.M.史密斯。;Spiegelhalter,D.J.:多元结构的贝叶斯方法。多元分析(1982)
[47] 蒂特林顿,医学博士。;G.D.穆雷。;Murray,L.S。;施皮盖尔哈特,D.J。;Skene,D.J。;哈贝马,J.D.F。;Gelpke,G.J.:应用于头部受伤患者的计算机数据集的识别技术比较。J.罗伊。统计师。社会服务。A 144145-175(1981)·Zbl 0469.62085号
[48] Turlot,J.-C.:言论选择与歧视性错误分类评估。变量判别分析继续,51-64(1991)
[49] Tutz,G.:判别分析中的对数线性参数化。方法模型运算。第34、303-319号决议(1990年)·兹比尔0699.62061
[50] Van Ness,J.:关于不等协方差总体判别分析中维数的影响。技术计量学21,119-127(1980)·Zbl 0426.62039号
[51] Wong,A.K.C。;Liu,T.S.:离散数据的决策导向聚类算法。IEEE传输。计算。26, 75-82 (1977) ·Zbl 0379.62052号
[52] Wong,A.C.K。;Wang,C.C.:具有最大错误概率的离散生物医学数据分类。程序。第七国际。Conf.赛博。《社会学杂志》,19-21(1979)
[53] Wong,S.K.M。;Poon,F.C.S.:关于用依赖树近似离散概率分布的评论。IEEE传输。帕特。肛门。马赫英特尔公司。11333-335(1989年)·Zbl 0709.62610号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。