×

兹马思-数学第一资源

集合分位数分类器。(英语) Zbl 07160679
摘要:基于中值的分类器和基于分位数的分类器都适用于区分具有重尾或倾斜输入的高维数据。但这些方法受到限制,因为它们以不规范的方式为每个变量分配相同的权重。集成分位数分类器是一种更灵活的正则化分类器,它在处理高维数据、非对称数据或存在许多无关的外部输入时提供了更好的性能。通过仿真研究以及在文本分类中的应用,证明了改进的性能。证明了在适当的一般模型假设下,集成分位数分类器的估计参数一致地估计了最小种群损失。在非对称Laplace分布输入的条件下,集成分位数分类器是Bayes最优的。
理学硕士:
62-XX号 统计
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] 比克尔,P.J。;Levina,E.,《Fisher线性判别函数的一些理论》,“NaiveBayes”,以及变量比观测值更多时的一些选择,Bernoulli,10,6989-1010(2004)·Zbl 1064.62073
[2] 布雷曼,L.,叠加回归,马赫。学习,24,1,49-64(1996)·Zbl 0849.68104
[3] 布雷曼,L.,随机森林,马赫。学习,45,1,5-32(2001)·Zbl 1007.68152号
[4] Cardoso Cachopo,A.,单标签文本分类的改进方法(2007),里斯本Tecnica大学高级技术学院,(博士论文)
[5] 克利夫兰,W.S.,可视化数据(1993),霍巴特出版社
[6] 科尔特斯,C。;Vapnik,V.,支持向量网络,Mach。学习,20,3,273-297(1995)·邮政编码:0831.68098
[7] Dieterich,T.G.,机器学习中的集成方法(2000年),Springer,1-15
[8] Dudoit公司。;弗里德兰,J。;Speed,T.P.,利用基因表达数据对肿瘤分类的判别方法比较,J.Amer。统计学家。协会,97,457,77-87(2002年)·Zbl 1073.62576
[9] 范,J。;Fan,Y.,使用特征退火独立规则的高维分类,Ann。统计,36,6(2008年)·Zbl 1360.62327
[10] Feiner,I.,霍尼克,K.,2017年。tm:文本挖掘包。https://CRAN.R-project.org/package=tm。R程序包版本0.7-3。
[11] 弗伦德,Y。;夏皮尔,R.E.,《在线学习的决策理论概括及其在boosting中的应用》,J.Comput。系统。科学,55,1191-139(1997)·Zbl 0880.68103
[12] 弗里德曼,J。;黑斯蒂,T。;Tibshirani,R.,通过坐标下降实现广义线性模型的正则化路径,J.Stat.Softw.,33,1,1-22(2010)
[13] 霍尔,P。;蒂特林顿,D.M。;薛杰,高维数据的基于中值的分类器,J.Amer。统计学家。协会,1044881597-1608(2009)·Zbl 1205.62078号
[14] 黑斯蒂,T。;蒂比拉尼,R。;Friedman,J.,《统计学习的要素》(2009年),Springer统计学系列。斯普林格:统计学中的斯普林格系列。斯普林格·维拉格纽约。
[15] 亨尼格,C。;103,Biometrics,第103期,第4期,第4期,第6期·Zbl 07072122
[16] Hennig,C.,维罗利,C.,2016b。分位数分类器。https://CRAN.R-project.org/package=quantileDA.R包版本1.1。
[17] 詹姆斯,G。;维顿,D。;黑斯蒂,T。;Tibshirani,R.,统计学学习导论,Springer系列统计(2013),Springer Verlag:Springer Verlag New York。
[18] Joe,H.,《基于偏相关的随机相关矩阵生成》,多元分析杂志,97,10,2177-2189(2006)·Zbl 1112.62055
[19] 《分位数回归》,计量经济学会专著(2005),剑桥大学出版社·Zbl 1111.62037
[20] 克恩克,R。;巴塞特,G.,回归分位数,计量经济学,46,1,33-50(1978)·Zbl 0373.62038
[21] 库恩,M。;Johnson,K.,应用预测建模(2013),Springer·Zbl 1306.62014
[22] Lai,Y.,McLeod,A.I.,2018年。集成分位数分类器。https://github.com/CliffordLai/eqc。R包版本1.0-5。
[23] 刘易斯,D.,1997年。路透社21578文本分类集合分发1.0。
[24] Lior,R.,集成学习:使用集成方法进行模式分类(2019),世界科学出版社
[25] Mason,D.M.,加权多维经验分布的几乎确定界的一些特征和样本分位数的Glivenko-Cantelli定理,Z.Wahrscheinlichkeits定理。Verwandte Geb.,第59、4、505-513页(1982年)·Zbl 0482.60029
[26] Meyer,D.,Dimitriadou,E.,Hornik,K.,Weingessel,A.,Leisch,F.,2018年。e1071:统计系其他职能,概率论小组(原:e1071),图文恩。https://CRAN.R-project.org/package=e1071。R包版本1.7-0。
[27] 纽伯德,P。;Granger,C.W.T.,预测单变量时间序列和预测组合的经验,J.Roy。统计学家。Soc。爵士。A、 137,231-165(1974年)
[28] 帕克,M.Y。;Hastie,T.,检测基因相互作用的惩罚逻辑回归,生物统计学,9,1,30-50(2007)·Zbl 1274.62853
[29] 邱,W.,Joe.,H.,2015年。clustergeneration:随机生成簇(具有指定的分离度)。R包版本1.3.4。
[30] 沙皮里,R。;弗伦德,Y.,推进:基础和算法(2012),麻省理工学院出版社·Zbl 1278.68021
[31] Sebastianin,F.,自动文本分类中的机器学习,ACM计算机。第34、1、1-47页(2002年)
[32] Silver,N.,《信号与噪音》(2012),企鹅出版社
[33] 蒂比拉尼,R。;黑斯蒂,T。;纳拉辛汉,B。;Chu,G.,最近收缩质心的类预测,在DNA微阵列中的应用,统计学。科学,18,1104-117(2003)·Zbl 1048.62109
[34] 丁锦明。;Witten,I.H.,《堆叠归纳中的问题》,J.Artf。因特尔。第10271-289号决议(1999年)·Zbl 0915.68075
[35] 维纳布尔斯,W.N。;雷普利,B.D.,现代应用统计学与S(2002),斯普林格:斯普林格纽约·Zbl 1006.62003
[36] Wolpert,D.H.,《叠加综合,神经网络》,5,2,241-259(1992)
[37] 周志宏,集成方法:基础与算法(2012),查普曼与霍尔/CRC
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。