×

等渗增压分类规则。 (英语) Zbl 07363875号

摘要:在许多实际的分类问题中,当预测值的较高(或较低)与响应的较高水平相关时,可以假设某些预测值与类别之间存在单调关系。在本文中,我们提出了基于LogitBoost的新的boosting算法,该算法结合了这种同位素信息,产生了更准确、更容易解释的规则。这些算法是基于考虑等渗回归的理论发展。我们不仅在模拟上显示了这些程序的良好性能,而且在来自两个非常不同的环境(即癌症诊断和感应电机故障)的实际数据集上也显示了这些过程的良好性能。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Agresti,A.,分类数据分析(2002),霍博肯:威利,霍博克·兹比尔1018.62002 ·数字标识代码:10.1002/0471249688
[2] Agresti,A.,《有序分类数据分析》(2010),霍博肯:威利·Zbl 1263.62007年 ·数字对象标识代码:10.1002/9780470594001
[3] 埃尔文;夏皮雷,RE;Singer,Y.,《将多类还原为二进制:边缘分类器的统一方法》,J Mach Learn Res,1113-141(2000)·Zbl 1013.68175号
[4] 奥赫,S。;Sampson,AR,等渗逻辑判别,Biometrika,93,4,961-972(2006)·Zbl 1436.62237号 ·doi:10.1093/biomet/93.4.961
[5] 巴洛,RE;巴托洛缪,DJ;JM布雷纳;Brunk,HD,《订单限制下的统计推断》(1972),纽约:威利·Zbl 0246.62038号
[6] Bühlmann P(2012)装袋、增压和集成方法。收录:《计算统计手册》,施普林格出版社。第33卷第985-1022页第章
[7] 卡诺,JR;García,S.,《单调序数分类的训练集选择》,《数据知识工程》,第112期,第94-105页(2017年)·doi:10.1016/j.datak.2017.10.003
[8] 卡诺,JR;宾夕法尼亚州古铁雷斯;Krawczyk,B。;沃兹尼亚克,M。;García,S.,《单调分类:算法、性能度量和数据集概述》,神经计算,341168-182(2019)·doi:10.1016/j.neucom.2019.02.024
[9] 陈,Y。;Samworth,RJ,带形状约束的广义加性和指数模型,J R Stat Soc B,78,729-754(2016)·兹伯利1414.62153 ·doi:10.1111/rssb.12137
[10] Chen T,Guestrin C(2016)XGBoost:一个可扩展的树木提升系统。摘自:ACM SIGKDD知识发现和数据挖掘国际会议记录,第785-794页
[11] Chen T,He T,Benesty M,Khotilovich V,Tang Y,Cho H,Chen K,Mitchell R,Cano I,Zhou T,Li M,Xie J,Lin M,Geng Y,Li Y(2019)xgboost:极限坡度提升。R包版本0.82.1https://CRAN.R-project.org/package=xgboost
[12] Choudhary,A。;Goyal博士。;SL Shimi;Akula,A.,《感应电机的状态监测和故障诊断:综述》,Arch Comput Methods Eng,1,2(2019)·数字对象标识代码:10.1007/s11831-018-9286-z
[13] 康德,D。;马萨诸塞州费尔南德斯;Rueda,C。;Salvador,B.,《将样本分为两个或多个有序人群并应用于癌症试验》,《统计医学》,31,28,3773-3786(2012)·doi:10.1002/sim.5476
[14] 康德,D。;萨尔瓦多,B。;Rueda,C。;马萨诸塞州Fernández,《利用附加信息构建的分类规则的真实错误率的性能和估计:在癌症试验中的应用》,Stat Appl Gen Mol Biol,12,5,583-602(2013)
[15] 康德,D。;马萨诸塞州费尔南德斯;萨尔瓦多,B。;Rueda,C.,dawai:带附加信息的判别分析R包,J Stat Softw,66,10,1-19(2015)·doi:10.18637/jss.v066.i10
[16] Conde D、Fernández MA、Rueda C、Salvador B(2020)等压线:等渗增压分类规则。R包版本1.0.0https://CRAN.R-project.org/package=isoboost
[17] De Leeuw,J。;霍尼克,K。;Mair,P.,《R中的同位素优化:池相邻违规算法(PAVA)和活动集方法》,J Stat Softw,32,5,1-24(2009)·doi:10.18637/jss.v032.i05
[18] Dettling,M。;Bühlmann,P.,利用基因表达数据促进肿瘤分类,生物信息学,19,9,1061-1069(2003)·doi:10.1093/bioinformatics/btf867
[19] Dietterich,TG,《构建决策树集合的三种方法的实验比较:装袋、增强和随机化》,《马赫学习》,40,2,139-157(2000)·doi:10.1023/A:1007607513941
[20] 方,Z。;Meinshausen,N.,《用于高维加性等渗回归的LASSO同位素》,《计算图形统计杂志》,21,1,72-91(2012)·doi:10.1198/jcgs.2011.10095
[21] 马萨诸塞州费尔南德斯;Rueda,C。;Salvador,B.,《将附加信息纳入正常线性判别规则》,美国统计协会期刊,101,569-577(2006)·Zbl 1119.62340号 ·doi:10.1198/016214500500001041
[22] 弗伦德,Y。;Schapire,RE,在线学习的决策理论推广及其在助推中的应用,计算机系统科学杂志,55,1,119-139(1997)·Zbl 0880.68103号 ·doi:10.1006/jcss.1997.1504
[23] Freund Y,Schapire RE(1996)使用新的增强算法进行实验。摘自:ICML'96第十三届国际机器学习会议记录,第148-156页
[24] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,加法逻辑回归:升压的统计观点,Ann Stat,28,2337-407(2000)·Zbl 1106.62323号 ·doi:10.1214/aos/1016218223
[25] 富勒顿,AS;Anderson,KF,《工作不安全感在解释种族健康不平等中的作用》,《社会论坛》,第28、2、308-325页(2013年)·doi:10.1111/socf.12020
[26] 富勒顿,AS;Xu,J.,有序回归模型:平行、部分和非平行替代品(2016),博卡拉顿:CRC出版社,博卡拉通·Zbl 1358.62013号 ·doi:10.1201/b20060
[27] 路易斯安那州加西亚-埃斯库德罗;O.Duque-Perez。;Fernandez-Temprano,M。;Moriñigo-Sotelo,D.,使用质量控制图稳健检测VSI-feed感应电机的早期故障,IEEE Trans-Ind-Appl,53,3,3076-3085(2017)·doi:10.1109/TIA.2016.2617300
[28] Gauchat,G.,《科学的文化权威:公众对有组织科学的信任和接受》,《公众理解科学》,第20、6、751-770页(2011年)·doi:10.1177/0963662510365246
[29] Ghosh,D.,将单调性纳入生物标志物的评估,生物统计学,8,2,402-413(2007)·Zbl 1144.62091号 ·doi:10.1093/biostatistics/kxl018
[30] 哈拉比,CN,《工人依恋和工作场所权威》,《美国社会学评论》,51,5,634-649(1986)·doi:10.2307/2095489
[31] 手,DJ;Till,RJ,多类别分类问题ROC曲线下面积的简单概括,Mach Learn,45171-186(2001)·Zbl 1007.68180号 ·doi:10.1023/A:1010920819831
[32] Härdle,W。;Hall,P.,《关于加性回归模型的修正算法》,Stat Neerl,47,43-57(1993)·Zbl 0764.62054号 ·doi:10.1111/j.1467-9574.1993.tb01405.x
[33] Hastie T,Tibshirani R(2014)广义加性模型。收录:Wiley StatsRef:在线统计参考。威利-国际科学。doi:10.1002/9781118445112.stat03141·Zbl 0645.62068号
[34] 霍夫纳,B。;Kneib,T。;Hothorn,T.,约束回归的统一框架,统计计算,26,1-2,1-14(2016)·Zbl 1342.62115号 ·doi:10.1007/s11222-014-9520-y
[35] Holmes G,Pfahringer B,Kirkby R,Frank E,Hall M(2002)多类交替决策树。参加:欧洲机器学习会议。柏林施普林格·Zbl 1014.68754号
[36] Jarek Tuszynski(2019)caTools:工具:移动窗口统计、GIF、Base64、ROC、AUC等R包版本1.17.1.2https://CRAN.R-project.org/package=caTools
[37] Liaw,A。;Wiener,M.,《随机分类和回归》,Forest R News,2,3,18-22(2002)
[38] Marshall,RJ,使用搜索分区方法对有序类别进行分类,并将其应用于糖尿病筛查,Stat Med,18,2723-2735(1999)·doi:10.1002/(SICI)1097-0258(19991030)18:20<2723::AID-SIM234>3.0.CO;2-1
[39] Masters,GN,部分信用评分的Rasch模型,《心理测量学》,47,149-174(1982)·Zbl 0493.62094号 ·doi:10.1007/BF02296272
[40] McDonald R,Hand D,Eckley I(2003)在具有人工类噪声的真实数据集上对三种增强算法的实证比较。In:MSC2003:多分类器系统,第35-44页·Zbl 1040.68702号
[41] 米斯,D。;Wyner,A.,《与统计观点相反的证据》,J Mach Learn Res,9,131-156(2008)
[42] Meyer,MC,半参数加性约束回归,《非参数统计杂志》,25,3,715-730(2013)·Zbl 1416.62223号 ·doi:10.1080/10485252.2013.797577
[43] Meyer D、Dimitriadou E、Hornik K、Weingessel A、Leisch F(2019)e1071:统计部的杂项职能,概率论小组(原名:e1071),TU Wien。R包版本1.7-1https://CRAN.R-project.org/package=e1071
[44] 北卡罗来纳州皮亚。;Wood,SN,形状约束加性模型,统计计算,25,3,543-559(2014)·Zbl 1331.62367号 ·doi:10.1007/s11222-013-9448-7
[45] R核心团队(2019)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。https://www.R-project.org/
[46] Robertson,T。;英国《金融时报》赖特;Dykstra,R.,《有序限制统计推断》(1988),纽约:威利出版社,纽约·Zbl 0645.62028号
[47] 夏皮雷,RE,《弱可学习性的力量》,《马赫学习》,5,2,197-227(1990)
[48] 索贝尔,ME;议员贝克尔;Minick,SM,《职业流动的起源、目的地和关联》,美国社会学杂志,104,3,687-721(1998)·doi:10.1086/210084
[49] Therneau T,Atkinson B(2019)rpart:递归划分和回归树。R包版本4.1-15https://CRAN.R-project.org/package=rpart
[50] 特纳R(2019)。Iso:执行等张回归的函数。R包版本0.0-18https://CRAN.R-project.org/package=Iso
[51] 维纳布尔斯,WN;Ripley,BD,《现代应用统计与S》(2002),纽约:Springer,纽约·Zbl 1006.62003号 ·doi:10.1007/978-0-387-21706-2
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。