研究文章

基于特征提取和惩罚因子增强C5.0决策树算法的乳腺癌诊断


  • 收到:2021年9月16日 修订过的:2021年11月28日 认可的:2021年12月14日 出版:2022年1月4日
  • 为了克服乳腺癌诊断中的两类不平衡问题,提出了一种将主成分分析(PCA)和带有惩罚因子的改进C5.0决策树算法相结合的混合方法来解决这一问题。PCA用于降低特征子集的维数。使用改进的C5.0决策树算法作为集成分类器进行分类。惩罚因子用于优化分类结果。为了证明所提方法的有效性,该方法在加州大学欧文分校(UCI)机器学习库的偏倚表示乳腺癌数据集上实现。根据实验结果和进一步分析,我们的建议是一种很有前途的治疗乳腺癌的方法,可以作为课堂不平衡学习的替代方法。事实上,我们观察到特征提取过程帮助我们提高了诊断准确性。我们还证明,考虑到乳腺癌问题的提取特征对高诊断准确性至关重要。

    引用:田建雪,张珏。基于特征提取和带惩罚因子的C5.0决策树算法的乳腺癌诊断[J]。数学生物科学与工程,2022,19(3):2193-2205。doi:10.3934/mbe.2022102

    相关论文:

  • 为了克服乳腺癌诊断中的两类不平衡问题,提出了一种将主成分分析(PCA)和带有惩罚因子的改进C5.0决策树算法相结合的混合方法来解决这一问题。PCA用于降低特征子集的维数。使用改进的C5.0决策树算法作为集成分类器进行分类。惩罚因子用于优化分类结果。为了证明所提方法的有效性,该方法在加州大学欧文分校(UCI)机器学习库的偏倚表示乳腺癌数据集上实现。根据实验结果和进一步分析,我们的建议是一种很有前途的治疗乳腺癌的方法,可以作为课堂不平衡学习的替代方法。事实上,我们观察到特征提取过程帮助我们提高了诊断准确性。我们还证明,考虑到乳腺癌问题的提取特征对高诊断准确性至关重要。



    加载中


    [1] L.A.Torre、F.Bray、R.L.Siegel、J.Ferlay、J.Lorte-Tieunt、A.Jemal,《全球癌症统计》,2012年,加州癌症杂志临床。,65(2015), 87–108. https://doi.org/10.3322/caac.21262数字对象标识:10.3322/caac.21262
    [2] M.F.Akay,支持向量机结合特征选择用于乳腺癌诊断,专家系统。申请。,36(2009年),3240–3247。https://doi.org/10.1016/j.eswa.2008.01.09数字对象标识:2016年10月10日/j.eswa.2008.01.09
    [3] R.L.Siegel,K.D.Miller,A.Jemal,癌症统计,2018年,加州癌症杂志临床。,68(2018), 7–30. https://doi.org/10.3322/caac.21442数字对象标识:10.3322/caac.21442
    [4] L.Peng,W.Chen,W.Zhou,F.Li,J.Yang,J.Zhang,用于乳腺癌诊断的免疫启发半监督算法,计算。方法生物识别程序。,134(2016), 259–265. https://doi.org/10.1016/j.cmpb.2016.07.020数字对象标识:2016年10月10日/j.cmpb.2016.07.020
    [5] H.L.Chen,B.Yang,J.Liu,D.Y.Liu,一种用于乳腺癌诊断的基于粗糙集的特征选择的支持向量机分类器,专家系统。申请。,38(2011), 9014–9022. https://doi.org/10.1016/j.eswa.2011.01.120数字对象标识:2016年10月10日/j.eswa.2011.01.120
    [6] 李建斌,彭玉鹏,刘大东,拟共形核共域判别分析在乳腺癌诊断中的应用,信息科学。,223(2013), 256–269. https://doi.org/10.1016/j.ins.2012.10.016doi(操作界面):10.1016/j.ins.2012.16年10月
    [7] B.Zheng,S.W.Yoon,S.S.Lam,基于K-均值和支持向量机混合算法的特征提取的乳腺癌诊断,专家系统。申请。,4(2014), 1476–1482. https://doi.org/10.1016/j.eswa.2013.08.044数字对象标识:2016年10月10日/j.eswa.2013.08.44
    [8] F.Gorunescu,S.Belciug,开发基于学习的决策系统的进化策略。在乳腺癌和肝纤维化手术中的应用,J.生物识别。通知。,49(2014), 112–118. https://doi.org/10.1016/j.jbi.2014.02.001数字对象标识:2016年10月10日/j.jbi.2014.02.001
    [9] M.Karabatak,基于朴素贝叶斯的乳腺癌检测新分类器,测量。,72(2015), 32–36. https://doi.org/10.1016/j.measurement.2015.04.028数字对象标识:10.1016/j.测量.2015.04.028
    [10] R.Sheikhpour,M.A.Sarram,R.Shikhpour,乳腺癌诊断中基于核密度估计分类器的带宽确定和特征选择的粒子群优化,申请。软计算。,40(2016), 113–131. https://doi.org/10.1016/j.asoc.2015.10.05数字对象标识:2016年10月10日/j.asoc.2015.10.005
    [11] M.F.Ijaz,M.Attique,Y.Son,数据驱动的宫颈癌预测模型,带异常值检测和过采样方法,传感器,20(2020), 2809. https://doi.org/10.3390/s20102809数字对象标识:10.3390/s20102809
    [12] M.Mandal,P.K.Singh,M.F.Ijaz,J.Shafi,R.Sarkar,疾病分类的三阶段包装过滤器特征选择框架,传感器,21(2021), 5571. https://doi.org/10.3390/s21165571数字对象标识:10.3390/s21165571
    [13] H.Patel,G.S.Thakur,使用改进的模糊邻域加权方法对不平衡数据进行分类,《国际情报杂志》。工程系统。,10(2017), 56–64. https://doi.org/10.22266/ijies2017.0228.07数字对象标识:10.22266/ijies2017.0228.07
    [14] W.C.Lin,C.F.Tsai,Y.H.Hu,J.S.Jhang,基于聚类的类平衡数据欠采样,信息科学。,409(2017), 17–26. https://doi.org/10.1016/j.ins.2017.05.008数字对象标识:2016年10月10日/j.ins.2017.05.008
    [15] P.D.Turney,成本敏感分类:混合遗传决策树归纳算法的实证评估,J.阿蒂夫。智力。物件。,2(1994), 369–409. https://doi.org/10.1613/jair.120doi(操作界面):10.1613/jair.120年
    [16] H.E.Kiziloz,特征选择中的分类器集成方法,神经计算,419(2021), 97–107. https://doi.org/10.1016/j.neucom.2020.07.113数字对象标识:2016年10月10日/j.neucom.2020.07.113
    [17] M.Galar,A.Fernández,E.Barrenechea,H.Bustince,F.Herrera,在不平衡数据集框架下提高分类器集合性能的基于排序的剪枝,信息科学。,354(2016), 178–196. https://doi.org/10.1016/j.ins.2016.02.056数字对象标识:10.1016/j.ins.2016.02.056
    [18] J.Zhang,L.Chen,J.Tian,F.Abid,W.Yang,X.Tang,使用基于聚类的欠采样和提高C5的乳腺癌诊断。0算法,国际J控制自动。系统。,19(2021), 1998–2008. https://doi.org/10.1007/s12555-019-1061-x网址数字对象标识:10.1007/s12555-019-1061-x
    [19] Z.Zheng,X.Wu,R.Srihari,不平衡数据上文本分类的特征选择,ACM Sigkdd探索。新闻。,6(2004), 80–89. https://doi.org/10.1145/1007730.1007741数字对象标识:10.1145/1007730.1007741
    [20] S.Punitha,F.Al-Turjman,T.Stephan,使用ANN中的特征选择和参数优化实现乳腺癌自动诊断,计算。选举人。工程师。,90(2021), 106958. https://doi.org/10.1016/j.com.peeceng.2020.106958数字对象标识:2016年10月10日/j.compleceng.2020.106958
    [21] P.N.Srinivasu,J.G.SivaSai,M.F.Ijaz,A.K.Bhoi,W.Kim,J.J.Kang,使用MobileNet V2和LSTM深度学习神经网络对皮肤病进行分类,传感器,21(2021), 2852. https://doi.org/10.3390/s21082852数字对象标识:10.3390米/21082852米
    [22] H.Naeem,A.A.Bin-Salem,一个基于多层特征提取的CNN-LSTM网络,用于从CT扫描和X射线图像中自动检测冠状病毒,申请。软计算。,113(2021), 107918. https://doi.org/10.1016/j.asoc.2021.107918数字对象标识:2016年10月10日/j.asoc.2021.107918
    [23] P.Huang,Q.Ye,F.Zhang,G.Yang,W.Zhu,Z.Yang,双L2,基于P-范数的PCA特征提取,信息科学。,573(2021), 345–359. https://doi.org/10.1016/j.ins.2021.05.079数字对象标识:10.1016/j.ins.2021.05.079
    [24] 程海东,石晓杰,石若敏,胡立民,蔡晓平,杜海南,乳房X光片中肿块自动检测和分类方法,模式识别。,4(2006), 646–668. https://doi.org/10.1016/j.patcog.2005.07.006数字对象标识:2016年10月10日/j.patcog.2005.07.006
    [25] T.Raeder,G.Forman,N.V.Chawla,《从不平衡数据中学习:评估事项》,in数据挖掘:基础和智能范式施普林格,(2012),315-331。https://doi.org/10.1007/978-3-641-23166-7_12数字对象标识:10.1007/978-3-641-23166-7_12
    [26] S.Piri,D.Delen,T.Liu,一种利用支持向量机增强不平衡数据集学习的综合信息少数过采样(SIMO)算法,Decis公司。支持系统。,106(2018),15-29。https://doi.org/10.1016/j.dss.2017.11.006数字对象标识:2016年10月10日/j.dss.2017.11.006
    [27] C.Seiffert,T.M.Khoshgoftaar,J.Van。Hulse,A.Napolitano,RUSBoost:缓解阶级不平衡的混合方法,IEEE传输。系统。人类网络。A部分:系统。嗯。,40(2009), 185–197. https://doi.org/10.109/tsmca.2009.2029559doi(操作界面):10.1109/tsmca.2009.2029559
    [28] 刘楠,齐爱生,徐明明,高斌,刘国庆,乳腺癌诊断的新型智能分类模型,Inf.流程。管理。,56(2019), 609–623. https://doi.org/10.1016/j.ipm.2018.10.014数字对象标识:2016年10月10日/下午2018.10.014
    [29] S.Wang,Y.Wang,D.Wang,Y.Yin,Y.Wang,Y.Jin,一种用于乳腺癌诊断的改进的基于随机森林的规则提取方法,申请。软计算。,86(2020), 105941. https://doi.org/10.1016/j.asoc.2019.105941数字对象标识:2016年10月10日/j.asoc.2019.105941
    [30] H.Wang,B.Zheng,S.W.Yoon,H.S.Ko,基于支持向量机的乳腺癌诊断集成算法,欧洲药典。物件。,267(年份),687-699。https://doi.org/10.1016/j.ejor.2017.12.001数字对象标识:10.1016/j.ejor.2017.12.001
    [31] L.Breiman,装袋预测,机器。学习。,24(1996), 123–140. https://doi.org/10.1007/BF00058655数字对象标识:2007年10月10日/BF00058655
    [32] A.Taherkhani,G.Cosma,T.M.McGinnity,AdaBoost-CNN:卷积神经网络的自适应增强算法,用于使用传递学习对多类不平衡数据集进行分类,神经计算,404(2020), 351–366. https://doi.org/10.1016/j.neucom.2020.03.064数字对象标识:2016年10月10日/j.neucom.2020.03.064
  • 读者评论
  • ©2022作者,授权人AIMS Press。这是一篇开放存取的文章根据知识共享署名许可证的条款(http://creativecommons.org/licenses/by/4.0)
通讯作者:斌,bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. 中国知网搜索

韵律学

文章观点(2246) PDF下载(167) 引用人(1)

文章大纲

图和表

数字(2)/表格(6)

作者撰写的其他文章

/

返回
返回

目录