×

利用特征提取和带惩罚因子的C5.0决策树算法进行乳腺癌诊断。 (英语) 兹比尔1489.92073

摘要:为了克服乳腺癌诊断中的两类不平衡问题,提出了一种结合主成分分析(PCA)和带惩罚因子的增强C5.0决策树算法的混合方法来解决这一问题。PCA用于降低特征子集的维数。使用改进的C5.0决策树算法作为集成分类器进行分类。惩罚因子用于优化分类结果。为了证明所提方法的有效性,该方法在加州大学欧文分校(UCI)机器学习库的偏倚表示乳腺癌数据集上实现。根据实验结果和进一步分析,我们的建议是一种很有前途的治疗乳腺癌的方法,可以作为课堂不平衡学习的替代方法。事实上,我们观察到特征提取过程帮助我们提高了诊断准确性。我们还证明,考虑到乳腺癌问题的提取特征对高诊断准确性至关重要。

MSC公司:

92 C50 医疗应用(通用)
62页第10页 统计学在生物学和医学中的应用;元分析
62H25个 因子分析和主成分;对应分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 五十、 2012年全球癌症统计,加州癌症临床杂志。,65, 87-108 (2015) ·doi:10.3322/caac.21262
[2] M、 支持向量机与乳腺癌诊断特征选择相结合,专家系统。申请。,36, 3240-3247 (2009) ·doi:10.1016/j.eswa.2008.01.009
[3] R、 癌症统计,2018年,加州癌症临床杂志。,68, 7-30 (2018) ·doi:10.3322/caac.21442
[4] 五十、 一种用于乳腺癌诊断的免疫启发半监督算法,Compute。方法生物识别程序。,134, 259-265 (2016) ·doi:10.1016/j.cmpb.2016.07.020
[5] H、 基于粗糙集的特征选择支持向量机分类器在乳腺癌诊断中的应用,专家系统。申请。,389014-9022(2011年)·doi:10.1016/j.eswa.2011.01.120
[6] J、 拟共形核公共局部判别分析在乳腺癌诊断中的应用。,223, 256-269 (2013) ·Zbl 1293.62135号 ·doi:10.1016/j.ins.2012.10.16
[7] B、 基于K-均值和支持向量机算法混合的特征提取的乳腺癌诊断专家系统。申请。,1476年-1482年(2014年)·doi:10.1016/j.eswa.2013.08.044
[8] F、 开发基于学习的决策系统的进化策略。应用于乳腺癌和肝纤维化标准化,J.Biomed。通知。,49, 112-118 (2014) ·doi:10.1016/j.jbi.2014.02.001
[9] M、 基于朴素贝叶斯的乳腺癌检测分类器。,72, 32-36 (2015) ·doi:10.1016/j.测量.2015.04.028
[10] R、 粒子群优化用于基于核密度估计分类器的带宽确定和特征选择在乳腺癌诊断中的应用。软计算。,40, 113-131 (2016) ·doi:10.1016/j.asoc.2015.10.05
[11] M、 数据驱动的宫颈癌预测模型,采用异常值检测和过采样方法,Sensors,202809(2020)·doi:10.3390/s20102809
[12] M、 疾病分类的三级包装过滤器特征选择框架,传感器,215571(2021)·数字对象标识码:10.3390/s21165571
[13] H、 使用改进的模糊邻域加权方法对不平衡数据进行分类,Int.J.Intell。工程系统。,10, 56-64 (2017) ·doi:10.22266/ijies2017.0228.07
[14] W、 类平衡数据中基于聚类的欠采样,Inf.Sci。,409, 17-26 (2017) ·doi:10.1016/j.ins.2017.05.008
[15] P、 成本敏感分类:混合遗传决策树归纳算法的经验评估,J.Artif。智力。第2369-409号决议(1994年)·doi:10.1613/jair.120
[16] H、 特征选择中的分类器集成方法,神经计算,419,97-107(2021)·doi:10.1016/j.neucom.2020.07.113
[17] M、 基于排序的剪枝在不平衡数据集框架下提高分类器集合性能,Inf.Sci。,354, 178-196 (2016) ·doi:10.1016/j.ins.2016.02.056
[18] J、 使用基于聚类的欠采样和增强C5进行乳腺癌诊断。0算法,Int.J.控制自动。系统。,19, 1998-2008 (2021) ·数字对象标识码:10.1007/s12555-019-1061-x
[19] Z、 不平衡数据文本分类的特征选择,ACM Sigkdd Explor。新闻。,6, 80-89 (2004) ·doi:10.1145/1007730.1007741
[20] S、 在人工神经网络中使用特征选择和参数优化的乳腺癌自动诊断。选举人。工程师,90,106958(2021)·doi:10.1016/j.compleceng.2020.106958
[21] P、 使用MobileNet V2和LSTM的深度学习神经网络对皮肤病进行分类,Sensors,21,2852(2021)·doi:10.3390/s21082852
[22] H、 一种基于多层特征提取的CNN-LSTM网络,用于从CT扫描和X射线图像中自动检测冠状病毒,应用。软计算。,113, 107918 (2021) ·doi:10.1016/j.asoc.2021.107918
[23] P、 基于P-范数的PCA特征提取,信息科学。,573, 345-359 (2021) ·Zbl 07775529号 ·doi:10.1016/j.ins.2021.05.079
[24] H、 乳房X光片中肿块的自动检测和分类方法,模式识别。,4, 646-668 (2006) ·doi:10.1016/j.patcog.2005.07.006
[25] T.Raeder,G.Forman,N.V.Chawla,《从不平衡数据中学习:评估问题》,摘自《数据挖掘:基础和智能范式》,Springer(2012),第315-331页。https://doi.org/10.1007/978-3-641-23166-7_12 ·兹比尔1231.68217
[26] S、 一种利用支持向量机增强不平衡数据集学习的综合信息少数过采样(SIMO)算法Decis。支持系统。,106, 15-29 (2018) ·文件编号:10.1016/j.dss.2017.11.006
[27] C、 RUSBoost:缓解阶级不平衡的混合方法,IEEE Trans。系统。人类网络。A部分:系统。Hum.,40,185-197(2009)·doi:10.1109/tsmca.2009.29559
[28] N、 一种用于乳腺癌诊断的新型智能分类模型,Inf.Process。管理。,56, 609-623 (2019) ·doi:10.1016/j.ipm.2018.10.1014
[29] S、 一种改进的基于随机森林的乳腺癌诊断规则提取方法,应用。软计算。,86, 105941 (2020) ·doi:10.1016/j.soc.2019.105941
[30] H、 基于支持向量机的乳腺癌诊断集成算法,Eur.J.Oper。研究,267687-699(年)·Zbl 1403.92109号 ·doi:10.1016/j.ejor.2017.12.001
[31] 五十、 装袋预测值,马赫。学习。,24, 123-140 (1996) ·Zbl 0858.68080号 ·doi:10.1007/BF00058655
[32] A、 AdaBoost CNN:卷积神经网络的自适应增强算法,用于使用迁移学习对多类不平衡数据集进行分类,神经计算,404351-366(2020)·doi:10.1016/j.neucom.2020.03.064
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。