×

使用二进制量子粒子群优化和支持向量机进行癌症特征选择和分类。 (英语) Zbl 1359.92055号

摘要:本文主要研究癌症分类的特征基因选择,它采用优化算法来选择基因的子集。我们提出了一种用于癌症特征基因选择的二进制量子粒子群优化算法(BQPSO),以及用于癌症分类的耦合支持向量机(SVM)。首先,描述了所提出的BQPSO算法,它是用于二进制0-1优化问题的原始QPSO的离散化版本。然后,我们提出了基于BQPSO和带有leave-on-out交叉验证(LOOCV)的SVM的癌症特征基因选择和癌症分类的原理和步骤。最后,在白血病、前列腺、结肠、肺和淋巴瘤五个微阵列数据集上,对BQPSO耦合支持向量机(BQPSO/SVM)、二进制PSO耦合SVM(BPSO/SVM)和遗传算法耦合SVM进行特征基因选择和癌症分类测试。实验结果表明,BQPSO/SVM在准确性、鲁棒性和与其他两种算法相比,选择的特征基因数量。

MSC公司:

92 C50 医疗应用(一般)
第62页第10页 统计学在生物学和医学中的应用;元分析
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 皮斯,A.C。;索拉斯·D·。;E.J.沙利文。;克罗宁,M.T。;霍姆斯,C.P。;Fodor,S.P.A.,用于快速DNA序列分析的光生成寡核苷酸阵列,美国国家科学院学报,91,11,5022-5026(1994)·doi:10.1073/pnas.91.11.5022
[2] Zhao,Y。;王,G。;张,X。;于建新。;Wang,Z.,使用序列模型学习表型结构,IEEE知识与数据工程学报,26,3,667-681(2014)·doi:10.1109/tkde.2013.31
[3] Zhao,Y。;王,G。;李毅。;Wang,Z.,基于有趣的非冗余对比序列规则寻找新的诊断基因模式,第11届IEEE数据挖掘国际会议论文集(ICDM’11),IEEE·doi:10.1109/icdm.2011.68
[4] Zhao,Y。;于建新。;王,G。;Chen,L。;王,B。;Yu,G.,最大子空间共同调节基因聚类,IEEE知识与数据工程汇刊,20,1,83-98(2008)·doi:10.1109/tkde.2007.190670
[5] Golub,T.R。;Slonim,D.K。;Tamayo,P。;华德,C。;加森贝克,M。;梅西洛夫,J.P。;科勒,H。;Loh,M.L。;唐宁,J.R。;Caligiuri,医学硕士。;哥伦比亚特区布隆菲尔德。;Lander,E.S.,《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》,286,5439,531-537(1999)·doi:10.1126/science.286.5439.531
[6] Abdi,H。;Williams,L.J.,主成分分析,威利跨学科评论:计算统计学,2,4,433-459(2010)·doi:10.1002/wics.101
[7] 刘,Z。;陈,D。;Bensmail,H.,用核主成分分析进行基因表达数据分类,生物医学和生物技术杂志,2005,2155-159(2005)·doi:10.1155/JBB.2005.155
[8] 郑春华。;黄,D.-S。;孔,X.-Z。;赵晓明,利用一致性独立成分分析进行基因表达数据分类,基因组学、蛋白质组学和生物信息学,6,2,74-82(2008)·doi:10.1016/s1672-0229(08)60022-4
[9] 赵,S。;Lihui,C.,使用局部线性嵌入进行微阵列数据分析的特征降维,第三届亚太生物信息学会议论文集
[10] Nguyen,D.V。;Roke,D.M.,利用微阵列基因表达数据通过偏最小二乘法进行肿瘤分类,生物信息学,18,1,39-50(2002)·doi:10.1093/bioinformatics/18.1.39
[11] 张,S。;Jing,R.,基于修正最大边缘标准的肿瘤分类降维,第四届信息与计算国际会议论文集(ICIC’11)·doi:10.1109/icic.2011.148
[12] 郭毅。;哈斯蒂,T。;Tibshirani,R.,正则化线性判别分析及其在微阵列中的应用,生物统计学,8,1,86-100(2007)·Zbl 1170.62382号 ·doi:10.1093/biostatistics/kxj035
[13] 康德,L。;马特奥斯,A。;埃雷罗,J。;Dopazo,J.,无监督降维,然后用感知器进行监督学习,改善了DNA微阵列基因表达数据条件的分类,IEEE第12届信号处理神经网络研讨会论文集(NNSP’02)·doi:10.1109/nnsp.2002.1030019
[14] 马特奥斯,A。;埃雷罗,J。;Tamames,J.,通过聚类基因表达谱降低噪声后,监督DNA阵列数据中聚类条件的神经网络,微阵列数据分析方法II,91-103(2002),德国柏林:施普林格,德国柏林
[15] Kan,T。;Y.岛田。;佐藤,F。;Maeda,M。;Kawabe,A。;Kaganoi,J。;Itami,A。;山崎,S。;Imamura,M.,使用cDNA微阵列对人类食管癌进行基因表达谱分析,生物化学和生物物理研究通讯,286,4792-801(2001)·doi:10.1006/bbrc.2001.5400
[16] 贾法里,P。;Azuaje,F.,《对最近出版的基因表达数据分析的评估:报告实验设计和统计因素》,BMC医学信息与决策,第6、1页,第27条(2006年)·doi:10.1186/1472-6947-6-27
[17] Hall,M.A.,《基于相关性的机器学习特征选择》(1999),新西兰汉密尔顿:新西兰哈密尔顿怀卡托大学
[18] Wang,Y。;特科,I.V。;霍尔,医学硕士。;E.弗兰克。;法丘斯,A。;Mayer,K.F.X。;Mewes,H.W.,从微阵列数据中选择基因用于癌症分类——一种机器学习方法,计算生物学和化学,29,1,37-46(2005)·邮编1095.92040 ·doi:10.1016/j.compbiochem.2004.11.001
[19] 张杰。;刘,S。;Wang,Y.,SVM、MLP和交叉验证在疾病诊断中的基因关联研究,自然科学进展,18,6741-750(2008)·doi:10.1016/j.pnsc.2007.11.022
[20] 李玉霞。;刘庆杰。;阮晓刚,一种从肿瘤基因表达数据中提取知识的方法,电子学报,32,9,1479-1482(2004)
[21] 赖,Y。;吴,B。;Chen,L。;Zhao,H.,识别差异基因-基因共表达模式的统计方法,生物信息学,20,17,3146-3155(2004)·doi:10.1093/生物信息学/bth379
[22] 盖恩,I。;Elisseeff,A.,变量和特征选择简介,机器学习研究杂志,3,11,57-82(2003)
[23] Díaz-Uriarte,R。;de Andrés,s.A.,使用随机森林的基因选择和微阵列数据分类,BMC生物信息学,7,1,第3条(2006)·doi:10.1186/1471-2105-7-3
[24] 朱,J。;Hastie,T.,基因微阵列的惩罚logistic回归分类,生物统计学,5,3,427-443(2004)·Zbl 1154.62406号 ·doi:10.1093/biostatistics/kxg046
[25] 盖恩,I。;韦斯顿,J。;巴恩希尔,S。;Vapnik,V.,使用支持向量机进行癌症分类的基因选择,机器学习,46,1-3,389-422(2002)·Zbl 0998.68111号 ·doi:10.1023/a:1012487302797
[26] 李,L。;达顿,T.A。;温伯格,C.R。;莱文·A·J。;Pedersen,L.G.,使用遗传算法/k最近邻法对基因表达数据进行基因评估和样本分类,组合化学和高通量筛选,4,8,727-739(2001)·doi:10.2174/1386207013330733
[27] 张,H。;宋,X。;Wang,H.,基于二元粒子群优化和支持向量机的特征基因选择,计算机与应用化学,24,9,1159-1162(2007)
[28] 杜立勇,基于数据挖掘的决策树算法分析,吉林建筑工程学院学报,2014年第5期,第48-50页
[29] 刘,B。;崔,Q。;姜涛(Jiang,T.)。;Ma,S.,基因表达数据分类的组合特征选择和集成神经网络方法,BMC生物信息学,5,第136条(2004)·doi:10.1186/1471-2105-5-136
[30] 刘,H。;Motoda,H.,《特征提取、构造和选择:数据挖掘视角》(1998),纽约州纽约市,美国:斯普林格市,纽约州,美国·Zbl 0912.00012号
[31] E.阿尔巴。;加西亚·尼托,J。;Jourdan,L.公司。;Talbi,E.-G.,使用PSO/SVM和GA/SVM混合算法进行癌症分类中的基因选择,IEEE进化计算大会会议记录(CEC'07),IEEE·doi:10.1109/cec.2007.4424483
[32] 韦尔塔,E.B。;Duval,B。;Hao,J.-K.,基因选择和微阵列数据分类的混合GA/SVM方法,进化计算的应用。进化计算的应用,计算机科学讲义,390734-44(2006),德国柏林:施普林格,德国柏林
[33] 肯尼迪,J。;Eberhart,R.,粒子群优化,1995年IEEE神经网络国际会议论文集
[34] Sun,J。;冯,B。;Xu,W.,《具有量子行为的粒子群优化》,《进化计算大会论文集》(CEC’04)
[35] Sun,J。;徐伟(Xu,W.)。;Feng,B.,量子粒子群优化的全局搜索策略,IEEE控制论和智能系统会议论文集·doi:10.1010/ICCIS.2004.1460396
[36] Sun,J。;方,W。;吴,X。;帕拉德五世。;Xu,W.,《量子粒子群优化:单个粒子行为分析和参数选择》,进化计算,20,3,349-393(2012)·doi:10.1162/evcoa_00049
[37] Sun,J。;吴,X。;帕拉德五世。;方,W。;Lai,C.-H。;Xu,W.,量子粒子群优化的收敛分析与改进,信息科学,193,81-103(2012)·doi:10.1016/j.ins.2012.01.005
[38] Xi,M.L。;Sun,J。;Wu,Y.,带二进制编码的Quantum-haved粒子群优化,控制与决策,25,1,99-104(2010)
[39] 科尔特斯,C。;Vapnik,V.,支持向量网络,机器学习,20,3,273-297(1995)·Zbl 0831.68098号 ·doi:10.1007/BF00994018
[40] 顾,B。;Sheng,V.S。;王,Z。;Ho,D。;奥斯曼,S。;Li,S.,(ν)-支持向量回归的增量学习,神经网络,67,140-150(2015)·Zbl 1394.68286号 ·doi:10.1016/j.neunet.2015.03.013
[41] 顾,B。;Sheng,V.S.,用于支持向量分类的稳健正则化路径算法,IEEE神经网络和学习系统汇刊(2016)·doi:10.1109/tnnls.2016.527796
[42] 埃夫隆,B。;哈斯蒂,T。;约翰斯通,I。;Tibshirani,R.,最小角回归,《统计年鉴》,32,2,407-499(2004)·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[43] Chang,C.-C。;Lin,C.-J.,LIBSVM:支持向量机库,ACM智能系统与技术交易(TIST),2,3,第27条(2011年)·doi:10.145/1961189.1961199
[44] 杨安杰。;Song,X.-Y.,利用基因表达数据进行疾病分类的贝叶斯变量选择,生物信息学,26,2,215-222(2010)·doi:10.1093/bioinformatics/btp638
[45] 诺特曼,D.A。;阿龙,美国。;Sierk,A.J。;Levine,A.J.,用寡核苷酸阵列检测大肠腺瘤、腺癌和正常组织的转录基因表达谱,癌症研究,61,7,3124-3130(2001)
[46] Shailubhai,K。;Yu,H.H。;Karunanandaa,K。;Wang,J.Y。;Eber,S.L。;Wang,Y。;新南威尔士州Joo。;Kim,H.D。;Miedema,B.W。;阿巴斯,S.Z。;Boddupalli,S.S。;柯里,M.G。;Forte,L.R.,Uroguanylin治疗抑制Apc(Min/+)小鼠息肉的形成,并通过环状GMP诱导人结肠癌细胞凋亡,癌症研究,60,1855151-5157(2000)
[47] Yam,J.W.P。;Chan,K.W。;肖伟伟,通过表达新克隆的大鼠非肌凝蛋白重链B抑制突变p53转化的大鼠胚胎成纤维细胞的致瘤性,癌基因,20,1,58-68(2001)·doi:10.1038/sj.onc.1203982
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。