×

通过一种新的混合蚁群优化算法进行基因选择,用于高维数据中的癌症分类。 (英语) Zbl 1428.92045号

小结:微阵列数据分析的最新进展使得同时测量数千个基因的表达水平变得容易。这些水平可以用来区分癌组织和正常组织。在这项工作中,我们对癌症分类中的基因表达数据降维感兴趣,这是大多数微阵列数据分析研究中的常见任务。这种减少在提高分类任务的准确性和帮助生物学家准确预测体内癌症方面具有重要作用;这是通过选择相关基因的一个小子集并消除冗余或噪声基因来实现的。在这种情况下,我们提出了一种用于基因选择问题的混合方法(MWIS-ACO-LS),该方法基于一种新的基于图形的基因选择方法(MWIS)的组合,其中我们通过考虑基因之间的相关性和最大化基因秩分(Fisher)来最小化基因之间的冗余,以及一种改进的ACO与使用分类器(1\text{NN})的局部搜索(LS)算法耦合,用于测量候选子集的质量。为了评估所提出的方法,我们在10个复制良好的高维微阵列数据集上测试了MWIS-ACO-LS,这些数据集的基因从2308个到12600个不等。基于十个高维微阵列分类问题的实验结果证明了该方法的有效性。

MSC公司:

92 C50 医疗应用(通用)
92D10型 遗传学和表观遗传学
90 C59 数学规划中的近似方法和启发式
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 皮斯,A.C。;索拉斯·D·。;E.J.沙利文。;克罗宁,M.T。;霍姆斯,C.P。;Fodor,S.P.,用于快速DNA序列分析的光生成寡核苷酸阵列,美国国家科学院院刊,91,11,5022-5026(1994)·doi:10.1073/pnas.91.11.5022
[2] Schena,M。;沙龙,D。;Davis,R.W。;Brown,P.O.,用互补DNA微阵列定量监测基因表达模式,《科学》,2705235467-470(1995)·doi:10.1126/science.270.5235.467
[3] 库马里,B。;Swarnkar,T.,《大维度微阵列中过滤器与包装器特征子集选择:综述》,《国际计算机科学与信息技术杂志》,2011年第2期,第3期,第1048-1053页
[4] 李,S。;吴,X。;Tan,M.,使用混合粒子群优化和遗传算法进行基因选择,软计算,12,11,1039-1048(2008)·doi:10.1007/s00500-007-0272-x
[5] Kohavi,R。;John,G.H.,《特征子集选择的包装器》,人工智能,97,1-2,273-324(1997)·Zbl 0904.68143号 ·doi:10.1016/s0004-3702(97)00043-x
[6] Bir-Jmel,A。;杜伊里,S.M。;Elbernoussi,S.,《通过BPSO进行基因选择和癌症分类的后代》,RAIRO:Recherche Optionnelle,53,1(2019)·兹比尔1418.62388 ·doi:10.1051/ro/2018059
[7] Bonev,B。;埃斯科拉诺,F。;Cazorla,M.,《特征选择、互信息和高维模式的分类》,模式分析与应用,11,3-4,309-319(2008)·doi:10.1007/s10044-008-0107-0
[8] 贾法里,P。;Azuaje,F.,《最近发表的基因表达数据分析评估:报告实验设计和统计因素》,BMC医学信息与决策,6,1,27(2006)·doi:10.1186/1472-6947-6-27
[9] 顾奇。;李,Z。;Han,J.,特征选择的广义fisher分数,https://arxiv.org/abs/1202.3725
[10] 米什拉·D·。;Sahu,B.,《癌症分类的特征选择:信噪比方法》,国际科学工程研究杂志,2,4,1-7(2011)
[11] Shreem,S.S。;阿卜杜拉,S。;Nazri,M.Z.A。;Alzaqebah,M.,Hybrizing ReliefF,MRMR filters and GA wrapper approachs for gene selection,《理论与应用信息技术杂志》,46,2,1034-1039(2012)
[12] 吴,X。;库马尔,V。;Ross Quinlan,J.,《数据挖掘十大算法》,《知识与信息系统》,第14、1、1-37页(2008年)·doi:10.1007/s10115-007-0114-2
[13] Alizadeh,A.A。;艾森,M.B。;Davis,R.E.,通过基因表达谱确定的弥漫性大B细胞淋巴瘤的不同类型,《自然》,403,6769,503-511(2000)·doi:10.1038/35000501
[14] Golub,T.R。;Slonim,D.K。;Tamayo,P.,《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》,286,5439,531-537(1999)·doi:10.1126/science.286.5439.531
[15] Chiang,Y.M。;Chiang,H.M。;Lin,S.Y.,蚁群优化在基于微阵列的癌症分类中的基因选择应用,2008年机器学习和控制论国际会议论文集,IEEE
[16] 李毅。;王,G。;陈,H。;Shi,L。;秦,L.,一种基于蚁群优化的高维数据集降维方法,《生物工程杂志》,2013年第10期,第2期,第231-241页·doi:10.1016/s1672-6529(13)60219-x
[17] 沙巴夫,F.V。;Mosafer,S。;Moattar,M.H.,使用细胞学习自动机和蚁群优化进行微阵列数据分类的混合基因选择方法,基因组学,107,6,231-238(2016)·doi:10.1016/j.ygeno.2016.05.001
[18] Tabakhi,S。;莫拉迪,P。;Akhlaghian,F.,基于蚁群优化的无监督特征选择算法,人工智能工程应用,32,112-123(2014)·doi:10.1016/j.engappai.2014.03.007
[19] Tabakhi,S。;纳杰菲,A。;Ranjbar,R。;Moradi,P.,使用新型蚁群优化进行微阵列数据分类的基因选择,神经计算,1681024-1036(2015)·doi:10.1016/j.neucom.2015.05.022
[20] Yu,H。;顾,G。;刘,H。;沈杰。;赵,J.,一种用于肿瘤标记基因选择的改进蚁群优化算法,基因组学、蛋白质组学和生物信息学,7,4,200-208(2009)·doi:10.1016/s1672-0229(08)60050-9
[21] 阿加瓦尔,S。;Rajesh,R。;Ranjan,P.,FRBPSO:一种基于模糊规则的二进制粒子群优化算法,用于特征选择,印度国家科学院院刊a辑:物理科学,87,2,221-233(2017)·doi:10.1007/s40010-017-0347-8
[22] Chuang,L.-Y。;Chang,H.-W。;Tu,C.-J。;Yang,C.-H.,利用基因表达数据进行特征选择的改进二进制粒子群优化算法,计算生物学与化学,32,1,29-38(2008)·Zbl 1142.92319号 ·doi:10.1016/j.compbiochem.2007.09.005
[23] Chuang,L.-Y。;杨,C.-H。;Yang,C.-H.,使用微阵列数据进行特征选择的禁忌搜索和二进制粒子群优化,计算生物学杂志,16,121689-1703(2009)·doi:10.1089/cmb.2007.0211
[24] 穆罕默德,M.S。;南奥马图。;Deris,S。;Yoshioka,M.,用于从基因表达数据中选择信息基因小子集的改进二进制粒子群优化,IEEE生物医学信息技术汇刊,15,6,813-822(2011)·doi:10.1109/titb.2011.2167756
[25] 穆罕默德,M.S。;南奥马图。;Deris,S。;吉冈,M。;阿卜杜拉。;Ibrahim,Z.,《癌症分类中用于基因选择的二进制粒子群优化增强》,《分子生物学算法》,8,1,15(2013)·doi:10.1186/1748-7188-8-15
[26] 李,C.-P。;Leu,Y.,一种用于微阵列数据分析的新型混合特征选择方法,应用软计算,11,1,208-213(2011)·doi:10.1016/j.asoc.2009.11.010
[27] 帕蒂,S.K。;Das,A.K。;Ghosh,A.,《使用集成细胞自动机和粗糙集理论的多目标遗传算法进行基因选择》,计算机科学讲稿,瑞士查姆:瑞士查姆斯普林格
[28] 王,S。;孔,W。;曾伟。;Hong,X.,使用基因表达数据进行特征选择的混合二进制帝国主义竞争算法和禁忌搜索方法,生物医药研究国际,2016(2016)·doi:10.1155/2016/9721713
[29] 阿波罗尼,J。;Leguizamón,G。;Alba,E.,《应用于高维微阵列实验的两种混合包装过滤器特征选择算法》,应用软计算,38922-932(2016)·doi:10.1016/j.asoc.2015.10.037
[30] 多里戈,M。;马尼佐,V。;Colorni,A.,《蚂蚁系统:协作代理群体的优化》,IEEE系统汇刊,人与控制论,B部分(控制论),26,1,29-41(1996)·数字标识代码:10.1109/3477.484436
[31] Maniezzo,A.C.M.D.V.,《蚁群分布式优化,走向自治系统的实践:第一届欧洲人工生命会议论文集》,134(1992),马萨诸塞州剑桥,美国:Mit Press,马萨诸塞诸塞州坎布里奇,美国
[32] 阿马尔迪,E。;Kann,V.,关于线性系统中最小化非零变量或未满足关系的逼近性,理论计算机科学,209,1-2,237-260(1998)·Zbl 0915.68072号 ·doi:10.1016/s0304-3975(97)00115-1
[33] Dashtban,M。;Balafar,M。;Suravajhala,P.,使用新型生物激励多目标方法进行肿瘤分类的基因选择,基因组学,110,1,10-17(2017)·doi:10.1016/j.ygeno.2017.07.010
[34] Das,A.K。;Goswami,S。;查克拉巴蒂,A。;Chakraborty,B.,使用特征关联图进行监督和非监督分类的新混合特征选择方法,《应用专家系统》,88,81-94(2017)·doi:10.1016/j.eswa.2017.06.032
[35] 史J。;Malik,J.,标准化切割和图像分割,IEEE模式分析和机器智能汇刊,22,8,888-905(2000)
[36] 张,Z。;Hancock,E.R.,基于超图的信息理论特征选择,模式识别快报,33,15,1991-1999(2012)·doi:10.1016/j.patrec.2012.03.021
[37] 克拉夫扎尔,S。;Gutman,I.,顶点加权图的Wiener数及其化学应用,离散应用数学,80,173-81(1997)·Zbl 0889.05046号 ·doi:10.1016/s0166-218x(97)00070-x
[38] Sakai,S。;Togasaki,M。;Yamazaki,K.,关于最大加权独立集问题贪婪算法的注释,离散应用数学,126,2-3,313-322(2003)·Zbl 1013.90108号 ·doi:10.1016/s0166-218x(02)00205-6
[39] 帕尔达洛斯,P.M。;Xue,J.,最大团问题,《全局优化杂志》,4,3,301-328(1994)·Zbl 0797.90108号 ·doi:10.1007/bf01098364
[40] 赵伟。;王,G。;Wang,H.B。;Chen,H.L。;董,H。;赵志德,《基因选择的新框架》,《国际计算技术进步杂志》,2011年第3期,第184-191页
[41] 齐巴赫什,A。;Abadeh,M.S.,使用具有多视图适应度函数的新型模因算法进行癌症肿瘤检测的基因选择,《人工智能的工程应用》,26,4,1274-1281(2013)·doi:10.1016/j.engappai.2012.12.009
[42] Lai,C.-M。;Yeh,W.C。;Chang,C.-Y.,《利用信息增益和改进的简化群优化进行基因选择》,神经计算,218,331-338(2016)·doi:10.1016/j.neucom.2016.08.089
[43] M.U.Gerber。;赫兹,A。;Schindl,D.,无P5扩充图与最大稳定集问题,离散应用数学,132,1-3,109-119(2003)·Zbl 1029.05144号 ·doi:10.1016/s0166-218x(03)00394-9
[44] 薛,B。;张,M。;布朗,W.N。;Yao,X.,《特征选择的进化计算方法调查》,IEEE进化计算汇刊,20,4,606-626(2016)·doi:10.1109/tevc.2015.2504420
[45] Garey,M.R。;Johnson,D.S.,《计算机与不可处理性:NP-完备性理论指南》(1979年)·Zbl 0411.68039号
[46] 多里戈,M。;Di Caro,G.,《蚁群优化:一种新的元神经论》,《1999年进化计算大会论文集》·doi:10.1109/cec.1999.782657
[47] 多里戈,M。;Stutzle,T.,《蚁群优化》(2004),马萨诸塞州剑桥市,美国:麻省理工学院MIT出版社,马萨诸塞诸塞州坎布里奇市,美国·邮编1092.90066
[48] 多里戈,M。;Gambardella,L.M.,《蚁群系统:旅行推销员问题的合作学习方法》,IEEE Transactions on Evolutionary Computation,1,1,53-66(1997)·doi:10.1009/4235.585892
[49] 甘巴德拉,L.M。;泰拉德,É。D。;Dorigo,M.,二次分配问题的蚁群,运筹学学会杂志,50,2,167-176(1999)·Zbl 1054.90621号 ·doi:10.1057/palgrave.jors.2600676
[50] 杜伊里,S.M。;Elbernoussi,S.,求和着色问题下限的新蚁群优化算法,数学建模与算法杂志,11,2,181-192(2012)·Zbl 1263.90130号 ·doi:10.1007/s10852-012-9172-x
[51] 布伦海默,B。;Hartl,R.F。;Strauss,C.,车辆路径问题的改进蚂蚁系统算法,运筹学年鉴,89319-328(1999)·Zbl 0937.90125号 ·doi:10.1023/a:1018940026670
[52] Solnon,C.,Ants可以解决约束满足问题,IEEE进化计算汇刊,6,4,347-357(2002)·doi:10.1109/tevc.2002.802449
[53] 莱文,J。;Ducatelle,F.,垃圾箱包装和库存切割问题的蚁群优化和局部搜索,运筹学杂志,55,705-716(2004)·Zbl 1095.90122号 ·doi:10.1057/palgrave.jors.2601771
[54] 菲克斯,E。;Hodges,J.L.,《歧视性分析——非参数歧视:一致性属性》(1951),加利福尼亚州伯克利市,美国:加利福尼亚大学伯克利分校,美国·Zbl 0715.62080号
[55] 盖,T。;Hart,P.,最近邻模式分类,IEEE信息理论汇刊,13,1,21-27(1967)·Zbl 0154.44505号 ·doi:10.1109/tit.1967.1053964
[56] 安布罗斯,C。;McLachlan,G.J.,基于微阵列基因表达数据的基因提取中的选择偏差,国家科学院学报,99,10,6562-6566(2002)·Zbl 1034.92013年 ·doi:10.1073/pnas.102102699
[57] Zhu,Z。;Ong,Y.-S。;Dash,M.,使用模因框架的包装过滤器特征选择算法,IEEE系统、人与控制论汇刊,B部分(控制论),37,1,70-76(2007)·doi:10.1109/tsmcb.2006.883267
[58] Holland,J.,《人工和自然系统的适应》(1975),美国密歇根州安娜堡:密歇根大学出版社,美国密西西比州安娜布尔·Zbl 0317.68006号
[59] 科尔特斯,C。;Vapnik,V.,支持向量网络,机器学习,20,3,273-297(1995)·Zbl 0831.68098号 ·doi:10.1023/a:102627411411
[60] 普拉特,J.C。;北卡罗来纳州克里斯蒂亚尼尼。;Shawe-Taylor,J.,用于多类分类的大幅度DAG,神经信息处理系统进展论文集
[61] 佩德雷戈萨,F。;瓦罗佐,G。;Gramfort,A.,Scikit learn:Python中的机器学习,《机器学习研究杂志》,2011年10月12日,2825-2830·Zbl 1280.68189号
[62] Statnikov,A。;Aliferis,C.F。;沙马尔迪诺斯一世。;哈丁,D。;Levy,S.,微阵列基因表达癌症诊断多类别分类方法的综合评价,生物信息学,21,5,631-643(2004)·doi:10.1093/bioinformatics/bti033
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。