×

基于粗糙集理论的双目标遗传算法在疾病诊断中的重要基因选择。 (英文) Zbl 1409.90236号

Mandal,Jyotsna K.(编辑)等人,《多目标优化》。进化到混合框架。新加坡:Springer。279-298 (2018).
摘要:基因选择是生物信息学学科中的一种普遍现象,在生物信息学中,数据挖掘和知识创新在选择关于一些有用评估功能的最佳基因集方面发挥着重要作用。由于数据集的特性不同,基于单目标遗传算法的基因选择可能无法提供最佳解决方案。如果组合了多个目标函数,与依赖单个准则的算法相比,算法通常会提供更重要的基因。这里,将两个标准统一起来,提出了一种新的用于基因选择的双目标遗传算法,该算法在不牺牲任何有意义信息的情况下,有效地降低了海量基因数据集的维数。该方法使用非线性混合细胞自动机创建初始种群,并使用新的跳跃基因技术进行突变,以保持种群染色体的多样性。它探索了粗糙集理论和Kullback-Leibler散度技术,定义了两个性质冲突的适应度函数,并用于近似帕累托最优解集。该方法的最佳解决方案提供了用于疾病诊断的信息基因。创造下一代种群的替代策略基于关于这两个适应度函数的帕累托最优解。在公开获得的微阵列数据上的实验结果表明了所识别基因的重要性以及所提出的信息性基因选择机制的有效性。
关于整个系列,请参见[Zbl 1401.90021号].

MSC公司:

90摄氏度70 模糊及其他非随机不确定性数学规划
90C29型 多目标规划
90 C59 数学规划中的近似方法和启发式
92D20型 蛋白质序列,DNA序列

软件:

MOEA/D公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] U.Alon,N.Barkai,D.A.Notterman,K.Gish,S.Ybara,D.Mack,A.J.Levine,通过寡核苷酸阵列探测肿瘤和正常结肠组织的聚类分析揭示的广泛基因表达模式。PNAS 96、6745-6750(1999)·doi:10.1073/pnas.96.12.6745
[2] H.C.Causton,J.Quackenbush,A.Brazma,微阵列基因表达数据分析:初学者指南。遗传学。第82号决议,第151-153号决议(2003年)·doi:10.1017/S0016672303216438
[3] G.Chaconas,B.D.Lavoie,M.A.Watson,DNA转座:跳跃基因机器。货币。生物学6(7),817-820(1996)·doi:10.1016/S0960-9822(02)00603-6
[4] K.Deb,A.Pratap,S.Agarwal,T.A.Meyarivan,一种快速的精英多目标遗传算法:NSGA-II。IEEE传输。进化。公司。6(2), 182-197 (2002) ·数字对象标识代码:10.1109/4235.996017
[5] T.R.Golub、D.K.Slonim、P.Tamayo、C.Huard、M.Gaasenbeek、J.P.Mesirov、H.Coller、M.L.Loh、J.R.Downing、M.A.Caligiuri、C.D.Bloomfield、E.S.Lander,《癌症的分子分类:通过基因表达监测进行类别发现和预测》,《科学》286、531-537(1999)·doi:10.1126/science.286.5439.531
[6] D.E.Goldberg、J.H.Holland,《遗传算法和机器学习》。机器。学习。3(2), 95-99 (1988) ·doi:10.1023/A:1022602019183
[7] D.Gong,G.Wang,X.Sun,Y.Han,用于解决多目标优化问题的基于集合的遗传算法。软计算。19(6), 1477-1495 (2015) ·doi:10.1007/s00500-014-1284-y
[8] G.J.Gordon,R.V.Jensen,L.L.Xiao,S.R.Gullans,J.E.Blumenstock,S.Ramaswamy,W.G.Richards,D.J.Sugarbaker,R.Bueno,使用肺癌和间皮瘤中的基因表达比率将微阵列数据转换为临床相关癌症诊断测试。癌症研究62,4963-4967(2002)
[9] F.Gu,H.L.Liu,K.C.Tan,一种具有自适应多适应度分配的混合进化多目标优化算法。软计算。19(11), 3249-3259 (2015) ·doi:10.1007/s00500-014-1480-9
[10] A.M.Hall,基于相关性的机器学习特征选择,怀卡托大学,1999年
[11] J.Harmouche,C.Delpha,D.Diallo,Y.L.Bihan,使用Kullback-Leibler散度进行无损早期裂纹检测和表征的统计方法。IEEE传输。Reliab公司。65(3), 1360-1368 (2016) ·doi:10.1109/TR.2016.2570549
[12] J.E.Jackson,《主要组件用户指南》(Wiley,纽约,1991),ISBN 0-471-62267-2·兹比尔074362047
[13] S.Y.Jing,粗糙集理论中特征子集选择的混合遗传算法。软计算。18(7), 1373-1382 (2014) ·doi:10.1007/s00500-013-1150-3
[14] Kent Ridge生物医学数据集存储库,(n.d),http://datam.i2r.a-star.edu.sg/datasets/krbd/
[15] R.Kerber,ChiMerge:数值属性的离散化。在全国人工智能会议上,第123-128页(1992)
[16] J.D.Knowles,D.W.Corne,M-PAES:用于多目标优化的模因算法。IEEE进化计算大会会议记录,第325-332页(2000)
[17] S.Kullback,R.A.Leibler,《信息与充分性》。安。数学。《美国联邦法律大全》第22(1)卷,第79-86页(1951年)·Zbl 0042.38403号 ·doi:10.1214/aoms/1177729694
[18] Y.Leung,Y.Hung,一种用于基因选择和微阵列数据分类的多滤波器-多记录器方法。IEEE/ACM传输。计算。生物信息。7(1), 108-117 (2010)
[19] H.Maaranen,K.Miettinen,M.M.Makela,遗传算法的准随机初始种群。计算。数学。申请。47(12),1885-1895(2004),爱思唯尔·Zbl 1074.90036号
[20] J.V.Neumann,《自生自动机理论》,A.W.Burks编辑(美国伊利诺伊大学出版社,1996年)
[21] Z.Pawlak,粗糙集理论及其在数据分析中的应用。赛博。系统。29, 661-688 (1998) ·Zbl 1008.03526号 ·doi:10.1080/019697298125470
[22] M.Petrou,P.Bosdogianni,SVD示例。《图像处理:基本原理》(Wiley,2000),第37-44页
[23] K.Price,R.M.Storn,J.A.Lampinen,《差分进化:全局优化的实用方法》,自然计算系列(Springer,2005),ISBN:3540209506·Zbl 1186.90004号
[24] L.S.Santana,A.M.Canuto,用于选择集成系统中特征子集的基于过滤器的优化技术。专家系统。申请。41(4), 1622-1631 (2014) ·doi:10.1016/j.eswa.2013.08.059
[25] G.Schaefer,通过模糊和混合模糊方法对基因表达数据进行数据挖掘。IEEE传输。技术信息。生物识别。14(1),23-29(2010)
[26] P.Shelokar,A.Quirin,O.Cordón,MOSubdue:一种基于Pareto支配权的多目标细分算法,用于频繁子图挖掘。知识。信息系统。34(1), 75-108 (2013) ·doi:10.1007/s10115-011-0452-y
[27] M.A.Shipp、K.N.Ross、P.Tamayo、A.P.Weng、J.L.Kutok、R.C.T.Aguiar、M.Gaasenbeek、M.Angelo、M.Reich、T.R.Golub,通过基因表达谱和监督机器学习预测弥漫性大B细胞淋巴瘤的预后。国家。医学8(1),68-74(2002)·doi:10.1038/nm0102-68
[28] D.Singh、P.G.Febbo、K.Ross、D.G.Jackson、J.Manola、C.Ladd、P.Tamayo、A.A.Renshaw、J.P.Richie、E.S.Lander、M.Loda、T.R.Golub、W.R.Sellers,《基因表达与前列腺癌临床行为的相关性》。癌症细胞1,203-209(2002)·doi:10.1016/S1535-6108(02)00030-2
[29] L.J.Veer,H.Dai,M.J.Vijver,Y.D.He,Y.D.He,A.A.M.Hart,基因表达谱预测乳腺癌的临床结局。《自然》415530-536(2002)·doi:10.1038/415530a
[30] D.P.Waters,冯·诺依曼的自生自动机理论:生物化学的有用框架?生物化学5(1),5-15(2012)·doi:10.1007/s12304-011-9127-z
[31] 杨扬,J.O.Pedersen,文本分类中特征选择的比较研究。ICML 97、412-420(1997)
[32] Q.Zhang,H.Li,MOEA/D:基于分解的多目标进化算法。IEEE传输。进化。计算。11(6), 712-731 (2007) ·doi:10.1109/TEVC.2007.892759
[33] E.Zitzler,L.Thiele,《多目标进化算法:比较案例研究和强度帕累托方法》。IEEE传输。进化。计算。3(4), 257-271 (1999) ·doi:10.1109/4235.797969
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。