×

使用基因表达数据选择肿瘤分类基因的混合粒子群优化和禁忌搜索方法。 (英语) Zbl 1142.92020年

摘要:基因表达数据的特征是仅在少数组织样本上检测到数千甚至数万个基因。这可能导致过拟合和维数诅咒,甚至导致微阵列数据分析的完全失败。基因选择是基于基因表达的肿瘤分类系统的重要组成部分。我们开发了一种用于肿瘤分类的基因选择的混合粒子群优化(PSO)和禁忌搜索(HPSOTS)方法。将禁忌搜索(TS)作为局部改进过程,使算法HPSOTS能够超越局部最优解,并显示出令人满意的性能。该方法应用于三个不同的微阵列数据集。此外,我们将HPSOTS在这些数据集上的性能与逐步选择、纯TS和PSO算法的性能进行了比较。已经证明,HPSOTS是基因选择和挖掘高维数据的有用工具。

MSC公司:

92 C50 医疗应用(通用)
92C40型 生物化学、分子生物学
92-08 生物学问题的计算方法

软件:

HykGene公司
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Alon,U.,通过寡核苷酸阵列探测的肿瘤和正常结肠组织的聚类分析揭示的广泛基因表达模式,Proc。国家。阿卡德。科学。美国,96,6745-6750(1999)
[2] 安布罗斯,C。;McLachlan,G.J.,基于微阵列基因表达数据的基因提取中的选择偏差,Proc。国家。阿卡德。科学。,99, 10, 6562-6566 (2002) ·Zbl 1034.92013年
[3] 比塞亚托,S。;Luchini,A。;Bello,C.D.,《利用基因表达数据分析多类癌症的PCA不相交模型》,生物信息学,19571-578(2003)
[4] 赵,J.H。;Lee,D。;Park,J.H。;Lee,I.B.,考虑类内变异的癌症亚型分类新基因选择方法,FEBS Lett。,551, 3-7 (2003)
[5] Clerc,M。;Kennedy,J.,《多维复杂空间中的粒子群爆炸、稳定性和收敛》,IEEE Trans。进化。计算。,6, 58-64 (2002)
[6] A.Dupuy。;Simon,R.M.,《已发表的癌症结果微阵列研究的评论和统计分析与报告指南》,J.Natl。癌症研究所,2,147-157(2007),17;99
[7] Furey,T。;北卡罗来纳州克里斯蒂亚尼尼。;达菲,N。;Bednarski,D。;舒默,M。;Haussler,D.,使用微阵列表达数据对癌症组织样本进行支持向量机分类和验证,生物信息学,16906-914(2000)
[8] Glover,F.,《整数编程的未来路径和与人工智能的联系》,计算。操作人员。研究,5533-549(1986)·Zbl 0615.90083号
[9] Golub,T.等人。;斯隆,D。;Tamayo,P。;华德,C。;加森贝克,M。;梅西洛夫,J。;科勒,H。;卢,M。;唐宁,J。;Caligiuri,M.,《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》,286531-537(1999)
[10] 盖恩,I。;韦斯顿,J。;巴恩希尔,S。;Vapnik,V.,使用支持向量机进行癌症分类的基因选择,马赫。学习。,46, 389-422 (2002) ·Zbl 0998.68111号
[11] 肯尼迪,J。;Eberhart,R.,粒子群优化,(IEEE第一届国际神经网络会议论文集。IEEE第一次国际神经网络大会论文集,澳大利亚珀斯(1995)),1942-1948
[12] Li,W.,The-more-The-better和The-less-The-bet,生物信息学,222187-2188(2006),18
[13] 李伟(Li,W.)。;Yang,Y.,判别微阵列数据分析需要多少基因?,(Lin,S.M.;Johnson,K.F.,《微阵列数据分析方法》(2002),Kluwer学术版),137-150
[14] 李·T。;张,C。;Ogihara,M.,《基于基因表达的组织分类特征选择和多类分类方法的比较研究》,生物信息学,20,2429-2437(2004)
[15] 李,L。;蒋伟(Jiang,W.)。;李,X。;Moser,K.L。;郭,Z。;杜,L。;王,Q。;Topol,E.J。;王,Q。;Rao,S.,用于提取最佳特征基因子集的遗传算法和支持向量机之间的稳健混合,《基因组学》,85,16-23(2005)
[16] Nguyen博士。;Roke,D.M.,利用基因表达谱的偏最小二乘法进行多类癌症分类,生物信息学,18,1216-1226(2002)
[17] Peng,S.H。;Xu,Q.H。;Ling,X.B。;彭,X.N。;杜,W。;Chen,L.B.,使用遗传算法和支持向量机组合从微阵列数据中对癌症类型进行分子分类,FEBS Lett。,555, 358-362 (2003)
[18] Schena,M。;沙龙,D。;Davis,R.W。;Brown,P.O.,用互补DNA微阵列定量监测基因表达模式,《科学》,270467-470(1995)
[19] 沈(音)。;Jing,J.H。;沈国良。;Yu,R.Q.,MLR和PLS建模中变量选择的改进粒子群优化算法:血管紧张素II拮抗剂拮抗作用的QSAR研究,欧洲药学杂志。,22, 145-152 (2004)
[20] 沈(音)。;Jing,J.H。;沈国良。;Yu,R.Q.,粒子群算法用于分段建模的最小生成树的优化划分:血管紧张素II拮抗剂拮抗作用的QSAR研究,J.Chem Inf.Comput。科学。,44, 2027-2031 (2004)
[21] 沈,Q,石,W.M.,孔伟,叶,B.X.,出版社。基于改进粒子群优化算法和支持向量机的Talanta基因选择和肿瘤分类。;沈,Q,石,W.M.,孔伟,叶,B.X.,出版社。结合改进的粒子群优化算法和支持向量机进行基因选择和肿瘤分类Talanta。
[22] Shi,Y。;Eberhart,R.,一种改进的粒子群优化器,(IEEE计算智能世界大会论文集(1998)),69-73
[23] 司马,C。;Dougherty,E.R.,《小样本环境下特征选择的预期结果》,生物信息学,222430-2436(2006),19
[24] 斯潘,R。;布兰切特,C。;Zuzan,H。;马克斯,J。;内文斯,J。;West,M.,《基因表达谱分析中的预测和不确定性》(Wingerder,E.;Hofestadt,R.,《德国生物信息学会议论文集》,布伦瑞克(2001))
[25] 斯蒂芬诺普洛斯,G。;黄,D。;施密特,W.A。;Misra,J.,从微阵列表达测量映射生理状态,生物信息学,18,1054-1063(2002)
[26] Tan,Y.X。;Shi,L。;Tong,W。;Hwang,G.G.T。;Wang,C.,利用微阵列基因表达数据和分类模型评估通过判别偏最小二乘法进行多类肿瘤分类,计算机。生物化学。,28, 235-244 (2004) ·Zbl 1088.92042号
[27] Tibshirani,R。;哈斯蒂,T。;Narasimhan,B。;Chu,G.,通过基因表达的收缩质心诊断多种癌症,Proc。国家。阿卡德。科学。,99, 10, 6567-6572 (2002)
[28] Wang,Y。;马克登,F.S。;福特,J.C。;Pearlman,J.,HykGene:使用微阵列基因表达数据选择表型分类标记基因的混合方法,生物信息学,21,8,1530-1537(2005)
[29] West,M.,《利用基因表达谱预测人类乳腺癌的临床状况》,Proc。国家。阿卡德。科学。美国,98,11467-11562(2001)
[30] 熊,M。;李伟(Li,W.)。;赵,J。;Jin,L。;Boerwinkle,E.,基于基因表达的肿瘤分类中的特征(基因)选择,分子遗传学。元数据。,73, 239-247 (2001)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。