×

使用NCI-60数据集预测抗癌治疗反应的遗传编程。 (英语) Zbl 1183.68461号

摘要:统计方法,特别是机器学习,在药物开发工作流程中的应用越来越多。在现有的机器学习方法中,我们特别关注遗传编程。我们提出了一个基于遗传编程的框架来预测抗癌治疗反应。我们使用NCI-60微阵列数据集,寻找基因表达与肿瘤药物氟尿嘧啶、氟达拉滨、氟尿苷和阿糖胞苷的反应之间的关系。我们的目的是通过活检的基因组测量来确定产生耐药性的可能性。实验结果以及它们与线性回归和最小二乘回归得到的结果的比较表明,遗传规划对于这种应用是一种很有前途的技术。此外,基因编程输出可能会突出显示基因之间的某些关系,从而支持识别有生物学意义的路径。本文介绍了遗传编程发现的“最佳”解决方案中更常见的结构。

MSC公司:

68T05型 人工智能中的学习和自适应系统
92 C50 医疗应用(通用)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿奇蒂,F。;梅西纳,E。;Lanzeni,S。;Vanneschi,L.,药物发现和开发中计算药代动力学的遗传编程,遗传编程和进化机器,8,4,17-26(2007)
[2] Brazma,A。;罗宾逊,A。;Cameron,G。;Ashburner,M.,微阵列数据的一站式商店,《自然》,403,6771,699-700(2000)
[3] Chi,Y。;Muntz,R.R。;Nijssen,S。;Kok,J.N.,频繁子树挖掘概述,基础信息学,66,1-2161-198(2005)·Zbl 1096.68044号
[4] 达尔文,C.,《自然选择的物种起源》(1859年),约翰·默里
[5] Das R,Mitra S,Banka H,Mukhopadhyay S.具有基因相互作用网络相关性的进化双聚类。领域:模式识别和机器智能。计算机科学课堂讲稿,第4815卷。柏林:施普林格;2007年,第416-24页。;Das R,Mitra S,Banka H,Mukhopadhyay S.基因相互作用网络相关的进化双聚类。领域:模式识别和机器智能。计算机科学课堂讲稿,第4815卷。柏林:施普林格;2007年,第416-24页。
[6] Dasgupta N,Lin SM,Carin L.NCI-60抗癌数据集的药物基因组学建模:利用核PLS将微阵列数据与治疗反应相关联。In:微阵列数据分析方法2。美国:施普林格;2002年,第151-67页。;Dasgupta N,Lin SM,Carin L.NCI-60抗癌数据集的药物基因组学建模:利用核PLS将微阵列数据与治疗反应相关联。In:微阵列数据分析方法2。美国:施普林格;2002年,第151-67页。
[7] Del Rio,M.,晚期结直肠癌患者的基因表达特征-选择药物和使用白细胞介素、氟尿嘧啶和伊立替康的反应,临床肿瘤学杂志,25,7,773-780(2007)
[8] Ross,D.T.,人类癌症细胞系中基因表达模式的系统变异,《自然遗传学》,24,3,227-235(2000)
[9] Zembutsu,H.,基因组cDNA微阵列筛选,将基因表达谱与85例人类肿瘤异种移植物对抗癌药物的敏感性相关联,癌症研究,62518-527(2002)
[10] Bianchini,M.,人类结直肠癌组织和正常粘膜中cDNA微阵列基因表达的比较研究,国际肿瘤学杂志,29,1,83-94(2006)
[11] Sherf,U.,癌症分子药理学的基因表达数据库,《自然遗传学》,24,3,236-244(2000)
[12] Ma,Y.,通过蛋白质组分析预测癌症药物反应,临床癌症研究,12,4583-4589(2006)
[13] GenBank。美国国立卫生研究院(NIH)基因序列数据库,2008年所有公开可用DNA序列的注释集合。请参阅\(\langle;\)http://www.ncbi.nlm.nih.gov/Genbank/\(\rangle;\);GenBank。美国国立卫生研究院(NIH)基因序列数据库,2008年所有公开可用DNA序列的注释集合。请参阅\(\langle;\)http://www.ncbi.nlm.nih.gov/Genbank/\(\rangle;\)
[14] Giordani I,Vanneschi L,Fersini E.通过基因编程模拟NCI-60抗癌数据集的微阵列数据与治疗反应之间的关系。在Alberghina L,Milanesi L,编辑,《2007年SysBioHealth研讨会论文集》,意大利米兰-比科卡大学,2007年10月17日至19日。Locomia Innovazione;2007年,第99-101页。;Giordani I,Vanneschi L,Fersini E.通过基因编程模拟NCI-60抗癌数据集微阵列数据与治疗反应之间的关系。在Alberghina L,Milanesi L,编辑,《2007年SysBioHealth研讨会论文集》,意大利米兰-比科卡大学,2007年10月17日至19日。Locomia Innovazione公司;2007年,第99-101页。
[15] Goldberg,D.E.,《搜索、优化和机器学习中的遗传算法》(1989),Addison-Wesley:Addison-Whesley Reading,MA·Zbl 0721.68056号
[16] Golub,T。;斯隆,D。;Tamayo,P。;华德,C。;加森贝克,M。;梅西洛夫,J.,《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》,2865439531-537(1999)
[17] Akaike,H.,《信息理论与最大似然原理的扩展》(第二届信息理论国际研讨会(1973年),Akademia Kiado:Akademia Kiado-Budapest)·Zbl 0283.62006号
[18] Holland,J.H.,《自然和人工系统中的适应》(1975年),密歇根大学出版社:密歇根州安阿伯市密歇根州立大学出版社
[19] Jolliffe IT。主成分分析。斯普林格统计学系列,第二版,柏林:斯普林格;1999.; Jolliffe IT。主成分分析。斯普林格统计学系列,第二版,柏林:斯普林格;1999
[20] Jirapech-Unpai,T。;Aitken,S.,微阵列数据分析的特征选择和分类:识别预测基因的进化方法,BMC生物信息学,6,1,148(2005)
[21] Keijzer M.用区间算术和线性标度改进符号回归。作者:Ryan C等,《基因编程》编辑,《第六届欧洲会议论文集》,2003年欧洲大奖赛,英国埃塞克斯,2003年4月14日至16日。计算机科学课堂讲稿,第2610卷。柏林:施普林格;2003年,第71-83页。;Keijzer M.用区间算术和线性标度改进符号回归。作者:Ryan C等,《基因编程》编辑,《第六届欧洲会议论文集》,2003年欧洲大奖赛,英国埃塞克斯,2003年4月14日至16日。计算机科学课堂讲稿,第2610卷。柏林:施普林格;2003年,第71-83页·Zbl 1033.68630号
[22] Keijzer,M.,标度符号回归,遗传编程和进化机器,5,3,259-269(2004)
[23] Koza,J.R.,《遗传编程》(1992年),麻省理工学院出版社:麻省剑桥·Zbl 0850.68161号
[24] Kulesh,博士。;克莱夫·D·R。;扎林加,D.S。;Greene,J.J.,《干扰素调节增殖相关cDNA序列的鉴定》,美国国家科学院学报,84,8453-8457(1987)
[25] Langdon WB,Banzhaf W.树木遗传规划中的重复模式。作者:Keijzer M等人,《基因编程》编辑,第八届欧洲会议,EuroGP2005。计算机科学课堂讲稿,第3447卷。柏林,海德堡,纽约:施普林格;2005年,第190-202页。;Langdon WB,Banzhaf W.树木遗传规划中的重复模式。作者:Keijzer M等人,《基因编程》编辑,第八届欧洲会议,EuroGP2005。计算机科学讲义,第3447卷。柏林,海德堡,纽约:施普林格;2005年,第190-202页。
[26] 兰登,W.B。;Poli,R.,《基因编程基础》(2002),施普林格:施普林格柏林,海德堡,纽约·Zbl 0993.68039号
[27] 拉什卡里,D.A。;De Risi,J.L。;Mc Cusker,J.H。;Namath,A.F。;Gentile,C。;Hwang,S.Y.,用于全基因组并行遗传和基因表达分析的酵母微阵列,美国国家科学院学报,9413057-13062(1997)
[28] Lecocke,M.L。;Hess,K.,《利用微阵列数据进行二进制分类中基于单变量和遗传算法的特征选择的实证研究》,《癌症信息学》,2313-327(2006)
[29] 洛克哈特·D·J。;Winzeler,E.A.,《基因组学、基因表达和DNA阵列》,《自然》,405,6788,827-836(2000)
[30] 霍尔MA。基于相关性的机器学习特征选择。博士论文。新西兰汉密尔顿:怀卡托大学计算机科学系;1998.; 霍尔MA。基于相关性的机器学习特征选择。博士论文。新西兰汉密尔顿:怀卡托大学计算机科学系;1998
[31] 密特拉,S。;Hayashi,Y.,《软计算的生物信息学》,IEEE系统、人与控制论汇刊,第C部分:应用与评论,36616-635(2006)
[32] 摩尔,J.H。;怀特,B.C.,《利用遗传编程进行全基因组遗传分析:对专家知识的迫切需要》(Riolo,R.L.;Soule,T.;Worzel,B.,《遗传编程理论与实践IV》,第5卷(2007年5月11日至13日),施普林格:施普林格-安阿伯),11-28
[33] 穆苏马拉,G。;康多雷利,D.F。;Scire,S。;Costa,A.S.,国家癌症研究所基因表达数据库多元分析中基因组尺度癌症药理学研究的捷径,生物化学药理学,62547-553(2001)
[34] NCBI。国家生物技术信息数据库中心,2008年。请参阅\(\langle;\)网址:http://www.ncbi.nlm.nih.gov/\(\rangle;\);NCBI。国家生物技术信息数据库中心,2008年。请参阅\(\langle;\)网址:http://www.ncbi.nlm.nih.gov/\(\rangle;\)
[35] Rousseeuw,P.J。;Leroy,A.M.,《稳健回归和异常值检测》(1987),威利:威利纽约·Zbl 0711.62030号
[36] 波利·R。;McPhee,N.F.,《子树交换交叉遗传编程的一般模式理论:第一部分,进化计算》,11,1,53-66(2003)
[37] 波利,R。;McPhee,N.F.,《子树交换交叉遗传规划的一般模式理论:第二部分,进化计算》,11,2,169-206(2003)
[38] NCI60癌症芯片项目。美国国家癌症研究所,马里兰州贝塞斯达,2008年。请参阅\(\langle;\)http://genome-www.stanford.edu/nci\(60/\范围;\);NCI60癌症芯片项目。国家癌症研究所,马里兰州贝塞斯达,2008年。请参阅\(\langle;\)http://genome-www.stanford.edu/nci\(60/\范围;\)
[39] Savinainen,K.J。;Linja,M.J。;萨拉马基,O.R。;Tammela,T.L。;Chang,G.T。;Brinkmann,A.O.,乳腺癌和前列腺癌中trps1、eif3s3和myc基因的表达和拷贝数分析,英国癌症杂志,90,5,1041-1046(2004)
[40] Schena,M。;沙龙,D。;Davis,R.W。;Brown,P.O.,用互补DNA微阵列定量监测基因表达模式,《科学》,270467-470(1995)
[41] Srivastava,M.,编码细胞色素b561的人类基因的基因组结构和表达,一种嗜铬颗粒膜的完整蛋白质,生物化学杂志,270,39,714-720(1995)
[42] 苏,Y。;Murali,T.M。;巴甫洛维奇,V。;Schaffer,M。;Kasif,S.,Rankgene:基于表达数据的诊断基因识别,生物信息学,19,12,1578-1579(2003)
[43] Vanneschi L.高效遗传编程的理论与实践。瑞士洛桑大学科学学院博士论文;2004.; Vanneschi L.高效遗传编程的理论与实践。瑞士洛桑大学科学学院博士论文;2004
[44] Langdon WB,Barrett SJ。药物发现数据挖掘中的遗传编程。数据挖掘中的进化计算2004:211-35。;Langdon WB,Barrett SJ。药物发现数据挖掘中的遗传编程。数据挖掘中的进化计算2004:211-35。
[45] 王洪秋。;Wong,H.S。;黄,D.S。;Shu,J.,提取用于癌症分类的基因调控信息,模式识别,40,12,3379-3392(2007)·兹比尔1122.68565
[46] 韦卡。怀卡托大学开发的多任务机器学习软件,2006年。参见\(\langle;\)www.cs.waikato.ac.nz/ml/weka\(\langle;\);韦卡。怀卡托大学开发的多任务机器学习软件,2006年。请参阅\(\langle;\)www.cs.waikato.ac.nz/ml/weka\(\langle;\)
[47] Eric P.Xing。;乔丹,迈克尔一世。;Karp,Richard M.,高维基因组微阵列数据的特征选择,(第18届机器学习国际会议论文集(2001),Morgan Kaufmann:Morgan Koufmann San Francisco,CA),601-608
[48] Yu,J。;Yu,J。;Almal,A.A。;Dhanasekaran,S.M。;Ghosh,D。;Worzel,W.P.,《利用基因编程对癌症进行特征选择和分子分类》,《肿瘤》,第9期,第4期,第292-303页(2007年)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。