×

机器学习方法用于人类诱导多能干细胞集落图像的自动质量识别。 (英语) Zbl 1423.92158号

摘要:本研究的重点是自动识别人类诱导多能干细胞(iPSC)集落图像的质量。iPS细胞技术是一种当代方法,通过这种方法,患者的细胞被重新编程为干细胞,并分化为所需的任何类型的细胞。例如,iPS细胞技术将在未来用于患者特异性药物筛选、疾病建模和组织修复。然而,在iPS细胞技术应用于实践之前,还有一些技术挑战,其中之一是对不断增长的iPSC菌落进行质量控制,这目前是手动完成的,但在大规模培养中是不可行的解决方案。监控问题又回到了图像分析和分类问题。在本文中,我们使用机器学习方法(如多类支持向量机)和几种基线方法以及基于缩放不变特征变换的特征来解决这个问题。我们执行了80多项测试安排参数值搜索。与早期研究相比,使用(k)-NN分类器获得了最佳分类准确率(62.4%)。

MSC公司:

92 C55 生物医学成像和信号处理
92-08 生物问题的计算方法
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 高桥,K。;Yamanaka,S.,通过特定因子从小鼠胚胎和成人成纤维细胞培养物中诱导多能干细胞,Cell,126,4,663-676(2006)·doi:10.1016/j.cell.2006.07.024
[2] 阿马比尔,G。;Meissner,A.,《诱导多能干细胞:再生医学的当前进展和潜力》,《分子医学趋势》,15,2,59-68(2009)·doi:10.1016/j.molmed.2008.12.003
[3] Yamanaka,S.,对iPS细胞的新认识,细胞,137,1,13-17(2009)·doi:10.1016/j.cell.2009.03.034
[4] 高桥,K。;Tanabe,K。;Ohnuki,M。;成田,M。;Ichisaka,T。;富田,K。;Yamanaka,S.,通过特定因子从成人成纤维细胞诱导多能干细胞,Cell,131,5,861-872(2007)·doi:10.1016/j.cell.2007.11.019
[5] 张杰。;Wilson,G.F。;Soerens,A.G。;Koonce,C.H。;Yu,J。;Palecek,S.P。;汤姆森,J.A。;Kamp,T.J.,源自人类诱导多能干细胞的功能性心肌细胞,循环研究,104,4,e30-e41(2009)·doi:10.1161/CIRCRESAHA.108.192237
[6] Zwi,L。;卡斯皮,O。;阿贝尔,G。;I.Huber。;Gepstein,A。;公园,I.-H。;Gepstein,L.,人诱导多能干细胞的心肌细胞分化,循环,120,1513-1523(2009)·doi:10.1161/CIRCULATIONAHA.109.868885
[7] 阿尔托-塞特阿勒,K。;康克林,B.R。;Lo,B.,获得对未来诱导多能干细胞研究的同意:机遇与挑战,PLoS生物学,7,2(2009)·doi:10.1371/journal.pbio.1000042
[8] Tokunaga,K。;Saitoh,N。;Goldberg,I.G。;坂本,C。;Yasuda,Y。;Yoshida,Y。;山中社。;Nakao,M.,《评估人类诱导多能干细胞的菌落和核形态的计算图像分析》,《科学报告》,第4期,第6996、1-7条(2014年)·doi:10.1038/srep06996
[9] 奥尔洛夫,N。;沙米尔,L。;马库拉,T。;Johnston,J。;埃克利,医学博士。;Goldberg,I.G.,WND-CHARM:使用复合图像变换的多用途图像分类,《模式识别字母》,29,11,1684-1693(2008)·doi:10.1016/j.patrec.2008.04.013
[10] 沙米尔,L。;奥尔洛夫,N。;Eckley,D.M。;马库拉,T。;Johnston,J。;Goldberg,I.G.,Wndchrm-一种用于生物图像分析的开源工具,《生物与医学源代码》,第3期,第13条(2008年)·doi:10.1186/1751-0473-3-13
[11] Jeffreys,C.G.,支持向量机和基于参数小波的干细胞图像纹理分类[M.S.论文](2004),美国马萨诸塞州剑桥市:麻省理工学院运筹中心
[12] 帕西,M。;Nanni,L。;拉赫蒂,A。;阿尔托-塞特阿勒,K。;Hyttinen,J.等人。;Severi,S.,《亚细胞和干细胞图像分类中纹理描述符的非二进制编码》,《当前生物信息学》,8,2,208-219(2013)·doi:10.2174/157489361130802009
[13] Gizatdinova,Y。;Rasku,J。;Haponen,M。;Joutsijoki,H。;巴尔丁,I。;帕西,M。;Hyttinen,J。;阿尔托-塞特阿勒,K。;Juhola,M.,《为iPSC群体图像分类研究局部空间增强结构和纹理描述符》,第36届IEEE医学和生物工程国际年会论文集·doi:10.10109/EMBC.2014.6944343
[14] Joutsijoki,H。;Haponen,M。;巴尔丁,I。;Rasku,J。;Gizatdinova,Y。;帕西,M。;Hyttinen,J。;阿尔托-塞特阿勒,K。;Juhola,M.,使用机器学习方法对iPSC群体图像进行基于直方图的分类,IEEE系统、人和控制论国际会议论文集(SMC’14)·doi:10.1109/smc.2014.6974321
[15] Joutsijoki,H。;Rasku,J。;哈波宁,M。;巴尔丁,I。;Gizatdinova,Y。;帕西,M。;Saarikoski,J。;瓦尔帕,K。;Siirtola,H。;阿尔瓦洛斯·萨格罗,J。;伊尔坦,K。;Laurikkala,J。;Penttinen,K。;Hyttinen,J。;阿尔托-塞特阿勒,K。;Juhola,M.,使用支持向量机的分层策略对iPSC群体图像进行分类,第五届IEEE计算智能和数据挖掘研讨会论文集(CIDM'14),IEEE·doi:10.1109/cidm.2014.7008152
[16] 普拉特,J.C。;北卡罗来纳州克里斯蒂安尼。;Shawe-Taylor,J.,用于多类分类的大幅度DAG,神经信息处理系统进展,547-553(2000)
[17] Lowe,D.G.,《尺度不变关键点的独特图像特征》,《国际计算机视觉杂志》,60,2,91-110(2004)·doi:10.1023/B:VISI.0000029664.99615.94
[18] Lowe,D.G.,从局部尺度不变特征识别物体,第七届IEEE计算机视觉国际会议论文集(ICCV’99)·doi:10.1109/ICCV.1999.790410
[19] 尼尔斯巴克,M.-E。;Zisserman,A.,《大量类别的自动花卉分类》,第六届印度计算机视觉、图形和图像处理会议论文集(ICVGIP’08)·doi:10.1109/icvgip.2008.47
[20] 尼克松,M.S。;Aguado,A.S.,《计算机视觉的特征提取与图像处理》(2012),英国牛津:学术出版社,英国牛津
[21] 沙佩尔,O。;哈夫纳,P。;Vapnik,V.N.,基于直方图的图像分类支持向量机,IEEE神经网络汇刊,10,5,1055-1064(1999)·数字对象标识代码:10.1109/72.788646
[22] 博图,L。;科尔特斯,C。;Denker,J。;Drucker,H。;盖恩,I。;Jackel,L。;LeCun,Y。;美国穆勒。;Sackinger,E。;西马德,P。;Vapnik,V.,《分类器方法的比较:手写数字识别的案例研究》,第12届IAPR国际模式识别会议论文集·doi:10.1109/icpr.1994.576879
[23] Cios,K.J。;佩德里茨,W。;Swiniarski,R.W。;Kurgan,L.A.,《数据挖掘:知识发现方法》(2007),美国纽约州纽约市:美国纽约州斯普林格·Zbl 1140.68056号
[24] 盖,T.M。;Hart,P.E.,最近邻模式分类,IEEE信息理论汇刊,13,1,21-27(1967)·Zbl 0154.44505号 ·doi:10.1109/tit.1967.1053964
[25] 共和国杜达。;哈特,体育。;Stok,D.G.,《模式分类》(2001),美国纽约州纽约市:John Wiley&Sons,美国纽约市·兹伯利0968.68140
[26] 密特拉五世。;Wang,C.-J。;Banerjee,S.,《文本分类:最小二乘支持向量机方法》,《应用软计算杂志》,7,3,908-914(2007)·doi:10.1016/j.asoc.2006.04.002
[27] Bittencourt,H.R。;Clarke,R.T.,《使用分类和回归树(CART)对遥感数字图像进行分类》,IEEE国际地球科学和遥感研讨会论文集(IGARSS’03)·doi:10.1109/IGARSS.2003.1295258
[28] 黄,J。;卢,J。;Ling,C.X.,将朴素贝叶斯、决策树和SVM与AUC和准确性进行比较,第三届IEEE数据挖掘国际会议论文集(ICDM’03)
[29] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习要素——数据挖掘、推理和预测》(2009),美国纽约州纽约市:斯普林格,纽约州纽约市·Zbl 1273.62005年
[30] T月。;Zausser,S。;马丁内斯,J.P。;拉梅多,M。;Poll,R.,通过特征选择优化心电图分类,IEEE生物医学工程学报,58,8,2168-2177(2011)·doi:10.1109/TBME.2011.2113395
[31] 谢军。;邱,Z.,不平衡数据集对LDA的影响:理论和实证分析,模式识别,40,2,557-562(2007)·Zbl 1118.68129号 ·doi:10.1016/j.patcog.2006.01.009
[32] Agresti,A.,《分类数据分析》(1990),美国纽约州纽约市:John Wiley&Sons,美国纽约市·Zbl 0716.62001号
[33] de Barros,A.P。;de Assis Tenório de Carvalho,法国。;de Andrade Lima Neto,E.,基于多项式logistic回归模型的区间值数据模式分类器,IEEE系统、人与控制论国际会议论文集(SMC’12)·doi:10.1109/icsmc.2012.6377781
[34] Lewis,D.D.,Naive(Bayes)at 40:信息检索中的独立性假设,《第十届欧洲机器学习会议论文集》,德国Chemnitz,1998年4月。第十届欧洲机器学习会议论文集,德国Chemnitz,1998年4月,人工智能讲义,1398,4-15(1998),德国柏林:德国柏林斯普林格
[35] Zhung,Y。;周,J.,《基于内容的音乐分类研究》,第七届信号处理及其应用国际研讨会论文集(ISSPA’03)·doi:10.1109/isspa.2003.1224828
[36] Debnath,R。;Takahide,N。;Takahashi,H.,多类支持向量机的基于决策的一对一方法,模式分析与应用,7,2,164-175(2004)
[37] 徐,C.-W。;Lin,C.-J.,多类支持向量机方法的比较,IEEE神经网络汇刊,13,2,415-425(2002)·doi:10.1109/72.991427
[38] Joutsijoki,H.(左)。;朱霍拉,M。;Perner,P.,DAGSVM vs.DAGKNN:利用底栖大型无脊椎动物数据集、模式识别中的机器学习和数据挖掘进行的实验案例研究。模式识别中的机器学习和数据挖掘,计算机科学课堂讲稿,7376,439-453(2012),德国柏林:施普林格,德国柏林·doi:10.1007/978-3642-31537-4_35
[39] 勒克纳,M。;Maino,G。;Foresti,G.L.,《基于类相似性减少DAGSVM中分类器的数量》,图像分析与处理-ICIAP 2011。图像分析与处理-ICIP 2011,计算机科学讲稿,6978,514-523(2011),美国纽约州纽约市:施普林格,纽约州纽约州纽约·doi:10.1007/978-3-642-24085-0_53
[40] 马丁内斯,J。;伊格莱西亚斯,C。;马蒂亚斯,J.M。;塔博达,J。;Araüjo,M.,使用基于SVM二进制分类器的DAGSVM多分类算法,采用一种综合方法解决石板瓦分类问题,应用数学与计算,230,464-472(2014)·Zbl 1410.62108号 ·doi:10.1016/j.amc.2013.12.087
[41] 加拉尔,M。;费尔南德斯,A。;Barrenechea,E。;Bustince,H。;Herrera,F.,《多类问题中二进制分类器集成方法概述:一对一和一对所有方案的实验研究》,模式识别,44,8,1761-1776(2011)·doi:10.1016/j.patcog.2011.01.017
[42] Joutsijoki,H。;Juhola,M.,《比较海底大型无脊椎动物图像分类中的一对一和一对所有方法》,《第七届机器学习和数据挖掘国际会议论文集》,美国纽约州纽约市,2011年8月至9月。第七届机器学习和数据挖掘国际会议论文集,2011年8月至9月,美国纽约州纽约市,人工智能讲义,6871,399-413(2011),德国柏林:施普林格,德国柏林
[43] 里夫金,R。;Klautau,A.,为一对多分类辩护,《机器学习研究杂志》,5101-141(2004)·Zbl 1222.68287号
[44] Krebel,U.,《成对分类和支持向量机》,《核方法的进展——支持向量学习》(1999),美国马萨诸塞州剑桥市:麻省理工学院出版社,麻省剑桥市,美国
[45] 弗兰克,E。;Kramer,S.,多类问题的嵌套二分法集合,第21届机器学习国际会议论文集
[46] Schwenker,F。;Palm,G。;Kittler,J。;Roli,F.,多类模式识别的树结构支持向量机,多分类器系统。多分类器系统,计算机科学课堂讲稿,2096,409-417(2001),德国柏林:施普林格,德国柏林·Zbl 0980.68869号 ·doi:10.1007/3-540-48219-941
[47] Van Gestel,T。;苏肯斯,J.A.K。;Baesens,B。;Viaene,S。;Vantheinen,J。;Dedene,G。;De Moor,B。;Vandewalle,J.,基准最小二乘支持向量机分类器,机器学习,54,1,5-32(2004)·Zbl 1078.68737号 ·doi:10.1023/b:machi.0000008082.80494.e0
[48] 苏肯斯,J.A.K。;Vandwalle,J.,最小二乘支持向量机分类器,《神经处理快报》,9,3,293-300(1999)·doi:10.1023/A:1018628609742
[49] 苏肯斯,J.A.K。;Vandewalle,J.,多类最小二乘支持向量机,国际神经网络联合会议论文集(IJCNN’99)
[50] 苏肯斯,J.A.K。;Van Gestel,T。;De Brabanter,J。;De Moor,B。;Vandewalle,J.,最小二乘支持向量机(2002),River Edge,新泽西州,美国:World Scientific,River Edge,新泽西,美国·Zbl 1003.68146号
[51] 尤贝伊,E.D.,《采用基于模型的方法系数分析脑电图信号的最小二乘支持向量机》,《应用专家系统》,37,1,233-239(2010)·doi:10.1016/j.eswa.2009.05.012
[52] Abe,S.,《模式识别的支持向量机》(2010),英国伦敦:英国伦敦施普林格出版社·Zbl 1191.68549号
[53] 科尔特斯,C。;Vapnik,V.,支持向量网络,机器学习,20,3,273-297(1995)·Zbl 0831.68098号 ·doi:10.1007/BF00994018
[54] Vapnik,V.N.,《统计学习理论的本质》(2000),纽约州纽约市,美国:斯普林格,纽约州,美国·兹比尔0934.62009 ·doi:10.1007/978-1-4757-3264-1
[55] Lorena,A.C。;德卡瓦略,A.C.P.L。;Gama,J.M.P.,《关于多类问题中二进制分类器组合的综述》,《人工智能评论》,30,1-4,19-37(2008)·doi:10.1007/s10462-009-9114-9
[56] Lei,H。;Govindaraju,V.,Half-Aganst-Half多类支持向量机,《第六届多分类器系统国际研讨会论文集》,美国加州海滨,2005年6月。第六届多分类器系统国际研讨会论文集,2005年6月,美国加州海滨,计算机科学讲稿,3541,156-164(2005),德国柏林:德国柏林斯普林格
[57] Joutsijoki,H.,《海底大型无脊椎动物图像分类中的半对抗多类支持向量机》,计算机与信息科学国际会议论文集(ICCIS’12),IEEE·doi:10.1109/iccisci.2012.6297281
[58] 张,X。;Yin,Y。;Huang,H.,使用渐进可导支持向量机进行半对抗多类文本分类,第一届信息科学与工程国际会议论文集(ICISE’09),IEEE·doi:10.1109/icise.2009.629
[59] 杨,X。;于清。;He,L。;Guo,T.,《用于多类分类的基于一对所有分区的二叉树支持向量机算法》,神经计算,113,3,1-7(2013)·doi:10.1016/j.neucom.2012.12.048
[60] 拉赫蒂,A.L。;Kujala,V.J。;查普曼,H。;科维斯托,A.-P。;Pekkanen-Mattila,M。;Kerkelä,E。;Hyttinen,J。;Kontula,K。;Swan,H。;康克林,B.R。;山中社。;西尔文诺宁,O。;Aalto-Setälä,K.,使用人类iPS细胞的长QT综合征2型模型在细胞培养中显示出致心律失常特征,DMM疾病模型和机制,5,2,220-230(2012)·doi:10.1242/dmm.008409
[61] Ojala,T。;Pietikäinen先生。;Harwood,D.,《纹理测量与基于特征分布的分类的比较研究》,模式识别,29,1,51-59(1996)·doi:10.1016/0031-3203(95)00067-4
[62] Ojala,T。;Pietikainen,M。;Harwood,D.,基于分布的Kullback判别分类的纹理度量性能评估,第12届模式识别国际会议论文集·doi:10.1109/icpr.1994.576366
[63] Vedaldi,A。;Fulkerson,B.,VLFeat:一个开放的便携式计算机视觉算法库
[64] 克鲁兹·罗阿(A.Cruz-Roa)。;Caicedo,J.C。;González,F.A.,《使用特征包在组织学图像集合中进行视觉模式挖掘》,《医学中的人工智能》,52,2,91-106(2011)·doi:10.1016/j.artmed.2011.04.010
[65] Csurka,G。;舞蹈,C.R。;范,L。;Willamowski,J。;Bray,C.,《带关键点包的视觉分类》,ECCV计算机视觉统计学习国际研讨会论文集
[66] 诺瓦克,E。;F.陪审团。;触发器,B。;A.莱昂纳迪斯。;比肖夫,H。;Pinz,A.,《袋式特征图像分类的采样策略》,计算机视觉-ECCV 2006。计算机视觉—ECCV 2006,计算机科学讲稿,3954,490-503(2006),德国柏林:德国柏林施普林格·doi:10.1007/11744085_38
[67] 刘,C.-L。;Nakashima,K。;Sako,H。;Fujisawa,H.,手写数字识别:最先进技术的基准测试,模式识别,36,102271-2885(2003)·Zbl 1054.68124号 ·doi:10.1016/s0031-3203(03)00085-2
[68] 斯塔特尼科夫,A。;沙马尔迪诺斯一世。;Dosbayev,Y。;Aliferis,C.F.,GEMS:从微阵列基因表达数据中自动诊断癌症和发现生物标记的系统,国际医学信息学杂志,74,7-8,491-503(2005)·doi:10.1016/j.ijmedinf.2005.05.002
[69] Statnikov,A。;王,L。;Aliferis,C.F.,《随机森林和支持向量机在基于微阵列的癌症分类中的综合比较》,BMC生物信息学,第9期,第319、1-10条(2008年)·doi:10.1186/1471-2105-9-319
[70] 瓦尔马,S。;Simon,R.,使用交叉验证进行模型选择时的误差估计偏差,BMC生物信息学,7,第91条(2006年)·doi:10.1186/1471-2105-7-91
[71] 吴杰。;刘,H。;段,X。;丁,Y。;Wu,H。;Bai,Y。;Sun,X.,使用具有杂交特征的随机森林模型预测氨基酸序列中蛋白质中的DNA结合残基,生物信息学,25,1,30-35(2009)·doi:10.1093/bioinformatics/btn583
[72] Joutsijoki,H。;迈斯纳,K。;Gabbouj,M。;Kiranyaz,S。;Raitoharju,J。;阿勒杰,J。;Kärkkäinen,S。;Tirronen,V。;Turpeinen,T。;Juhola,M.,评估人工神经网络在淡水底栖大型无脊椎动物分类中的性能,生态信息学,20,1-12(2014)·doi:10.1016/j.ecoin.2014.01.004
[73] 朱霍拉,M。;Siermala,V.,《数据和变量重要性评估的分散方法》,《综合计算机辅助工程》,第19、2、137-139页(2012年)·doi:10.3233/ICA-2011-0385
[74] 帕西,M。;Nanni,L。;Severi,S.,《基于不同纹理描述符的分类器集成用于纹理分类》,《沙特国王大学学报》,25,3,235-244(2013)·doi:10.1016/j.jksus.2012.12.001
[75] 张杰。;Marszałek,M。;拉泽布尼克,S。;Schmid,C.,《纹理和物体类别分类的局部特征和核:综合研究》,《国际计算机视觉杂志》,73,2,213-238(2007)·doi:10.1007/s11263-006-9794-4
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。