×

使用马尔可夫最大阶模型和支持向量机预测聚合酶链反应的成功。 (英语) Zbl 1406.92194号

摘要:聚合酶链式反应(PCR)被誉为二十世纪不朽的科学技术之一,并已成为许多领域中常见且往往不可或缺的技术。然而,研究人员仍然经常发现一些DNA模板很难用PCR进行扩增,尽管已经采取了多种措施来优化扩增。事实上,在过去的几十年里,PCR的实验过程一直是人们关注的焦点,而对DNA模板(PCR实验对象本身)的分析几乎被忽视。到目前为止,没有人能够确定是否可以使用传统的基于Taq DNA聚合酶的PCR协议简单地扩增DNA片段。因此,迫切需要对DNA模板进行表征,然后开发一种可靠而有效的方法来预测PCR反应的成功。
在本研究中,我们利用马尔可夫最大阶模型构造了一个48-D特征向量来表示DNA模板。然后使用支持向量机(SVM)帮助评估PCR结果。为了检验预测因子的预期成功率,采用了折刀交叉验证测试。我们的方法的总准确率达到93.12%,具有敏感性、特异性和电动机控制中心分别为94.68%、91.58%和0.863%。

MSC公司:

92C40型 生物化学、分子生物学
68T05型 人工智能中的学习和自适应系统
60J20型 马尔可夫链和离散时间马尔可夫过程在一般状态空间(社会流动、学习理论、工业过程等)上的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 北巴斯卡兰。;Kandpal,R.P。;Bhargava,A.K。;Glynn,M.W。;贝尔,A。;Weissman,S.M.,具有不同GC含量的脱氧核糖核酸混合物的均匀扩增,《基因组研究》,第6期,第633-638页(1996年)
[2] 贝尼塔,Y。;Oosting,R.S。;Lok,M.C。;Wise,M.J.,模板DNA的区域化GC含量作为PCR成功的预测因子,《核酸研究》,31,e99(2003)
[3] Blaisdell,B.E.,《不需要序列比对的序列集的相似性度量》,Proc。国家。阿卡德。科学。,83, 5155-5159 (1986) ·Zbl 0592.92011号
[4] C.伯格。;坎贝尔,A.M。;Karlin,S.,DNA序列中短寡核苷酸的过表达和欠表达,Proc。国家。阿卡德。科学。,89, 4, 1358-1362 (1992)
[5] Chang,C.等人。;Lin,C.J.,Libsvm:支持向量机库,ACM Trans。智力。系统。技术。,2,3,1-27(2011年),(软件可在上获取)
[6] Chang C.,Lin C.J.,2014年。可在〈购买网址:http://www.csie.ntu.edu.tw/cjlin/libsvmtools/\9002;Chang C.,Lin C.J.,2014年。可在〈购买网址:http://www.csie.ntu.edu.tw/cjlin/libsvmtools/\9002
[7] Chen,W。;冯,P.M。;Lin,H。;Chou,K.C.,iRSpot-PseDNC:用伪二核苷酸成分识别重组点,《核酸研究》,41,6,e68(2013)
[8] Chenchik,A。;迪亚琴科,L。;莫卡丹,F。;塔拉比金,V。;卢基亚诺夫,S。;Siebert,P.D.,全长cDNA克隆和通过扩增适配体标记cDNA测定mRNA 5′端和3′端,生物技术,21,526-534(1996)
[9] Chou,K.C.,使用亚基偶联预测信号肽,蛋白质工程,14,75-79(2001)
[10] Chou,K.C。;Zhang,C.T.,《综述:蛋白质结构类的预测》,《生物化学评论》。分子生物学。,30, 275-349 (1995)
[11] 戴奇。;Wang,T.,蛋白质的(k)字统计度量的比较研究:从序列到“序列空间”,BMC Bioinf。,9, 394 (2008)
[12] 丁世勇。;李毅。;杨晓伟。;Wang,T.M.,DNA序列系统发育分析的简单k字区间法,J.Theor。生物学,317192-199(2013)
[13] Feng,Z.P.,基于氨基酸组成新表示法的原核蛋白质亚细胞位置预测,生物聚合物,58491-499(2001)
[14] 高,L。;齐,J。;Sun,J.D。;Hao,B.L.,《原核生物系统发育与分类:组成向量树与系统细菌学的详尽比较》,《科学》。中国,Ser。C生命科学。,50, 587-599 (2007)
[15] Ghosh,A。;Nandy,A.,蛋白质序列的图形表示和数学表征及其在病毒蛋白质中的应用,高级蛋白质化学。结构。生物学,83,1-42(2011)
[16] 哈斯,S。;温格伦,M。;Poustka,A。;Wiemann,S.,大规模测序的引物设计,核酸研究,263006-3012(1998)
[17] 郝,B.L。;齐,J。;Wang,B.,基于无序列比对的完整基因组的原核系统发育,Mod。物理。莱特。B、 17、1-4(2003)
[18] 他,P-an;Xia,L.,细菌群落中识别细菌的寡核苷酸图谱,Comb。化学。高通量筛查,10247-255(2007)
[19] 何,P.A。;Wang,J.,DNA一级序列的特征序列,J.Chem。Inf.计算。科学。,42, 5, 1080-1085 (2002)
[20] Innis,医学硕士。;Gelfand,D.H.,《PCR的优化》,(Innis,M.A.;Gelfand;D.H.;Sninsky,J.J.;White,T.J.,PCR协议(1990),学术出版社:美国纽约学术出版社),3-12
[21] 雅各布斯,B。;戈特盖贝尔,E。;Clement,L.,《方差分量对使用数字PCR绝对定量可靠性的影响》,BMC Bioinf。,15, 283 (2014)
[22] Karlin,S。;Burge,C.,《二核苷酸相对丰度极值:基因组特征》,《遗传学趋势》。,11, 283-290 (1995)
[23] Karlin,S。;Ladunga,I.,真核生物基因组序列的比较,Proc。国家。阿卡德。科学。,91, 12832-12836 (1994)
[24] Kleppe,K。;大冢,E。;Kleppe,R。;莫利纽斯,I。;Khorana,H.G.,多核苷酸研究。XCVI公司。DNA聚合酶催化修复短合成DNA的复制,分子生物学杂志。,56, 2, 341-361 (1971)
[25] 李,C。;Yang,Y。;贾博士。;Zhang,Y.Y。;于小强。;Wang,C.Z.,基于k-word和粗糙集理论的DNA序列系统发育分析,Physica A,398162-171(2014)·Zbl 1395.92100号
[26] Mardia,K.V。;Kent,J.T。;Bibby,J.M.,多元分析,322-381(1979),学术出版社:伦敦学术出版社·Zbl 0432.62029号
[27] Mullis,K.B.,《聚合酶链反应的不寻常起源》,《科学》。美国,262,4,56-61(1990),(64-65)
[28] 南迪,A。;Basak,S.C.,基于DNA序列的图形表示和数字表征的药物与DNA相互作用的新方法,Curr。计算。辅助药物设计。,6, 283-289 (2010)
[29] Pride,D.T。;Meineramann,R.J。;Wassenaar,T.M。;Blaser,M.J.,微生物基因组四核苷酸频率偏差的进化影响,基因组研究,13,145-158(2003)
[30] Qi,J。;王,B。;Hao,B.L.,无序列比对的全蛋白质组原核生物系统发育:字符串组成方法,分子生物学杂志。演变。,58,1-11(2004年)
[31] 邱伟荣。;Xiao,X。;Chou,K.C.,iRSpot-TNCPseAAC:用核苷酸成分和伪氨基酸成分识别重组点,国际分子科学杂志。,15, 2, 1746-1766 (2014)
[32] Randic,M。;Novic,M。;弗拉科,M。;Plavsic,D.,使用部分排序研究蛋白质组图谱,J.Theor。生物学,26621-28(2010)·Zbl 1407.92049号
[33] Randic,M。;弗拉科,M。;莱什,N。;Plavsić,D.,DNA序列的新型二维图形表示及其数值表征,化学。物理。莱特。,368, 1-6 (2003)
[34] Randic,M。;Zupan,J。;Balaban,A.T。;Vikic-Topic,D。;Plavsić,D.,蛋白质的图形表示,化学。版本111,790-862(2011)
[35] Randic,M。;Novic,M。;Plavsić,D.,《图形生物信息学里程碑》,国际量子化学杂志。,113, 2413-2446 (2013)
[36] 罗查,E.P。;维亚里,A。;Danchin,A.,寡核苷酸偏倚枯草芽孢杆菌:一般趋势和分类比较,《核酸研究》,26,12,2971-2980(1998)
[37] Rozen,S。;Skaletsky,H.,WWW上面向普通用户和生物学家程序员的Primer3,Methods Mol.Biol。,132, 365-386 (2000)
[38] Rychlik,W.,聚合酶链反应引物的选择,(White,B.A.,PCR协议:当前方法和应用,第15卷(1993),Humana出版社:新泽西州Humana Press Totowa),31-40
[39] Rychlik,W。;斯宾塞,W.J。;Rhoads,R.E.,DNA体外扩增退火温度的优化,核酸研究,18,6409-6412(1990)
[40] Saiki,R.K。;Gelfand,D.H。;斯托菲尔,S。;沙尔夫,S.J。;Higuchi,R。;霍恩,G.T。;Mullis,K.B.,用耐热DNA聚合酶对DNA进行引物定向酶扩增,《科学》,239487-491(1988)
[41] 斯坦瓦特,I。;Christmann,A.,支持向量机(2008),施普林格出版社:施普林格出版社,纽约·兹比尔1203.68171
[42] Vapnik,V.,《统计学习理论》(1998),威利出版社:纽约州威利出版社·兹比尔0935.62007
[43] 瓦拉达拉杰,K。;Skinner,D.M.,变性剂或共溶剂提高了使用基因工程DNA聚合酶对富含G+C的DNA进行PCR扩增的特异性,Gene,140,1-5(1994)
[44] Wang,H。;徐,Z。;高,L。;Hao,B.L.,基于82个完整基因组的真菌系统发育研究,使用合成向量方法,BMC Evol。生物学,195,1-13(2009)
[45] 吴晓明。;蔡,Z。;万,X。;黄,T。;Goebel,R。;Lin,G.H.,使用全基因组进行HIV-1亚型中的核苷酸组成字符串选择,生物信息学,23,14,1744-1752(2007)
[46] Xu,Y。;丁,J。;Wu,L.Y。;Chou,K.C.,iSNO-PseAAC:通过将位置特异性氨基酸倾向纳入伪氨基酸组成来预测蛋白质中的半胱氨酸S-亚硝基化位点,PLoS One,8,2,e55844(2013)
[49] 于小强。;Gao,H.Y。;郑晓强。;李,C。;Wang,J.,基于基因表达数据和序列信息预测拟南芥调控相互作用的计算方法,计算。生物化学。,51, 36-41 (2014)
[52] 张振中,孟丽玉,于晓庆,李灿,2009。基于ALE-index的算法有助于预测聚合酶链反应的成功。摘自:生物信息学和生物医学工程,ICBBE 2009,11-13,第1-6页。;张振中,孟丽玉,于晓庆,李灿,2009。基于ALE-index的算法有助于预测聚合酶链反应的成功。摘自:生物信息学和生物医学工程,ICBBE 2009,11-13,第1-6页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。