×

利用蛋白质“序列空间”统计模型预测高危型人乳头瘤病毒。 (英语) Zbl 1344.92081号

摘要:高危型人乳头瘤病毒的鉴别对宫颈癌的诊断和治疗具有重要意义。最近,基于蛋白质序列和结构信息提出了几种计算方法,但其相关蛋白质的信息直到现在才被使用。在本文中,我们建议使用蛋白质“序列空间”来探索这些信息,并将其用于预测高风险类型的HPV。该方法在68个已知HPV型和4个无HPV型样本上进行了测试,并与现有方法进行了进一步比较。结果表明,该方法在所有评价方法中取得了最好的性能,准确率为95.59%,F1-核为90.91%,这表明蛋白质“序列空间”可以潜在地用于改进高危型HPV的预测。

MSC公司:

92C50 医疗应用(通用)
92B15号机组 普通生物统计学
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Yim,E.-K。;Park,J.-S.,蛋白质组学在宫颈癌翻译研究中的作用,蛋白质组专家评论,3,1,21-36(2006)·doi:10.1586/14789450.3.1.21
[2] 佩拉尔塔·萨拉戈萨,俄亥俄州。;Bermúdez-Morales,V.H。;佩雷斯·普拉森西亚,C。;Salazar León,J。;哥梅斯·塞隆,C。;Madrid-Marina,V.,《宫颈癌靶向治疗:综述》,OncoTargets and Therapy,5315-328(2012)·doi:10.2147/ott.s25123
[3] 杰马尔,A。;布雷,F。;中心,M.M。;Ferlay,J。;Ward,E。;福曼,D.,《全球癌症统计》,加利福尼亚州:临床医生癌症杂志,61,2,69-90(2011)·doi:10.3322/caac.20107
[4] Formana,D。;德马特尔,C。;莱西,C.J。;Soerjomatarama,I。;Lorte-Tieunt,J。;布鲁尼,L。;维格纳特,J。;Ferlay,J。;布雷,F。;普卢默,M。;Franceschi,S.,《人类乳头瘤病毒和相关疾病的全球负担》,疫苗,30,F12-F23(2012)·doi:10.1016/j.疫苗.2012.07.055
[5] 博世,F.X。;马诺斯,M.M。;北穆尼奥斯。;谢尔曼,M。;Jansen,A.M。;佩托,J。;希夫曼,M.H。;莫雷诺,V。;库曼,R。;Shah,K.V。;Alihonou,E。;Bayo,S。;莫赫塔,H.C。;Chichareon,S。;Daudt,A。;De los Rios,E。;加迪里安,P。;Kitinya,J.N。;Koulibaly,M.,《宫颈癌中人乳头瘤病毒的流行:全球视角》,《国家癌症研究所杂志》,87,11,796-802(1995)·doi:10.1093/jnci/87.11.796
[6] 希夫曼,M.H。;鲍尔,H.M。;胡佛,R.N。;玻璃,A.G。;卡德尔,D.M。;拉什,B.B。;斯科特·D·R。;谢尔曼,M.E。;Kurman,R.J。;Wacholder,S。;斯坦顿,C.K。;Manos,M.M.,《流行病学证据表明人乳头瘤病毒感染导致大多数宫颈上皮内瘤变》,《国家癌症研究所杂志》,85,12,958-964(1993)·doi:10.1093/jnci/85.12.958
[7] Kim,S。;Eom,J.-H.,使用间隙谱核预测人类乳头瘤病毒风险类型,神经网络进展-ISNN 2006。神经网络进展-ISNN 2006,计算机科学讲稿,3973,710-715(2006),德国柏林:施普林格,德国柏林·doi:10.1007/11760191_104
[8] Pang,C.L。;Thierry,F.,《人类乳头瘤病毒蛋白质作为前瞻性治疗靶点》,《微生物发病机制》,58,55-65(2013)·doi:10.1016/j.micpath.2012.11.002
[9] Kim,S。;Zhang,B.-T.,使用支持向量机从蛋白质序列对人类乳头瘤病毒风险类型进行分类,进化计算的应用。进化计算的应用,计算机科学讲义,390757-66(2006),德国柏林:施普林格,德国柏林·doi:10.1007/11732242_6
[10] 哈迪奇,J。;Iftner,T.,《人乳头瘤病毒与癌症》,放射治疗与肿瘤学,108,397-402(2013)·doi:10.1016/j.radonc.2013.06.004
[11] 彭杰。;高,L。;郭杰。;王,T。;Wang,L。;姚,Q。;朱,H。;Jin,Q.,通过E6和L1基因分型对30种致癌人乳头瘤病毒进行类型特异性检测,临床微生物学杂志,51,2,402-408(2013)·doi:10.1128/jcm.01170-12
[12] Longworth,M.S。;Laimins,L.A.,人乳头瘤病毒在上皮分化中的发病机制,微生物学和分子生物学评论,68,2,362-372(2004)·doi:10.1128/mmbr.68.2.362-372.2004
[13] Kim,S。;Kim,J。;Zhang,B.-T.,基于蛋白质二级结构的人乳头瘤病毒风险类型预测的集成支持向量机,生物与医学中的计算机,39,2,187-193(2009)·doi:10.1016/j.compbiomed.2008.12.005
[14] 德维利尔斯,E.-M。;Fauquet,C。;经纪人T.R。;H.U·伯纳德。;Zur Hausen,H.,乳头瘤病毒分类,病毒学,324,1,17-27(2004)·doi:10.1016/j.virol.2004.03.033
[15] 明格尔,K。;鲍德温,A。;爱德华兹,K.M。;Hayakawa,H。;Nguyen,C.L。;M.欧文斯。;格雷斯,M。;Huh,K.,人乳头瘤病毒诱导肿瘤发生的机制,病毒学杂志,78,21,11451-11460(2004)·doi:10.1128/jvi.78.21.11451-1460.2004
[16] 艾德,M.L。;Debaque,H.,宫颈癌筛查中的HPV检测方法和基因分型技术,《病理年鉴》,32,6,e15-e23(2012)·doi:10.1016/j.annpat.2012.09.231
[17] Janicek,M.F。;Averette,H.E.,《宫颈癌:预防、诊断和治疗》,加州:临床医生癌症杂志,51,2,92-114(2001)·doi:10.3322/canjclin.51.2.92
[18] Kaspersen,医学博士。;Larsen,P.B。;Ingerslev,H.J。;Fedder,J。;彼得森,G.B。;邦德,J。;Höllsberg,P.,《从人类精子捐献者精子上识别多种HPV类型》,《公共科学图书馆·综合》,6,3(2011)·doi:10.1371/journal.pone.0018095
[19] 关,P。;豪厄尔·琼斯,R。;李,N。;布鲁尼,L。;圣何塞,S。;Franceschi,S。;Clifford,G.M.,《115789名HPV阳性女性的人乳头瘤病毒类型:从宫颈感染到癌症的荟萃分析》,《国际癌症杂志》,131,10,2349-2359(2012)·doi:10.1002/ijc.27485
[20] Furumoto,H。;Irahara,M.,《人乳头瘤病毒(HPV)与宫颈癌》,《医学调查杂志》,49,3-4,124-133(2002)
[21] 伯克·R·D。;Ho,G.Y.F。;比尔兹利,L。;Lempa,M。;彼得斯,M。;Bierman,R.,性行为和伴侣特征是年轻女性生殖器人乳头瘤病毒感染的主要风险因素,《传染病杂志》,174,4679-689(1996)·doi:10.1093/infdis/174.4.679
[22] 穆尼奥斯,N。;博世,F.X。;De Sanjosé,S。;Herrero,R。;卡斯特尔萨圭,X。;Shah,K.V。;斯奈杰德斯,P.J.F。;Meijer,C.J.L.M.,与宫颈癌相关的人乳头瘤病毒类型的流行病学分类,《新英格兰医学杂志》,348,6,518-527(2003)·doi:10.1056/nejmoa021641
[23] Eom,J.H。;帕克,S.B。;Zhang,B.T.,DNA序列结构的遗传挖掘用于人类乳头瘤病毒(HPV)风险类型的有效分类,神经信息处理:第十一届国际会议论文集,2004年ICONIP,印度加尔各答,2004年11月22日至25日。神经信息处理:第十一届国际会议论文集,ICONIP 2004,印度加尔各答,2004年11月22日至25日,计算机科学讲义,3316,1334-1343(2004),德国柏林:德国柏林斯普林格·doi:10.1007/978-3-540-30499-9_208
[24] Joung,J.-G。;俄亥俄州Sok June。;Zhang,B.-T.,用支持向量机预测人乳头瘤病毒的风险类型,第八届环太平洋国际人工智能会议论文集(PRICAI'04)
[25] Joung,J.-G。;6月,O.S。;Zhang,B.-T.,人类乳头瘤病毒基于蛋白质序列的风险分类,生物和医学中的计算机,36,6,656-667(2006)·doi:10.1016/j.compbiomed.2004.04.007
[26] 帕克,S.-B。;黄,S。;Zhang,B.-T.,AdaCost挖掘人类乳头瘤病毒(HPV)的风险类型,数据库和专家系统应用:第14届国际会议,DEXA 2003,捷克共和国布拉格,2003年9月1日至5日。诉讼程序。数据库和专家系统应用:第14届国际会议,DEXA 2003,捷克共和国布拉格,2003年9月1日至5日。计算机科学论文集,2736,403-412(2003),德国柏林:施普林格,德国柏林·Zbl 1028.68837号 ·doi:10.1007/978-3-540-45227-0_40
[27] Esmaeili,M。;Mohabatkar,H。;Mohsenzadeh,S.,使用周伪氨基酸组成的概念预测人类乳头瘤病毒的风险类型,理论生物学杂志,263,2,203-209(2010)·Zbl 1406.92455号 ·doi:10.1016/j.jtbi.2009.11.016
[28] Alemi,M。;Mohabatkar,H。;Behbahani,M.,《低风险和高风险人类乳头瘤病毒蛋白质的电子比较》,应用生物化学和生物技术,172,1188-195(2014)·doi:10.1007/s12010-013-0479-5
[29] Liao,B。;Chen,W。;太阳,X。;朱伟,RNA二级结构的二进制编码方法及其应用,计算化学杂志,30,14,2205-2212(2009)·doi:10.1002/jcc.21227
[30] Liao,B。;Wang,T.-M.,基于核苷酸碱基非重叠三联体的DNA序列相似性/差异性分析,化学信息与计算机科学杂志,44,5,1666-1670(2004)·doi:10.1021/ci034271f
[31] Zhang,Y。;Hao,J.K。;周,C.G。;Chang,K.,归一化Lempel-Ziv复杂性及其在生物序列分析中的应用,数学化学杂志,46,4,1203-1212(2009)·兹比尔1197.92020 ·数字对象标识代码:10.1007/s10910-008-9512-2
[32] Zhang,Y。;陈伟,基于2DD曲线的DNA序列不变量,理论生物学杂志,242,2382-388(2006)·Zbl 1447.92319号 ·doi:10.1016/j.jtbi.2006.03.012
[33] Blaisdell,B.E.,《不需要序列比对的序列集相似性度量》,美国国家科学院院刊,83,14,5155-5159(1986)·Zbl 0592.92011号 ·doi:10.1073/pnas.83.14.5155
[34] Wu,T.-J。;Burke,J.P。;Davison,D.B.,基于单词频率之间马氏距离的DNA序列差异性测量,《生物统计学》,53,4,1431-1439(1997)·Zbl 0931.62100号 ·doi:10.2307/2533509
[35] Wu,T.-J。;谢义忠。;Li,L.-A,碱基组成马尔可夫链模型下DNA序列相异性的统计测量,生物计量学,57,2441-448(2001)·Zbl 1209.62339号 ·doi:10.1111/j.0006-341x.2001.00441.x
[36] 斯图亚特,G.W。;莫菲特,K。;Baker,S.,未对齐全基因组蛋白质序列的综合基因和物种系统发育,生物信息学,18,1100-108(2002)·doi:10.1093/bioinformatics/18.1.100
[37] Pham,T.D.博士。;Zuegg,J.,《无比对序列比较的概率测度》,生物信息学,20,18,3455-3461(2004)·doi:10.1093/bioinformatics/bth426
[38] 吴,X。;万,X.-F。;Wu,G。;Xu博士。;Lin,G.,利用全基因组的完整特征信息和聚类邻接法进行系统发育分析,国际生物信息学研究与应用杂志,2,3,219-248(2006)·doi:10.1504/ijbra.2006.010602
[39] Apostolico,A。;Denas,O.,《通过穷举子串合成计算序列距离的快速算法》,《分子生物学算法》,3,1,第13条(2008年)·doi:10.1186/1748-7188-3-13
[40] 戴,Q。;Yang,Y.C。;Wang,T.M.,Markov模型加上k字分布:产生新的序列比较统计方法的协同作用,生物信息学,24,20,2296-2302(2008)·doi:10.1093/bioinformatics/btn436
[41] 卢,G。;张,S。;Fang,X.,用于序列比较的改进字符串合成方法,BMC生物信息学,9,6,文章S15(2008)·doi:10.1186/1471-2105-9-s6-s15
[42] 盖奇,J.R。;梅耶斯,C。;Wettstein,F.O.,非致癌人乳头瘤病毒6b型(HPV-6b)和致癌HPV-16的E7蛋白在视网膜母细胞瘤蛋白结合和其他特性方面不同,病毒学杂志,64,2723-730(1990)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。