×

邻里函数和爬山策略专用于广义未映射局部多重对齐。 (英语) Zbl 1179.92023号

摘要:无间隙局部多重比对是生物信息学中广泛使用的一种方法。它大致包括在一组给定的核苷酸(DNA)或氨基酸(蛋白质)序列中定位一些可能从共同祖先进化而来的非重叠的固定大小因子(也称为出现)。除了广为人知的统计方法外,我们还从纯粹的组合优化的角度定义了这个问题,为这个问题的四个特定实例中的每一个定义了特定的邻域函数和爬山策略:
(1) 每个序列出现一次;(2) 每个序列最多出现一次;(3) 每个序列至少出现一次;以及(4)每个序列出现的次数。
该方法是在一个名为Nomad(多路线发现的邻域优化)的工具中实现的,web界面位于http://www.expasy.org/tools/olfam.html.

MSC公司:

92立方厘米 系统生物学、网络
90 C90 数学规划的应用
92碳40 生物化学、分子生物学
90C27型 组合优化

关键词:

模式发现
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿特伍德,T。;布拉德利,P。;花,D。;Gaulton,A。;Maudling,N。;米切尔,A。;莫尔顿,G。;Nordle,A。;潘恩,K。;泰勒,P。;A.乌丁。;Zygouri,C.,PRINTS及其自动补充,prePRINTS,核酸研究,31,1,400-402(2003)
[2] Bailey,T.L.,1993年。对齐生物聚合物序列的可能性与信息。加州大学圣地亚哥分校Ucsd技术报告cs93-318。;Bailey,T.L.,1993年。对齐生物聚合物序列的可能性与信息。Ucsd技术报告cs93-318,加利福尼亚大学圣地亚哥分校,加利福尼亚州拉霍亚。
[3] Bailey,T.L。;Elkan,C.,使用期望最大化对生物聚合物中多个基序的无监督学习,机器学习,21,1/2,51-80(1995)
[4] 贝特曼,A。;伯尼,E。;Cerruti,L。;杜宾,R。;Etwiller,L。;Eddy,S。;格里菲思-琼斯,S。;Howe,K。;马歇尔,M。;Sonnhammer,E.,Pfam蛋白质家族数据库,核酸研究,30,1,276-280(2002)
[5] Boeckmann,B。;Bairoch,A。;阿普韦勒,R。;布拉特,M.-C。;Estreicher,A。;Gasteiger,E。;Martin,M。;Michoud,K。;奥多诺万,C。;Phan,I。;皮尔布特,S。;Schneider,M.,《2003年SWISS-PROT蛋白质知识库及其补充TrEMBL》,核酸研究,31,365-370(2003)
[6] Bucher,P.,来自502个无关启动子的四种真核RNA聚合酶II启动子元件的重量矩阵描述,分子生物学杂志,212563-578(1990)
[7] 格拉斯,R。;埃尔南德斯,D。;埃尔南德斯,P。;Zangger,N。;梅斯卡姆,Y。;弗雷·J。;O·马丁。;尼古拉斯,J。;Appel,R.D.,探索蛋白质组数据的合作元启发式,《人工智能评论》,20,1-2,95-120(2003)
[8] 埃尔南德斯,D。;格拉斯,R。;Appel,R.D.,MoDEL:未映射局部多重比对的有效策略,计算生物学与化学,28,2,119-128(2004)·Zbl 1087.92025号
[9] 赫兹,G.Z。;Stormo,G.D.,《通过多序列的统计显著比对来识别DNA和蛋白质模式》,生物信息学,15563-577(1999)
[10] 休斯·J·D。;埃斯特普,P.W。;Tavazoie,S。;Church,G.M.,酿酒酵母中与功能相关基因群相关的顺式调节元件的计算鉴定,分子生物学杂志,296,5,1205-1214(2000)
[11] Kulback,S.,《信息理论与统计学》(1968年),多佛出版社:纽约多佛出版社
[12] 劳伦斯,C.E。;Altschul,S.F。;博古斯基,M.S。;Liu,J.S。;Neuwald,A.F。;Wootton,J.C.,《检测细微序列信号:多重比对的吉布斯采样策略》,《科学》,262208-214(1993)
[13] 劳伦斯,C.E。;Reilly,A.A.,用于识别和表征未对齐生物聚合物序列中常见位点的期望最大化(EM)算法,《蛋白质:结构、功能和遗传学》,第7期,第41-51页(1990年)
[14] Liu,X.,Brutlag,D.,Liu,J.,2001年。BioProspector:发现共表达基因上游调控区中的保守DNA基序。摘自:《太平洋生物计算研讨会论文集》(PSB 2001),第127-138页。;Liu,X.,Brutlag,D.,Liu,J.,2001年。BioProspector:发现共表达基因上游调控区中的保守DNA基序。摘自:《太平洋生物计算研讨会论文集》(PSB 2001),第127-138页。
[15] Neuwald,A.F。;Liu,J.S。;Lawrence,C.E.,Gibbs模体取样:细菌外膜蛋白重复的检测,蛋白质科学,1618-1632(1995)
[16] Rosinski,J.A。;Atchley,W.R.,螺旋转螺旋蛋白的分子进化,分子进化杂志,49,301-309(1999)
[17] Sigrist,C。;Cerutti,L。;北卡罗来纳州胡洛市。;加提克,A。;Falquet,L。;Pagni,M。;Bairoch,A。;Bucher,P.,PROSITE:使用模式和轮廓作为基序描述符的文档化数据库,《生物信息学简介》,第3265-274页(2002年)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。