跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
核酸研究。1997年9月1日;25(17): 3389–3402.
预防性维修识别码:项目经理146917
PMID:9254694

缺口BLAST和PSI-BLAST:新一代蛋白质数据库搜索程序。

摘要

BLAST程序是广泛使用的工具,用于搜索蛋白质和DNA数据库中的序列相似性。对于蛋白质比较,这里描述的各种定义、算法和统计改进允许BLAST程序的执行时间显著减少,同时增强它们对弱相似性的敏感性。触发单词点击扩展的新标准,结合生成间隙对齐的新启发式,产生了一个间隙BLAST程序,其运行速度大约是原始程序的三倍。此外,还引入了一种方法,用于自动将BLAST生成的具有统计意义的比对组合到特定位置的得分矩阵中,并使用该矩阵搜索数据库。生成的特定位置迭代BLAST(PSI-BLAST)程序每次迭代的运行速度与有间隙的BLAST大致相同,但在许多情况下,对微弱但生物相关的序列相似性更为敏感。PSI-BLAST用于揭示BRCT超家族的几个新的有趣成员。

全文

本文全文可作为PDF格式(205K)。

选定的引用

这些参考文献在PubMed中。这可能不是本文的完整参考文献列表。

  • Altschul SF、Gish W、Miller W、Myers EW、Lipman DJ。基本本地对齐搜索工具。分子生物学杂志。1990年10月5日;215(3):403–410.[公共医学][谷歌学者]
  • Pearson WR,Lipman DJ。生物序列比较的改进工具。美国国家科学院院刊。1988年4月;85(8):2444–2448. [PMC免费文章][公共医学][谷歌学者]
  • Altschul SF,Gish W.局部线形统计。方法酶制剂。1996;266:460–480.[公共医学][谷歌学者]
  • Chao KM,Pearson WR,Miller W.在指定的对角线带内对齐两个序列。计算应用生物科学。1992年10月;8(5):481–487.[公共医学][谷歌学者]
  • Altschul SF,Erickson BW。使用非线性相似函数的局部最优子对准。公牛数学生物学。1986;48(5-6):633–660.[公共医学][谷歌学者]
  • Waterman MS,Eggert M.一种用于tRNA-rRNA比较的最佳子序列比对的新算法。分子生物学杂志。1987年10月20日;197(4):723–728.[公共医学][谷歌学者]
  • Karlin S,Altschul旧金山。使用通用评分方案评估分子序列特征统计显著性的方法。美国国家科学院院刊。1990年3月;87(6):2264–2268. [PMC免费文章][公共医学][谷歌学者]
  • Altschul旧金山。从信息论的角度看氨基酸取代矩阵。分子生物学杂志。1991年6月5日;219(3) :555–565。 [PMC免费文章][公共医学][谷歌学者]
  • Altschul旧金山。蛋白质比对评分系统对所有进化距离都敏感。分子进化杂志。1993年3月;36(3):290–300.[公共医学][谷歌学者]
  • Smith TF,Waterman MS,Burks C.核酸相似性的统计分布。核酸研究。1985年1月25日;13(2):645–656. [PMC免费文章][公共医学][谷歌学者]
  • Collins JF,Coulson AF,Lyall A.蛋白质序列相似性的意义。计算应用生物科学。1988年3月;4(1):67–71.[公共医学][谷歌学者]
  • Henikoff S、Henikoft JG。蛋白质块的氨基酸替代矩阵。美国国家科学院院刊。1992年11月15日;89(22):10915–10919. [PMC免费文章][公共医学][谷歌学者]
  • Wilbur WJ,Lipman DJ。核酸和蛋白质数据库的快速相似性搜索。美国国家科学院院刊。1983年2月;80(3):726–730. [PMC免费文章][公共医学][谷歌学者]
  • Robinson AB,Robinson LR。谷氨酰胺和天冬酰胺残基及其近邻在肽和蛋白质中的分布。美国国家科学院院刊。1991年10月15日;88(20):8880–8884. [PMC免费文章][公共医学][谷歌学者]
  • Karlin S,Altschul旧金山。分子序列中多个高得分片段的应用和统计。美国国家科学院院刊。1993年6月15日;90(12):5873–5877. [PMC免费文章][公共医学][谷歌学者]
  • Needleman SB,Wunsch CD。一种适用于搜索两种蛋白质氨基酸序列相似性的通用方法。分子生物学杂志。1970年3月;48(3):443–453.[公共医学][谷歌学者]
  • Smith TF,Waterman MS。常见分子子序列的识别。分子生物学杂志。1981年3月25日;147(1):195–197.[公共医学][谷歌学者]
  • Bairoch A,Apweiler R.SWISS-PROT蛋白质序列数据库及其补充TrEMBL。核酸研究。1997年1月1日;25(1):31–36. [PMC免费文章][公共医学][谷歌学者]
  • Jou WM、Verhoeyen M、Devos R、Saman E、Fang R、Huylebroeck D、Fiers W、Threlfall G、Barber C、Carey N等。根据克隆DNA测定的人类流感A/Victoria/3/75(H3N2)株血凝素基因的完整结构。细胞。1980年3月;19(3):683–696.[公共医学][谷歌学者]
  • McLachlan AD。肌球蛋白棒中基因重复的分析。分子生物学杂志。1983年9月5日;169(1):15–30.[公共医学][谷歌学者]
  • Staden R.在核酸序列中定位信号的计算机方法。核酸研究。1984年1月11日;12(第1部分第2部分):505–519。 [PMC免费文章][公共医学][谷歌学者]
  • Schneider TD、Stormo GD、Gold L、Ehrenfeucht A.核苷酸序列上结合位点的信息含量。分子生物学杂志。1986年4月5日;188(3):415–431.[公共医学][谷歌学者]
  • 泰勒WR。通过一致模板比对鉴定蛋白质序列同源性。分子生物学杂志。1986年3月20日;188(2):233–258.[公共医学][谷歌学者]
  • Berg OG,von Hippel PH.通过调节蛋白选择DNA结合位点。统计力学理论及其在运营商和推广商中的应用。分子生物学杂志。1987年2月20日;193(4):723–750.[公共医学][谷歌学者]
  • 多德IB,伊根JB。蛋白质中潜在lambda Cro-like DNA结合区的系统检测方法。分子生物学杂志。1987年4月5日;194(3):557–564.[公共医学][谷歌学者]
  • Gribskov M,McLachlan AD,Eisenberg D。剖面分析:远端相关蛋白的检测。美国国家科学院院刊。1987年7月;84(13):4355–4358. [PMC免费文章][公共医学][谷歌学者]
  • Patthy L.用一致序列检测远缘相关蛋白的同源性。分子生物学杂志。1987年12月20日;198(4):567–577.[公共医学][谷歌学者]
  • Stormo GD,Hartzell GW.,《从未对齐DNA片段中识别蛋白质结合位点》,第3期。美国国家科学院院刊。1989年2月;86(4):1183–1187. [PMC免费文章][公共医学][谷歌学者]
  • Tatusov RL,Altschul SF,Koonin EV.蛋白质中保守片段的检测:用比对块迭代扫描序列数据库。美国国家科学院院刊。1994年12月6日;91(25):12091–12095. [PMC免费文章][公共医学][谷歌学者]
  • Yi TM,Lander ES。通过迭代模板优化(ITR)识别相关蛋白质。蛋白质科学。1994年8月;(8):1315–1328. [PMC免费文章][公共医学][谷歌学者]
  • Henikoff S、Henikoft JG。嵌入有效利用多序列比对信息的策略。蛋白质科学。1997年3月;6(3) :698–705。 [PMC免费文章][公共医学][谷歌学者]
  • Bucher P,Karplus K,Moeri N,Hofmann K。基于广义轮廓的柔性基序搜索技术。计算机化学。1996年3月;20(1):3–23.[公共医学][谷歌学者]
  • Lawrence CE、Altschul SF、Boguski MS、Liu JS、Neuwald AF、Wootton JC。检测细微序列信号:多重比对的吉布斯采样策略。科学。1993年10月8日;262(5131):208–214.[公共医学][谷歌学者]
  • Altschul SF、Carroll RJ、Lipman DJ。树相关数据的权重。分子生物学杂志。1989年6月20日;207(4) :647–653。[公共医学][谷歌学者]
  • Sibbald PR,Argos P.加权对齐的蛋白质或核酸序列,以纠正不相等的表示。分子生物学杂志。1990年12月20日;216(4):813–818.[公共医学][谷歌学者]
  • Sander C,Schneider R.同源衍生蛋白质结构数据库和序列比对的结构意义。蛋白质。1991;9(1):56–68.[公共医学][谷歌学者]
  • Gerstein M,Sonnhammer EL,Chothia C.蛋白质进化中的体积变化。分子生物学杂志。1994年3月4日;236(4):1067–1078.[公共医学][谷歌学者]
  • Henikoff S、Henikoft JG。基于位置的序列权重。分子生物学杂志。1994年11月4日;243(4):574–578.[公共医学][谷歌学者]
  • Thompson JD、Higgins DG、Gibson TJ。通过使用序列权重和间隙消除提高了轮廓搜索的灵敏度。计算应用生物科学。1994年2月;10(1):19–29.[公共医学][谷歌学者]
  • Eddy SR,Mitchison G,Durbin R.序列一致性的最大判别隐马尔可夫模型。计算机生物学杂志。1995年春季;2(1):9–23.[公共医学][谷歌学者]
  • Gotoh O.用于对齐许多系统发育相关序列的加权系统和算法。计算应用生物科学。1995年10月;11(5):543–551.[公共医学][谷歌学者]
  • Henikoff JG,Henikoft S.使用替代概率改进位置特定评分矩阵。计算应用生物科学。1996年4月;12(2):135–143.[公共医学][谷歌学者]
  • Brown M,Hughey R,Krogh A,Mian IS,Sjölander K,Haussler D.使用Dirichlet混合先验来推导蛋白质家族的隐马尔可夫模型。Proc Int Conf智能系统分子生物学。1993;1:47–55。[公共医学][谷歌学者]
  • Sjölander K、Karplus K、Brown M、Hughey R、Krogh A、Mian IS、Haussler D.Dirichlet混合物:一种改进检测微弱但重要蛋白质序列同源性的方法。计算应用生物科学。1996年8月;12(4) :327–345。[公共医学][谷歌学者]
  • Altschul SF、Boguski MS、Gish W、Wootton JC。搜索分子序列数据库中的问题。自然遗传学。1994年2月;6(2):119–129.[公共医学][谷歌学者]
  • Benson DA、Boguski MS、Lipman DJ、Ostell J.GenBank。核酸研究。1997年1月1日;25(1):1–6. [PMC免费文章][公共医学][谷歌学者]
  • Holm L,Sander C.新结构——新褶皱?结构。1997年2月15日;5(2):165–171.[公共医学][谷歌学者]
  • Ohta M、Inoue H、Cotticelli MG、Kastury K、Baffa R、Palazzo J、Siprashvili Z、Mori M、McCue P、Druck T等。FHIT基因跨越染色体3p14.2脆性位点和肾癌相关T(3;8)断点,在消化道癌中异常。细胞。1996年2月23日;84(4):587–597.[公共医学][谷歌学者]
  • Heidenreich RA、Mallee J、Segal S.大鼠半乳糖-1-磷酸尿苷转移酶编码序列、转录起始位点和基因组组织。DNA序列。1993;(5):311–318.[公共医学][谷歌学者]
  • Maskell DJ、Szabo MJ、Deadman ME、Moxon ER。流感嗜血杆菌的gal基因座:克隆、测序和利用gal突变体研究脂多糖。摩尔微生物。1992年10月;6(20):3051–3063.[公共医学][谷歌学者]
  • Plateau P、Fromant M、Schmitter JM、Buhler JM、Blanket S.编码酵母二腺苷5'、5''-P1、P4-四磷酸磷酸化酶的APA1基因的分离、表征和失活。细菌杂志。1989年12月;171(12):6437–6445. [PMC免费文章][公共医学][谷歌学者]
  • Koonin EV、Altschul SF、Bork P.BRCA1蛋白质产品。。。功能图案。。。自然遗传学。1996年7月;13(3):266–268.[公共医学][谷歌学者]
  • Bork P、Hofmann K、Bucher P、Neuwald AF、Altschul SF、Koonin EV。DNA损伤反应性细胞周期检查点蛋白中保守结构域的超家族。美国财务会计准则委员会J。1997年1月;11(1):68–76.[公共医学][谷歌学者]
  • Callebaut I,Mornon JP。从BRCA1到RAP1:广泛存在的与DNA修复密切相关的BRCT模块。FEBS信函。1997年1月2日;400(1):25–30.[公共医学][谷歌学者]
  • Miki Y、Swensen J、Shattuck-Eidens D、Futreal PA、Harshman K、Tavtigian S、Liu Q、Cochran C、Bennett LM、Ding W等。乳腺癌和卵巢癌易感基因BRCA1的强候选基因。科学。1994年10月7日;266(5182):66–71.[公共医学][谷歌学者]
  • Wu LC,Wang ZW,Tsan JT,Spillman MA,Phung A,Xu XL,Yang MC,Hwang LY,Bowcock AM,Baer R.鉴定可与BRCA1基因产物在体内相互作用的环蛋白。自然遗传学。1996年12月;14(4):430–440.[公共医学][谷歌学者]
  • Bult CJ、White O、Olsen GJ、Zhou L、Fleischmann RD、Sutton GG、Blake JA、FitzGerald LM、Clayton RA、Gocayne JD等。产甲烷古菌的完整基因组序列。科学。1996年8月23日;273(5278):1058–1073.[公共医学][谷歌学者]
  • Nagase T、Seki N、Ishikawa K、Ohira M、Kawarabayasi Y、Ohara O、Tanaka A、Kotani H、Miyajima N、Nomura N。未识别人类基因编码序列的预测。VI、 通过对KG-1细胞系和大脑cDNA克隆的分析,推导出80个新基因(KIAA0201-KIAA0280)的编码序列。DNA研究。1996年10月31日;(5):321–354.[公共医学][谷歌学者]
  • Wilson R、Ainscough R、Anderson K、Baynes C、Berks M、Bonfield J、Burton J、Connell M、Copsey T、Cooper J等。线虫染色体III的2.2 Mb连续核苷酸序列。自然。1994年3月3日;368(6466):32–38.[公共医学][谷歌学者]
  • Kaneko T、Sato S、Kotani H、Tanaka A、Asamizu E、Nakamura Y、Miyajima N、Hirosawa M、Sugiura M、Sasamoto S等。单细胞蓝藻Synechocys sp.菌株PCC6803基因组序列分析。二、。整个基因组的序列测定和潜在蛋白质编码区的分配。DNA研究。1996年6月30日;(3):109–136.[公共医学][谷歌学者]
  • Allende ML、Amsterdam A、Becker T、Kawakami K、Gaiano N、Hopkins N。斑马鱼中的插入突变确定了两个对胚胎发育至关重要的新基因,pescadillo和dead eye。基因发育。1996年12月15日;10(24):3141–3155.[公共医学][谷歌学者]
  • Sonnhammer EL,Durbin R.大规模序列同源性分析工作台。计算应用生物科学。1994年6月;10(3):301–307.[公共医学][谷歌学者]
  • Gotoh O.一种改进的生物序列匹配算法。分子生物学杂志。1982年12月15日;162(3):705–708.[公共医学][谷歌学者]
  • Fitch WM,Smith TF.最佳序列比对。美国国家科学院院刊。1983年3月;80(5):1382–1386. [PMC免费文章][公共医学][谷歌学者]
  • Altschul SF,Erickson BW。使用仿射间隙成本的最佳序列比对。公牛数学生物学。1986;48(5-6):603–616.[公共医学][谷歌学者]
  • Myers EW,Miller W.线性空间中的最优对准。计算应用生物科学。1988年3月;4(1):11–17.[公共医学][谷歌学者]
  • Richardson M,Dilworth MJ,Scawen MD.蚕豆根瘤豆血红蛋白I的氨基酸序列。FEBS信函。1975年3月1日;51(1):33–37.[公共医学][谷歌学者]
  • Matsuda G、Maita T、Braunitzer G、Schrank B.Hämoglobine、XXXIII:Notiz zur Sequenz der Hämonglobine des Pferdes。Hoppe Seylers Z物理化学。1980年7月;361(7):1107–1116.[公共医学][谷歌学者]
  • Tokunaga O,Yaegashi T,Lowe J,Dobbs L,Padmanabhan R。4型腺病毒DNA E1区的序列分析。病毒学。1986年12月;155(2):418–433.[公共医学][谷歌学者]

文章来自核酸研究由以下人员提供牛津大学出版社