跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府网站。

Https系统

该站点是安全的。
这个https://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2010年12月2日;6(12):e1001025。
doi:10.1371/journal.pcbi.1001025。

使用GERP识别受选择性限制的高比例人类基因组++

附属公司

使用GERP识别受选择性限制的高比例人类基因组++

尤金·达维多夫等。 公共科学图书馆计算生物学. .

摘要

识别基因组中功能元件的计算工作通过寻找显示选择性约束证据的区域来利用比较序列信息。检测受约束元素的一种方法是采用自下而上的方法,计算多重比对的单个位置的约束分数,然后将受约束元素定义为相邻的、得分高的核苷酸位置的片段。在这里,我们提出了GERP++,这是一种新的工具,它使用最大似然进化率估计来进行特定位置的评分,与以前的自下而上方法相比,它是一种新型的动态规划方法,用于随后定义约束元素。GERP++评估更丰富的候选元素断点集,并根据统计显著性对其进行排序,从而消除了对有偏见的启发式扩展技术的需要。使用GERP++,我们识别了超过130万个限制性元素,跨越人类基因组的7%。我们预测的分数高于早期的估计,这主要是由于对较长约束元素的注释,这改善了预测元素与已知函数序列之间的一一对应关系。GERP++是一种高效的工具,可以在深度多序列比对中提供核苷酸和元素级约束分数。

PubMed免责声明

利益冲突声明

提交人声明,不存在相互竞争的利益。

数字

图1
图1。GERP++概述。
(1) 对于多重比对的每个位置,我们通过从中性速率中减去估计的进化速率来计算被拒绝替换中的守恒分数。中性率的计算方法是从系统发育树中删除该位置的物种间隙,并将生成的投影树的分支长度相加;通过计算投影树的最大似然重标度来估计进化速率。(2) 给定特定位置的守恒分数,我们生成一组候选元素。(3) 对于每个候选元素,我们计算一个p值来表示在空模型下观察到等长且大于或等于分数的片段的可能性。然后,我们按照p值的增加顺序选择一组不重叠的元素。
图2
图2。超染色体约束强度。
(A) 计算进化率的所有对齐位置的平均RS得分。注意染色体X的平均得分升高。(B)属于预测约束元素的染色体部分。浅绿色条显示整个染色体的分数,而深绿色条显示未执行速率计算且元素无法跨越的区域的调整分数(参见方法)。
图3
图3。估计可检测约束。
红色曲线表示预测约束元素内的基数,作为假阳性截止参数的函数。蓝色曲线表示预测的碱基数减去预期的假阳性碱基数,也作为假阳性截止值的函数。
图4
图4。CE和已知功能元件之间的关系。
(A) 整个人类基因组、GERP++预测的受限制元素以及已知注释的外显子、内含子和UTR区域的平均拒绝替代得分。(B) 按区域类型细分受约束图元位置。
图5
图5。已知外显子(红色)、内含子(绿色)、重叠外显子的CE(橙色)和不重叠外显体的CE(蓝色)的3周期性偏差分布(平滑直方图)。
图6
图6。GERP++与相位cons预测。
(A) GERP++(蓝色)和相位cons(黄色)预测的约束元素的平均长度(左侧)、数量(中间)和总长度(右侧)。(B) GERP++(蓝色)和phastCons(黄色)预测涵盖的注释外显子、内含子、UTR和非编码RNA基因的核苷酸水平部分。(C&D)重叠每个注释编码外显子的不同预测GERP++(蓝色,D)和相控子(黄色,C)约束元素数量的直方图。注意y轴上的刻度差异。(E) 一个长度略超过200个碱基对的限制区,包含一个已知的外显子,如GERP++(标记为“GERP++”,黑色)和phastCons(紫色轨道标记为“Mammal El”)所注释。请注意相位密码子如何将外显子分割成多个CE预测。
图7
图7。GERP++和相控子的9个Encode-PolII ChIP实验中PolII结合位点的平均分布。

类似文章

  • GERP评分的群体遗传模型表明,哺乳动物进化过程中受限位点的普遍更替。
    Huber CD、Kim BY、Lohmueller KE。 Huber CD等人。 公共科学图书馆-遗传学。2020年5月29日;16(5):e1008827。doi:10.1371/journal.pgen.1008827。eCollection 2020年5月。 公共科学图书馆-遗传学。2020 PMID:32469868 免费PMC文章。
  • 用于支架组装基因组的现代技术和算法。
    Ghurye J,Pop M。 Ghurye J等人。 公共科学图书馆计算生物学。2019年6月5日;15(6):e1006994。doi:10.1371/journal.pcbi.1006994。eCollection 2019年6月。 公共科学图书馆计算生物学。2019 PMID:31166948 免费PMC文章。 审查。
  • 比较序列分析方法:脊椎动物基因组的功能观点。
    Margulies EH、Birney E。 Margulies EH等人。 Nat Rev基因。2008年4月;9(4):303-13. doi:10.1038/nrg2185。 Nat Rev基因。2008. PMID:18347593 审查。
  • 哺乳动物深层序列比对分析和人类基因组1%的限制性预测。
    Margulies EH、Cooper GM、Asimenos G、Thomas DJ、Dewey CN、Siepel A、Birney E、Keefe D、Schwartz AS、Hou M、Taylor J、Nikolaev S、Montoya-Burgos JI、Löytynoja A、Whelan S、Pardi F、Massingham T、Brown JB、Bickel P、Holmes I、Mullikin JC、Ureta-Vida A、Paten B、Stone EA、Rosenbloom KR、Kent WJ、Bouffard GG、Guan X、Hansen NF、Idol JR、Maduro VV、,Maskeri B、McDowell JC、Park M、Thomas PJ、Young AC、Blakesley RW、Muzny DM、Sodergren E、Wheeler DA、Worley KC、Jiang H、Weinstock GM、Gibbs RA、Graves T、Fulton R、Mardis ER、Wilson RK、Clamp M、Cuff J、Gnerre S、Jaffe DB、Chang JL、Lindblad-Toh K、Lander ES、Hinrichs A、Trumbower H、Clawson H、Zweig A、Kuhn RM、Barber G、Harte R、Karolchik D、,Field MA、Moore RA、Matthewson CA、Schein JE、Marra MA、Antonarakis SE、Batzoglou S、Goldman N、Hardison R、Haussler D、Miller W、Pachter L、Green ED、Sidow A。 Margulies EH等人。 基因组研究,2007年6月;17(6):760-74. doi:10.1101/gr.6034307。 基因组研究2007。 PMID:17567995 免费PMC文章。
  • 哺乳动物基因组序列中约束的分布和强度。
    库珀总经理、斯通EA、Asimenos G;NISC比较测序计划;Green ED、Batzoglou S、Sidow A。 Cooper GM等人。 基因组研究,2005年7月;15(7):901-13. doi:10.1101/gr.3577405。Epub 2005年6月17日。 《基因组研究》,2005年。 PMID:15965027 免费PMC文章。

引用人

工具书类

    1. Margulies EH、Cooper GM、Asimenos G、Thomas DJ、Dewey CN等。哺乳动物深层序列比对分析和人类基因组1%的限制性预测。基因组研究2007;17:760–774.-项目管理咨询公司-公共医学
    1. ENCODE项目联盟。ENCODE(DNA元素百科全书)项目。科学。2004;306:636–640.-公共医学
    1. Birney E,Stamatoyannopoulos JA,Dutta A,Guigo R,Gingeras TR等。通过ENCODE试点项目鉴定和分析1%人类基因组中的功能元件。自然。2007;447:799–816.-项目管理咨询公司-公共医学
    1. Siepel A、Bejerano G、Pedersen JS、Hinrichs AS、Hou M等。脊椎动物、昆虫、蠕虫和酵母基因组中的进化保守元素。基因组研究2005;15:1034–1050.-项目管理咨询公司-公共医学
    1. Cooper GM、Stone EA、Asimenos G、Green ED、Batzoglou S等。哺乳动物基因组序列中约束的分布和强度。基因组研究2005;15:901–913.-项目管理咨询公司-公共医学

出版物类型