跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

政府意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府网站。

Https系统

网站是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2010年5月11日11:11:237。
doi:10.1186/1471-2105-11-237。

ChIPpeakAnno:用于注释ChIP-seq和ChIP-ChIP数据的Bioconductor包

附属公司

ChIPpeakAnno:用于注释ChIP-seq和ChIP-ChIP数据的Bioconductor包

李华J朱等。 BMC生物信息学. .

摘要

背景:染色质免疫沉淀(ChIP)、高通量测序(ChIP-seq)或ChIP、基因组拼接阵列分析(ChIP-ChIP)已成为全基因组DNA结合蛋白靶点鉴定的标准技术。已经并行开发了许多算法,这些算法允许从ChIP-seq或ChIP芯片数据集中识别结合位点,并随后在加州大学圣克鲁斯分校(UCSC)基因组浏览器中作为自定义注释轨道进行可视化。然而,总结这些轨迹可能是一项艰巨的任务,特别是如果存在大量结合位点或结合位点在基因组中广泛分布的话。

结果:我们已将ChIPpeakAnno开发为统计编程环境R中的生物导体包,以便于批量注释从ChIP-seq、ChIP-ChIP、基因表达帽分析(CAGE)或任何导致大量富集基因组区域的实验中识别的富集峰。用ChIPpeakAnno注释的结合位点可以很容易地被视为一个表、一个饼图或以直方图形式绘制,即每个峰组到最近基因的距离分布。此外,我们还实现了确定复合体内转录因子之间重复或结合位点之间重叠重要性的功能,以及绘制维恩图以可视化重复之间重叠程度的功能。此外,该软件包还具有检索假定结合位点侧翼序列的功能,用于PCR扩增、克隆或模体发现,并识别与相邻基因相关的基因本体(GO)术语。

结论:ChIPpeakAnno支持对从ChIP-seq、ChIP-ChIP、CAGE或任何在统计编程环境R中产生大量富集基因组区域的技术中识别的结合位点进行批量注释。允许用户传递自己的注释数据,例如不同的染色质免疫沉淀(ChIP)来自文献或现有注释包(如GenomicFeatures和BSgenome)的准备和数据集提供了灵活性。与bioRt包的紧密集成可以从biomaRt数据库检索最新注释。

PubMed免责声明

数字

图1
图1
人类STAT1结合位点相对于最近TSS的分布直方图是根据未刺激细胞中TSS周围20kb范围内的假定STAT1结合区域生成的[2]。该图显示STAT1结合位点在转录起始位点周围更加对称的区域富集。距最近TSS的平均距离为8533391±295725个碱基(平均值±SEM)。
图2
图2
人类STAT1结合位点相对于最近基因的饼图。饼图是根据非模拟细胞中识别的假定STAT1结合区域生成的[2]。该图显示STAT1结合位点沿上游、下游和内部基因均匀分布。
图3
图3
酵母中三个生物复制体之间假定Ste12-结合位点的重叠维恩图是根据酵母中三个生物复制品的假定Ste12-结合位点生成的[31]。超几何检验表明,重复数据之间存在显著重叠(所有三个成对比较的p值<0.000001)。
图4
图4
酵母中三个生物复制体之间假定Cse4-结合位点的重叠维恩图是根据酵母中三个生物复制品的假定Cse4-结合位点生成的[31]。超几何检验表明,生物复制品1和2在p值<0.001时重叠显著,而其他两个重叠在p值<0.05时显著。
图5
图5
酵母中Ste12-结合位点相对于最近TSS的分布直方图是从酵母中识别的三个生物复制品合并的假定Ste12-结合区域生成的[31]。该图显示,Ste12-结合位点在转录起始位点上游和周围区域富集。到最近TSS的距离平均值为-264±36个基数(平均值±SEM)。
图6
图6
酵母中与最近基因相关的Ste12-结合位点饼图。饼图是由假定的Ste12-结合区域生成的,这些区域是从酵母中发现的三个生物复制品合并而来的[31]。该图显示Ste12-绑定位点更多地分布在上游和基因周围。
图7
图7
酵母中Cse4-结合位点相对于最近TSS的分布直方图是从酵母中鉴定的三个生物复制品合并的假定Cse4-结合区域生成的[31]。该图显示Cse4结合位点在转录起始位点的内部和下游区域富集。到最近TSS的距离平均值为311±160个基点(平均值±SEM)。
图8
图8
酵母中Cse4-结合位点相对于最近基因的饼图。饼图是从酵母中确定的三个生物复制品合并的假定Cse4-binding区域生成的[31]。图中显示Cse4结合位点更多地分布在基因内部,并与基因末端重叠。
图9
图9
酵母中Ste12-结合位点的基序。该基序是使用MEME[30]生成的,来自假定的Ste12-结合区域的序列从酵母中鉴定的三个生物复制品中合并而来[31]。MEME的默认参数已选定,但motif occurrence设置为ZOOP,最小宽度设置为8,最大宽度设置为20。

类似文章

引用人

工具书类

    1. Johnson DS、Mortazavi A、Myers RM、Wold B。体内蛋白质-DNA相互作用的全基因组绘图。科学。2007;316(5830):1497–1502. doi:10.1126/science.1141319。-内政部-公共医学
    1. Robertson G、Hirst M、Bainbridge M、Bilenky M、Zhao Y、Zeng T、Eukilchen G、Bernier B、Varhol R、Delaney A.等人。利用染色质免疫沉淀和大规模平行测序技术对STAT1 DNA关联的基因组全谱图。自然方法。2007;4(8):651–657. doi:10.1038/nmeth1068。-内政部-公共医学
    1. Valouev A、Johnson DS、Sundquist A、Medina C、Anton E、Batzoglou S、Myers RM、Sidow A.基于ChIP-Seq数据的转录因子结合位点的基因组分析。自然方法。2008;5(9):829–834. doi:10.1038/nmeth.1246。-内政部-项目管理咨询公司-公共医学
    1. Johnson DS、Li W、Gordon DB、Bhattacharjee A、Curry B、Ghosh J、Brizuela L、Carroll JS、Brown M、Flicek P.等人。使用预定义DNA靶点对ChIP-ChIP实验中的可变性进行系统评估。基因组研究2008;18(3):393–403. doi:10.1101/gr.7080508。-内政部-项目管理咨询公司-公共医学
    1. Fejes AP、Robertson G、Bilenky M、Varhol R、Bainbridge M、Jones SJ。FindPeaks 3.1:一种通过大规模并行短阅读测序技术识别富集区域的工具。生物信息学。2008;24(15):1729–1730. doi:10.1093/bioinformatics/btn305。-内政部-项目管理咨询公司-公共医学

出版物类型