跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
比较研究
.2014年4月;42(8):e63。
doi:10.1093/nar/gku117。 Epub 2014年2月5日。

PBM、HT-SELEX和ChIP数据中转录因子结合模型的比较分析

附属公司
比较研究

PBM、HT-SELEX和ChIP数据中转录因子结合模型的比较分析

亚伦·奥伦斯坦等。 核酸研究. 2014年4月.

摘要

理解基因调控是当今生物学的一个关键挑战。蛋白质结合微阵列(PBM)和高通量SELEX(HT-SELEX)的新技术允许在单个实验中测量一个转录因子(TF)与许多合成双链DNA序列的结合强度。最近,Jolma等人报告了547项HT-SELEX实验的结果,这些实验涵盖了人类和小鼠TF。由于其中162种TF也被PBM技术覆盖,因此首次可以对这两种体外技术的实现进行大规模比较。在这里,我们评估了根据PBM和HT-SELEX推断的以位置-重量矩阵表示的结合模型之间的相似性和差异,并测量了这些模型预测体内结合的程度。我们的结果表明,HT-SELEX和PBM衍生模型适用于大多数TF。对于某些TF,HT-SELEX衍生模型是PBM衍生模型的较长版本,而对于其他TF,HTML SELEX模型与次级PBM衍生的模型匹配。值得注意的是,基于PBM的8聚体排序比HT-SELEX更准确,但HT-SELEX衍生的模型更好地预测体内结合。此外,我们还揭示了HT-SELEX数据中的几个偏差,包括核苷酸频率偏差、富含C的k-mers和寡核苷酸的富集以及回文的代表性不足。

PubMed免责声明

数字

图1。
图1。
基于PBM数据的结合预测质量。(A类)预测PBM结合的准确性。对于每个PBM实验,PBM探针根据五种PBM算法(AM=Amadeus-PBM、SW=Seed-and-Wobble、RM=RankMotif++、BE=BEEML-PBM和RAP)和HT-SELEX衍生模型推断的基序进行排序。通过计算用于预测绑定PBM探针的AUC,将该排名与真实排名进行比较。每个点是两个或四个实验中一个算法的平均结果(TF名称列在底部,TF家族名称列在顶部,如Jolma所示等。). (B类)敏感性导致预测PBM结合。对于每个PBM实验,使用BEEML-PBM和HT-SELEX PWM模型预测绑定探针。该图显示了这些预测在1%假阳性率下的敏感性(真阳性率)。颜色与蛋白质家族相对应。(C类)HT-SELEX和PBM-衍生模型之间存在分歧。徽标是从HT-SELEX(顶部)学习的PWM,以及从Jolma学习的PBM(中部和底部)等。和UniPROBE。从PBM中学习到的每个TF的中间和底部模型分别是主要和次要模型。1、2:HT-SELEX生产的图案与主要PBM模型相似,但对于PBM技术来说太长的示例;3、4:HT-SELEX模型与PBM二级模型一致的情况;5:HT-SELEX模型与两种PBM模型不一致的示例。(TCF3被排除在分析之外,因为每种技术都测试了一种不同的TF,其名称为:bHLH-TCF3由HT-SELEX测试,而HMG-TCF3则由PBM测试)。
图2。
图2。
根据PBM和HT-SELEX数据排名的前8名人群之间的相关性。对于每个HT-SELEX实验,8-mers的得分是根据频率或频率与前一周期频率的比率。用平均结合强度对同一TF上PBM实验的8-mers进行评分。对于100名PBM得分最高的8名男性,计算他们的PBM得分与其HT-SELEX频率和比率得分之间的相关性。类似地,对于根据HT-SELEX频率(比率)得分最高的100个8-mer,计算它们与PBM得分的相关性。(A类)每个周期的平均相关性。条形图表示用于确定前100名8名的技术。该图基于238 TF的平均相关性。(B类)不同参数组合的最大相关性分布。该图显示了周期、前8个月的来源和HT-SELEX 8个月得分的每个组合实现最大相关性的次数。(因为只有39个HT-SELEX实验包含第五个周期的数据,我们将其排除在比较之外;这些实验中没有一个在第五个阶段得分最高)。
图3。
图3。
预测体内使用HT-SELEX和PBM-衍生PWM模型进行绑定。从HT-SELEX和PBM获得的PWM来自Jolma等。和UniPROBE。体内ENCODE项目使用ChIP-seq测量了结合力。(A类)可在同一TF上进行HT-SELEX和PBM实验的每个ChIP-seq实验的AUC结果。(B类)HT-SELEX预测的示例体内更好地绑定。对于所有这些示例,HT-SELEX模型实现的平均AUC超过PBM模型的AUC>0.05。
图4。
图4。
HT-SELEX技术中的系统偏差。(A类)不同循环中最常见的8-mer的特性。对于每个循环,HT-SELEX实验中最频繁的8-mer的分数是poly(A)、poly(C)或匹配的,根据PBM数据计算出的最频繁8-mer(见正文)。(B类)每个周期的8-mer频率密度图。8-mers被分为三类:回文、poly(C)和其他所有类别。对于每个类别,显示了其8-mer频率的平滑密度图。(C类)Atf7 HT-SELEX实验中存在大量假寡核苷酸。对于周期3、4和5,显示了七种最常见的寡聚物及其计数。共识序列以黄色突出显示(周期5中的前七个寡核苷酸均不包含共识)。

类似文章

引用人

工具书类

    1. Aparicio O,Geisberg JV,Struhl K.染色质免疫沉淀法测定体内蛋白质与特定基因组序列的关联。货币。协议。细胞生物学。2004年第17章第17.7单元。-公共医学
    1. Johnson DS、Mortazavi A、Myers RM、Wold B。体内蛋白质-DNA相互作用的全基因组绘图。科学。2007;316:1497–1502.-公共医学
    1. Rhee HS,Pugh BF。近单核苷酸准确度鉴定DNA结合蛋白基因组位置的ChIP-exo方法。货币。协议。分子生物学。2012年第21章,第21单元24。-项目管理咨询公司-公共医学
    1. Berger MF、Philippakis AA、Qureshi AM、He FS、Estep PW、Bulyk ML。紧凑通用DNA微阵列,用于全面测定转录因子结合位点特异性。自然生物技术。2006;24:1429–1435.-项目管理咨询公司-公共医学
    1. Fordyce PM,Gerber D,Tran D,Zheng J,Li H,DeRisi JL,Quake SR.利用微流控亲和力分析对转录因子结合位点进行从头鉴定和生物物理表征。自然生物技术。2010;28:970–975.-项目管理咨询公司-公共医学

出版物类型