跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

网站是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2015年3月17日4:4:e04837。
doi:10.7554/eLife.04837。

转录因子结合特异性在6亿年的双耳进化中的保存

附属公司

转录因子结合特异性在6亿年的双耳进化中的保存

Kazuhiro R Nitta公司等。 埃利夫. .

摘要

物种形态的差异很大程度上归因于蛋白质组织特异性表达的遗传差异,这可以通过顺调控元件的差异或通过改变转录因子(TF)的结合特异性来实现。后者的相对重要性很难评估,因为之前使用不同的方法对不同物种的TF结合特异性进行了系统分析。为了解决这个问题,我们测定了242个果蝇TF的结合特异性,并将其与人类和小鼠数据进行了比较。该分析表明,TF结合特异性在果蝇和哺乳动物之间高度保守,对于同源TF,相似性甚至延伸到非常微妙的二核苷酸结合偏好水平。少数具有不同特异性的人类TF在果蝇中未发现的细胞类型中发挥作用,这表明TF特异性的进化促成了新型分化细胞的出现。

关键词:D.黑腹滨鹬;DNA结合特异性;HT-SELEX公司;染色体;进化生物学;进化守恒;基因;基因组学;人;转录因子。

PubMed免责声明

利益冲突声明

提交人声明,不存在相互竞争的利益。

数字

图1。
图1。。果蝇属HT-SELEX公司。
(A类)果蝇属HT-SELEX管道。(B类)TF的覆盖范围。显示了每个TF结构家族的基因数量(蓝色)和我们获得HT-SELEX模型的基因数(红色)。编码多个结构域的基因被视为多个结构类别的成员。(C类)将所有结合模型分类为非重复位点(单体)和具有两个、三个或四个类似子序列(分别为二聚体、三聚体和二聚体)的位点。例如,对于每种类型的模型,都显示了徽标,箭头指示半衰期,以突出多元位点。(D类)一级和二级模型的分类(左)。右侧显示了二级模型的类型。红色方框和黑色括号表示主要(顶部)和次要(底部)模型之间的差异。使用Autoseed算法确定生成模型的种子(详见“材料和方法”和图1补充件1-14)。内政部: http://dx.doi.org/10.7554/eLife.04837.003
图1——图补充1。
图1-图补充了1。哈丁奇距离为1的子序列示例。
(A类,B类)一个四基未映射子序列“ACGT”及其与Huddinge距离为1的子序列类型(A类)以及一个带有四个定义基“ACnGT”的间隙子序列,以及与之相距Huddinge距离为1的子序列类型(B类). 请注意,间隔子序列的偏移导致最小Huddinge距离为2(灰色交叉)。比较具有不同数目的定义基(较短、较长和较短,带间隙)的子序列需要一个阈值,以补偿与较长的子序列完全匹配的较短子序列的数目总是等于或大于较长子序列的这一事实。内政部: http://dx.doi.org/10.7554/eLife.04837.004
图1—图补充2。
图1-图补充2.主要TF家族(人类、小鼠和果蝇属)使用HT-SELEX获得的bHLH图案进行注释。
果蝇TF为红色字体。左栏和右栏分别表示主图案和次图案。内政部: 网址:http://dx.doi.org/10.7554/eLife.04837.005
图1——图补充3。
图1-图补充3.主要TF家族(人类、小鼠和果蝇属)使用HT-SELEX获得的bZIP图案进行注释。
果蝇属TF为红色字体。左列和右列分别表示主基序和次基序。内政部: http://dx.doi.org/10.7554/eLife.04837.006
图1——图补充4。
图1-补充图4:主要TF家族(人类、小鼠和果蝇属)使用HT-SELEX获得的Ets图案进行注释。
星号表示Ets98B;下划线表示不同实验中不同5′序列富集的区域。指示基序表示在一组实验中从DBD和全长蛋白获得的序列。在所有实验中都确定了所示的核心和3′侧翼。果蝇属TF为红色字体。左栏和右栏分别表示主图案和次图案。内政部: http://dx.doi.org/10.7554/eLife.04837.007
图1——补充图5。
图1-图补充5.主要TF家族(人、小鼠和果蝇属)用HT-SELEX获得的福克斯图案进行注释。
果蝇属TF为红色字体。左栏和右栏分别表示主图案和次图案。内政部: http://dx.doi.org/10.7554/eLife.04837.008
图1——图补充6。
图1-补充图6:主要TF家族(人类、小鼠和果蝇属)使用HT-SELEX获得的HMG图案进行注释。
果蝇属TF为红色字体。左栏和右栏分别表示主图案和次图案。内政部: http://dx.doi.org/10.7554/eLife.04837.009
图1——图补充7。
图1-图补充7.主要TF家族(人类、小鼠和果蝇属)使用HT-SELEX获得的Homeobox图案进行注释。
果蝇属TF为红色字体。左栏和右栏分别表示主图案和次图案。内政部: http://dx.doi.org/10.7554/eLife.04837.010
图1-补充图8。
图1-补充图8.主要TF家族(人类、小鼠和果蝇属)使用HT-SELEX获得的IPT/TIG图案进行注释。
果蝇属TF为红色字体。左栏和右栏分别表示主图案和次图案。内政部: http://dx.doi.org/10.7554/eLife.04837.011
图1——补充图9。
图1-图补充9:主要TF家族(人类、小鼠和果蝇属)用HT-SELEX获得的核受体基序进行注释。
果蝇属TF为红色字体。左栏和右栏分别表示主图案和次图案。内政部: http://dx.doi.org/10.7554/eLife.04837.012
图1——图补充10。
图1-补充图10.主要TF家族(人类、小鼠和果蝇属)使用HT-SELEX获得的Pax(基于成对框)图案进行注释。
果蝇属TF为红色字体。左栏和右栏分别表示主图案和次图案。内政部: http://dx.doi.org/10.7554/eLife.04837.013
图1——图补充11。
图1-图补充11:主要TF家族(人类、小鼠和果蝇属)使用HT-SELEX获得的Tbox图案进行注释。
果蝇属TF为红色字体。左栏和右栏分别表示主图案和次图案。内政部: 网址:http://dx.doi.org/10.7554/eLife.04837.014
图1——图补充12。
图1-图补充12:主要TF家族(人类、小鼠和果蝇属)使用HT-SELEX获得的Zf-GATA图案进行注释。
果蝇属TF为红色字体。左列和右列分别表示主基序和次基序。内政部: http://dx.doi.org/10.7554/eLife.04837.015
图1——图补充件13。
图1-图补充13.主要TF家族(人类、小鼠和果蝇属)用HT-SELEX获得的Zf-C2H2基序进行注释。
果蝇属TF为红色字体。左栏和右栏分别表示主图案和次图案。内政部: http://dx.doi.org/10.7554/eLife.04837.016
图1——图补充14。
图1-图补充14。HT-SELEX管道的再现性。
(A类)CrebB-17A(B类)Pdp1和(C类)Ptx1。条形图表示种子的位置。请注意,所有实验都丰富了非常相似的基序,而与随机区域的长度无关,并且与种子相邻的侧翼序列没有显示出偏好。侧翼末端的明显特异性(星号)是由于种子序列与随机区域末端匹配的少量读取导致的伪影(在这种情况下,随机区域的位置用括号表示)。内政部: http://dx.doi.org/10.7554/eLife.04837.017
图2。
图2 TF-DBD氨基酸序列的相似性与结合特异性之间的关系。
根据氨基酸序列相似性排列的bHLH DBD条形码标志(中间)表明,序列保守性可以预测结合特异性。插图显示了将序列徽标转换为条形码徽标的示例。对于每个位置,每个底座的频率由相应彩色条的宽度表示;颜色的强度和每个位置的条的高度由频率最高的基决定。还显示了核心识别序列(右侧)。请注意,结构紧密的TF识别相同的核心序列和相似的侧翼序列(例如,HLHm3、HLHmgamma和HLHmdelta)。还请注意,CAGCTG图案由两个不同的分支(星号)识别。有关其他TF家族的分析,请参见图2-图补充1。内政部: http://dx.doi.org/10.7554/eLife.04837.018
图2——图补充1。
图2-图补充1.热图,显示所有研究的转录因子之间结合谱和氨基酸序列相似性评分(blastp)的相似性。
行和列是根据使用所有可能的6 bp序列(中间有可变长度的间隙)测量的模体相似性排序的。子家族由各自的核心结合基序表示。包含规范(T/C)AATTA站点的Homeodomain模型位于右下角,包含TAATCC或TAAA(T/C,G)的模型以星号表示。还显示了二聚体同源结构域位点(二聚体)。插图显示了二维色阶,黄色表示基序和氨基酸序列相似。注意,通常,基序相似性由TF结构家族决定。还请注意对角线上的红色矩形,这表明尽管与不同基序结合的同源域蛋白具有高度的序列相似性,但基序本身是不同的。有关详细信息,请参见图2源数据1。内政部: http://dx.doi.org/10.7554/eLife.04837.020
图3。
图3.HT-SELEX揭示了果蝇和人类之间结合特征的相似性。
(A类)先前确定的哺乳动物和果蝇同源域蛋白DNA结合特异性的网络图。哺乳动物和果蝇TF模型分别用黑色和蓝色节点表示,并在相似模型之间绘制边缘。注意,根据现有数据,果蝇同源域(蓝色)似乎只识别哺乳动物同源域特异性的子集。还显示了节点簇的部分一致序列。(B类)通过对果蝇和哺乳动物转录因子使用HT-SELEX获得的更高精度表明,哺乳动物同源结构域特异性的范围被果蝇转录因子覆盖。另请注意果蝇属只有一个后同源结构域蛋白(Abd-B)识别与人类HOX9-12结合的基序类似的基序(星号)。果蝇属因此,缺乏一种与人类HOX13蛋白相似的基序偏好的蛋白质(六种模型位于红色卵圆形内;另见Jolma等人,2013)。(C类,D类,E类)分析T-box、Nkx同源结构域和EGR蛋白的先前模型。请注意,哺乳动物(黑色)和果蝇(蓝色)的先前数据表明果蝇特异性存在差异,而果蝇HT-SELEX数据(红色)揭示了哺乳动物和果蝇结合特征的相似性。有关详细信息,请参见图3源数据1。另请参见图3-图补充1–3。内政部: http://dx.doi.org/10.7554/eLife.04837.021
图3——图补充1。
图3-图补充1。使用HT-SELEX和B1H生成的装订轮廓的相似性。
树状图显示了本研究中果蝇基序集合与细菌单杂交集合之间的基序相似性(Noyes等人,2008;Zhu等人,2011年;Enuameh等人,2013年)。还显示了所有型号的条形码徽标。HT-SELEX型号以红色条突出显示。请注意,B1H基序和HT-SELEX基序相似,但B1H定义的基序比HT-SELEX短(见图3-图补充3)。内政部: http://dx.doi.org/10.7554/eLife.04837.023
图3——图补充2。
图3-图补充2:对果蝇属和人类直系对数对。
请注意,许多TF结构域高度保守,但其他结构域的保守程度与观察到的蛋白质-蛋白质、蛋白质-RNA和酶-底物相互作用(激酶结构域、RNA识别模块(RRM)、SH2、SH3和Bromodomains)结构域相似。还请注意TF家族中保护分数的广泛分布。内政部: http://dx.doi.org/10.7554/eLife.04837.024
图3——补充图3。
图3-图补充3.HT-SELEX和B1H定义的图案对比。
(A类)同源盒家族基因报告。HT-SELEX显示出B1H无法识别的弱侧翼偏好。HT-SELEX还鉴定了同二聚体基序(参见Jolma等人,2013)。(B类)HT-SELEX和B1H图案的比较果蝇属Nkx基因tin与人NKX2-3。主要差异用方框表示。注意,使用DNase I鉴定的位点(Bergman等人,2005)支持HT-SELEX揭示的侧翼特异性。(C类)C2H2锌指蛋白klu/EGR的HT-SELEX和B1H基序之间的比较。主要差异用方框表示。请注意,使用Yan等人(2013)的ChIP-seq数据的MEME分析确定的位点支持HT-SELEX揭示的侧翼特异性。内政部: http://dx.doi.org/10.7554/eLife.04837.025
图4。
图4果蝇和人类+小鼠之间初级结合谱的相似性。
树状图显示了本研究中果蝇基序集合与人类和小鼠HT-SELEX集合之间的基序相似性(Jolma等人,2010;Jolma等,2013)。人类和老鼠图案都存在的地方,显示了人类图案。果蝇属模型用红色条表示。还显示了每个因素的条形码徽标。中间显示了将序列徽标转换为条形码徽标的示例。有关详细信息,请参见图4源数据1。内政部: 网址:http://dx.doi.org/10.7554/eLife.04837.026
图5。
图5 TF二级结合模式和二核苷酸偏好的保存。
(A类)二次结合模式的守恒。显示所示主要和次要装订特性的序列徽标果蝇属(红色字体)和人类(灰色字体)转录因子。请注意,所有因素都存在类似的二次模式。(B类)热图显示Runt族TF-lz绑定模型中碱基之间的相互依赖性。每个方块的颜色表示观察到的碱基分布与使用单核苷酸(PWM)模型进行预测的偏差,该模型假定所示碱基独立(右侧的色标;红色表示偏差较大)。括号表示显示最大偏差的两个基数。插图显示了瓷砖的放大倍数;每个图块内的圆点表示相对于单核苷酸模型预测的碱基对过多(黄色)或不足(蓝色)。(C类,D类,E类)果蝇和人类所示同源蛋白的二核苷酸偏好的保护。偏离单核苷酸模型的碱基位置由热图上的红色圆圈和序列标志上方的括号表示。内政部: http://dx.doi.org/10.7554/eLife.04837.028
图6。
图6:通过基因复制和分化的TF结合特异性的进化。
(A类)复制和分化在相关核受体中产生了三种不同的特异性。根据DBD之间氨基酸序列的相似性绘制树状图。装订图案如右栏所示。只有一种特性(顶层),即单体AAGGTCA基序(蓝色箭头)存在于果蝇属ESR1识别的人类特异性位点(中间分支)是具有相同半位点但处于头对头构型的二聚体。雄激素受体识别的另一个人特异性位点(底部分支)具有不同的半位点(G/a)G(a/T)ACA(绿色箭头)。(B类)Pax蛋白的特异性与其配对DBD的序列相似性相关。结合基序(右)分为配对、同源域(homedomain)和配对和同源域(P+H)。请注意,果蝇Poxn与任何人类PAX蛋白都无法识别的位点结合。箭头表示成对图案的方向。N.D.=未确定。所有主要家庭的完整数据如图1补充图2-13所示。内政部: http://dx.doi.org/10.7554/eLife.04837.029
图7。
图7:TF结合特异性的复制和分化演变。
(A类,B类,C类)果蝇属bZIP蛋白CG30420识别的位点与其人类同源序列ATF2和ATF7识别的位点不同。B中的方框表示果蝇和人类特异性不同的位置。注意,CG30420识别10聚体ATGACGTG公司AT不受ATF7的约束。图C显示了CG30420和ATF7实验中10-mers的富集情况,椭圆形表明CG30120优先识别10-mers。二维色标表示每种颜色的得分k个-mer对CG30420和ATF7 PWM模型(红色表示两者强匹配,紫色和绿色分别强匹配CG30420和ATF7)。关于复制和结构分析,请参见图7图补遗1。(D类,E类)不同的结合特异性果蝇属和人核受体亚家族。然而,所有人类NR1I亚家族基因(VDR、NR1I2、NR1III)都识别包含GTTCA基序直接重复的基序,而Hr96(NR1J亚家族)识别不同半位点的尾对尾二聚体GT(G/T)CA。果蝇属knrl(NR0亚家族)无人类同源基因,识别G(a/G)(G/T)CA基序,而任何人类核受体都无法识别该基序。NR1亚家族中的发散位置用红色三角形表示。A和D中的树状图显示了DNA结合域的氨基酸序列相似性。(F类)具有不同特异性的TF的生物学作用概述。细胞类型和生物功能在果蝇属(左)和人类(右)。对于一些具有多种功能的TF(例如,bZIP和HOX蛋白、核受体),为了清楚起见,只显示了一种不同的作用。除了其不同的作用外,Hr96及其直系同源基因也具有共同的功能(外源性反应;(King-Jones等人,2006;Reschly和Krasowski,2006))。注意,具有新特异性的TF通常与其他生物体中不存在的细胞类型相关。参考文献:1(Lunde等人,1998年);2(Hsouna等人,2004);(波尔和诺尔,2002年);4(Horner等人,2009年);5(Schwank等人,2008);6(Doumpas等人,2013);7(Seong等人,2011年);8(Gregorieff等人,2009年);9(Bartel等人,2000年);10(Lu等人,2003);11(Oliveira等人,2004年);12(Pardee等人,2011年);13(Zakany和Duboule,2007);14(Maekawa等人,1999年);15(Chen等人,2012)。图7源数据1提供了原始数据和脚本。内政部: http://dx.doi.org/10.7554/eLife.04837.030
图7——图补充1。
图7补充图1.CG30420和CRE家族bZIP蛋白特异性差异的验证。
(A类)CREB-bZIP/DNA复合物的带状图(绿色为蛋白质,黄色为DNA)和CG30420的DNA识别螺旋模型(粉红色)。箭头表示一种氨基酸的位置,该氨基酸识别底部链胸腺嘧啶(T8)和顶部链胞嘧啶(C14),位于观察到CREB家族CG30420和bZIP蛋白之间特异性差异的位置。与CREB共结晶的DNA序列显示在结构下方(PDB条目1DH3)。(B类)Asn293的近景图,可识别CRE站点的底部链T8和顶部链C14底座。这种残基在CG30420中被精氨酸取代,精氨酸是一种不适合该位点的粗大侧链,很可能直接作用于磷酸骨干。这种氨基酸替代很可能解释了CG30420和CREB家族蛋白在这个位置上观察到的特异性差异。(C类)CREB1和CG30420的序列比对(CLUSTAL/ω)。参与DNA相互作用的残基是有色的(红色=发散的,绿色=相似的)。(D类)CG30420的HT-SELEX再现性。针对CG30420的三个不同结构的独立实验显示出非常相似的结果。内政部: http://dx.doi.org/10.7554/eLife.04837.032

类似文章

引用人

  • 粒头的分化影响染色质的可及性、基因表达和胚胎存活率黑腹果蝇.
    Ertl HA、Bayala EX、Siddiq MA、Wittkopp PJ。 Ertl HA等人。 bioRxiv[预打印]。2024年4月10日2024.04.07.588430。doi:10.1101/2024.04.07.588430。 生物Rxiv。2024 PMID:38645200 免费PMC文章。 预打印。
  • 转录因子亚型之间分子相互作用和调节特性的广泛变异。
    Lambourne L、Mattioli K、Santoso C、Sheynkman G、Inukai S、Kaundal B、Berenson A、Spirohn-Fitzgerald K、Bhattacharjee A、Rothman E、Shrestha S、Laval F、Yang Z、Bisht D、Sewell JA、Li G、Prasad A、Phanor S、Lane R、Campbell DM、Hunt T、Balcha D、Gebbia M、Twizere JC、Hao T、Frankish A、Riback JA、Salomonis N、Calderwood MA、Hill DE、Sahni N、,Vidal M、Bulyk ML、Fuxman Bass JI。 Lambourne L等人。 bioRxiv[预打印]。2024年4月10日2024.03.12.584681。doi:10.1101/2024.03.12.584681。 生物Rxiv。2024 PMID:38617209 免费PMC文章。 预打印。
  • 发育基因和管家基因:人类的两种遗传组织果蝇属基因组。
    Zhimulev I、Vatolina T、Levitsky V、Tsukanov A。 Zhimulev I等人。 国际分子科学杂志。2024年4月6日;25(7):4068. doi:10.3390/ijms25074068。 国际分子科学杂志。2024 PMID:38612878 免费PMC文章。 审查。
  • ETS转录因子调节果蝇精确的基质金属蛋白酶表达和卵泡破裂。
    Zeng B、Knapp EM、Skaritanov E、Oramas R、Sun J。 曾B等。 发展。2024年3月1日;151(5):设备202276。doi:10.1242/dev.202276。Epub 2024年2月28日。 发展。2024 PMID:38345299
  • 亲和力优化增强子变体扰乱了开发。
    Lim F、Solvason JJ、Ryan GE、Le SH、Jindal GA、Steffen P、Jandu SK、Farley EK。 Lim F等人。 自然。2024年2月;626(7997):151-159. doi:10.1038/s41586-023-06922-8。Epub 2024年1月17日。 自然。2024 PMID:38233525 免费PMC文章。

工具书类

    1. Altschul SF、Gish W、Miller W、Myers EW、Lipman DJ。基本的本地对齐搜索工具。分子生物学杂志。1990;215:403–410. doi:10.1016/S0022-2836(05)80360-2。-内政部-公共医学
    1. Amoutzias GD、Veron AS、Weiner J、III、Robinson-Rechavi M、Bornberg-Bauer E、Oliver SG、Robertson DL。10亿年的bZIP转录因子进化:二聚体和DNA结合位点特异性的保存和变化。分子生物学与进化。2007;24:827–835. doi:10.1093/molbev/msl211。-内政部-公共医学
    1. Badis G、Berger MF、Philippakis AA、Talukder S、Gehrke AR、Jaeger SA、Chan ET、Metzler G、Vedenko A、Chen X、Kuznetsov H、Wang CF、Coburn D、Newburger DE、Morris Q、Hughes TR、Bulyk ML。转录因子DNA识别的多样性和复杂性。科学。2009;324:1720–1723. doi:10.1126/science.1162327。-内政部-项目管理咨询公司-公共医学
    1. Barbosa S、Fasanella G、Carreira S、Llarena M、Fox R、Barreca C、Andrew D、O’Hare P。通过跨膜转录因子CREB-H调节分泌途径基因和货物的协调程序。交通。2013;14:382–398. doi:10.1111/tra.12038。-内政部-项目管理咨询公司-公共医学
    1. Bartel FO,Higuchi T,Spyropoulos DD。转录因子Ets家族研究中的小鼠模型。致癌物。2000;19:6443–6454. doi:10.1038/sj.onc.1204038。-内政部-公共医学

出版物类型

赠款和资金