自然遗传学。作者手稿;PMC 2008年9月16日发布。
以最终编辑形式发布为:
预防性维修识别码:PMC2538488型
NIHMSID公司:尼姆斯64535
的动态转录组葡萄裂殖酵母RNA-DNA杂交图谱显示
,1,2 ,三,4 ,1,2 ,4 ,5 ,1,2 ,1,2和1,2
娜塔莉·杜特罗
1美国犹他州盐湖城犹他大学医学院肿瘤科学系,犹他州84132。
2美国犹他州盐湖城犹他大学医学院霍华德·休斯医学院和亨茨曼癌症研究所,邮编84112。
大卫·A·尼克斯
三犹他大学医学院亨茨曼癌症研究所信息学研究所,美国盐湖城84112。
4美国盐湖城84112犹他大学医学院亨茨曼癌症研究所生物信息学核心设施。
德里克·霍尔特
1美国犹他州盐湖城犹他大学医学院肿瘤科学系,犹他州84132。
2美国犹他州盐湖城犹他大学医学院霍华德·休斯医学院和亨茨曼癌症研究所,邮编84112。
布雷特·米拉什
4美国盐湖城84112犹他大学医学院亨茨曼癌症研究所生物信息学核心设施。
布莱恩·戴利
5美国盐湖城84112犹他大学医学院亨茨曼癌症研究所微阵列核心设施。
埃里克·韦斯特布鲁克
1美国犹他州盐湖城犹他大学医学院肿瘤科学系,犹他州84132。
2美国犹他州盐湖城犹他大学医学院霍华德·休斯医学院和亨茨曼癌症研究所,邮编84112。
蒂莫西·帕内尔
1美国犹他州盐湖城犹他大学医学院肿瘤科学系,犹他州84132。
2美国犹他州盐湖城犹他大学医学院霍华德·休斯医学院和亨茨曼癌症研究所,邮编84112。
布拉德利·凯恩斯
1美国犹他州盐湖城犹他大学医学院肿瘤科学系,犹他州84132。
2美国犹他州盐湖城犹他大学医学院霍华德·休斯医学院和亨茨曼癌症研究所,邮编84112。
1美国犹他州盐湖城犹他大学医学院肿瘤科学系,犹他州84132。
2美国犹他州盐湖城犹他大学医学院霍华德·休斯医学院和亨茨曼癌症研究所,邮编84112。
三美国盐湖城犹他大学医学院亨茨曼癌症研究所研究信息学,邮编84112。
4美国盐湖城84112犹他大学医学院亨茨曼癌症研究所生物信息学核心设施。
5美国盐湖城84112犹他大学医学院亨茨曼癌症研究所微阵列核心设施。
作者贡献N.D.、D.A.N.和B.R.C。;系统设计和实验方法。B.D.公司。;阵列方法优化。D.A.N.、N.D.、B.M.、T.J.P.、D.H.和B.R.C。;阵列设计、数据分析方法和数据分析。E.W。;特征计算。N.D.、D.A.N.和D.H。;数字。B.R.C.、N.D.和D.A.N.撰写了手稿。
- 补充资料
映射。
GUID:EC678009-964F-4319-9D86-79D2058BDDB3
摘要
我们已经测定了裂变酵母的高分辨率特异性转录组S.pombe公司在多种生长条件下使用新型RNA-DNA杂交图谱(HybMap)技术。HybMap使用针对RNA-DNA杂交的抗体检测与高密度DNA寡核苷酸拼接微阵列杂交的RNA分子。HybMap显示了优异的动态范围和再现性,使我们能够识别特定于股的编码、非编码和结构RNA,以及以前未知的保存在遥远酵母物种中的RNA。值得注意的是,我们发现几乎整个常染色质基因组(包括间基因)都是转录的,异染色质抑制了基因间转录。我们鉴定了包括大量条件特异性非编码RNA、广泛的反义转录、反义转录的新特性和诱导的发散转录在内的特征。此外,我们的HybMap数据告知了全基因组RNA剪接的效率和位置。最后,我们在着丝粒内异染色质边界的tRNA周围观察到了股特异性转录岛。在这里,我们从生物体适应性和转录组进化的角度讨论这些新特征。
最近,全基因组转录监测方法揭示了真核转录组的几个令人惊讶的特征,包括广泛的基因间转录、反义转录和大量的非编码RNA(ncRNA)1-6此外,已经发现,在某些情况下,重要的是转录行为(或伴随的染色质修饰),而不是产生的ncRNA7这些研究共同开创了定义遗传元素的新纪元,并引起了人们对理解基因组中非编码RNA的目的和功能的高度兴趣。全基因组转录组绘图已成为一种重要的方法,有助于理解转录动力学和转录-色素关系,并识别候选功能性ncRNAs。
传统的转录谱分析方法经常充满偏差,因为难以标记分离的RNA以在微阵列格式上进行检测8为了规避这些限制,我们使用了一种先前表征的RNA-DNA杂交抗体,该抗体已用于以阵列形式量化结构化和小RNA的RNA水平9在这里,我们改进并扩展了这种方法,创建了一种获取整个基因组的股特异性转录组的技术,称为HybMap,它不受传统方法的许多常见技术限制的影响。为了应用HybMap,我们选择了裂变酵母葡萄裂殖酵母,是理解转录和染色体生物学的重要模式生物,具有高度紧凑的基因组。基本要素S.pombe公司基因组包括三条染色体上13.8 Mb的DNA,20 kb的线粒体DNA,以及少于5000个蛋白编码基因(每~2.5 kb 1个)。基因组的详细特征将在转录组的背景下讨论。
我们的工作有四个目标:(i)开发一种技术,用于以高分辨率和低成本获得基因组的准确特异性转录组,(ii)应用该技术来推导S.pombe公司转录组,(iii)为将来的研究揭示新的候选ORF和ncRNAs,以及(iv)揭示转录的新特征,以帮助我们理解转录和染色质之间的关系。
结果
HybMap RNA-DNA杂交图谱
为了创建高分辨率和特定于绞合线的阵列,我们将整个阵列的两条绞合线平铺S.pombe公司带有458566个60-mer DNA寡核苷酸“探针”的基因组(55碱基分辨率,5碱基重叠)。顶部(正向)链上的所有60-mer探针在底部(反向)链上都有一个精确的60-mer反向补体探针,可以监测链特异性转录。我们还包括来自斑马鱼的500个60 mer对照探针(达尼奥雷里奥)基因组不存在于S.pombe公司用于阵列归一化的基因组,并提供有助于与真基因组进行比较的非特异性杂交背景信号水平S.pombe公司探针;斑马鱼控制探头的中间水平在下文中称为“背景”,并在所有图中用虚线表示。
HybMap技术可以利用提取的总RNA,而无需进行poly(A)选择、反转录、RNA(或DNA)扩增或核酸标记;因此,省略了可能严重影响RNA库和/或不利于分离小的非编码或结构化RNA的步骤。纯化的总RNA杂交到平铺阵列,然后与识别RNA-DNA杂交的单克隆抗体(S9.6)孵育。然后,我们用荧光团Cy3标记的二级抗体孵育阵列,允许定量(补充方法在线)。针对RNA-DNA杂交的S9.6抗体以前曾被用于阵列形式的转录检测9,10.S9.6具有可忽略的序列特异性10并且GC含量没有明显偏差(补充图1在线)。S9.6识别出~15 bp的杂交9,我们通过分析来自具有不同寄存器重叠阵列探针的tRNA的信号,独立验证了这一结果(补充图2在线)。S9.6对失配非常敏感:一个15 bp的失配碱基对将信号减少80倍,第二个失配将信号减少约20000倍(补充图3和补充表1在线)。
大量转录的证据S.pombe公司
我们从生长在富培养基中的原营养菌株的两个单独培养物(生物复制品)中纯化了总RNA(稍后介绍的poly(a)RNA),并进行了HybMap(见方法)。HybMap提供了~7600倍的信号强度范围(日志上为12.9倍2实际上,阵列上的所有探针的平均信号强度都远高于背景控制探针(补充图4在线)。值得注意的是,99.6%的平滑双探针窗口的信号高于背景,为常染色质的广泛转录提供了初步证据S.pombe公司基因组。以前曾报道过其他基因组中的广泛转录11,12; 然而,我们使用内部控制探针和股特异性方法可以在全基因组范围内进行直接定量比较。我们注意到,与所有阵列格式一样,HybMap并不直接测量转录速率,而是提供稳态RNA测量。
与定义基线相关的转录
确定一个基因是激活还是沉默需要一个基准参考标准。绝大多数基因间区域(异染色质区域除外)似乎在非常相似的水平上转录,比背景高约12倍(). 为了准确量化这个基础水平,我们确定了所有基因间区域的转录中值,在两端修剪240 bp以限制大量5′和3′UTR延伸的影响(下文讨论)。该修剪后的基因间值在下文中称为“基线”,并用图中的实线表示;基线是背景的12倍。值得注意的是,根据注释的基因及其链特异性,信号强度通常沿物理图偏离基线。
大量转录S.pombe公司基因组。(一)S.pombe公司探针根据基因组特征进行分类,并根据基因定位将其分为正反义探针。(b条)转录的基因组百分比(年轴)在不同的信号阈值下(x个轴),表示两个不同的测量单位,基因或碱基对。
根据广泛转录,5049个基因中有87%、79%的被询问碱基对(25180884)和75%的寡核苷酸探针表达在或高于基线水平(). 根据信号强度,我们计算出平均注释基因转录比基线高约12倍,比背景高149倍。不同基因类别的中位数信号如所示对于Pol II基因,最高信号为核糖体蛋白基因,高于基线630倍,高于背景约7600倍。
常染色质的转录特征
为了说明常染色质的高分辨率特征,我们显示了两个基因组区域的HybMap信号强度以及当前注释(). 一个区域具有相对简单的转录结构;大多数基因位于一条链上的串联方向(底部/反向),数据通常符合当前注释,UTR命名除外(). 第二个区域的HypMap结果与几个位置的注释有很大偏差,例如,归因于斯诺52错误的链、较长的非翻译RNA(UTR)延伸以及反义转录的出现(). 我们将在整个手稿中详细分析这两个区域的元素,以说明概念。
常染色质的转录和剪接特征。描绘了不同基因座的高分辨率视图。物理图以特定于股的方式呈现,带有当前注释的外显子(灰色框)和内含子(灰色线)。沿着顶部/正向(蓝色)和底部/反向(橙色)链提供探针的RNA信号强度(探针居中)。每个链的背景(虚线)和基线(实线)都显示出来。(一)通常符合当前注释的轨迹。括号表示信号仅在TSS附近的一条绞线上低于基线的区域。(b条)在几个位置偏离当前注释的轨迹。未命名的UTR和反义转录很明显。(c(c))一个典型的位点,信号强度根据注释的内含子下降。(d日)无R54信号从内含子中反映其转录和处理瓜1.snoRNAs高度稳定,通常积累到远远超过其宿主RNAs的水平。(e(电子))tRNA基因是多拷贝和高转录的,导致信号饱和。我们注意到,由于tRNA之间的高序列保守性,它们的信号不能被唯一地归因。
UTR和RNA处理的特点
和其他生物一样1,三我们通常观察到Pol II基因的5′-尤其是3′-UTR在当前注释之外的延伸:65%的延伸超出了其注释的5′端,87%的延伸超出其注释的3′端;5′UTR中位数为81 bp,3′UTR中位数为231 bp。附加功能、GO-TERM分类和UTR讨论(包括重叠收敛的3′UTR)见补充表2,补充图5和补充说明在线。
根据目前的注释,内含子位于43%的基因中,平均约81个碱基13因此,我们通过一个完全位于内含子-外显子边界内的探针(内含子探针)和两个与边界重叠的探针(边界探针)来查询大多数内含子。我们的数据验证了拼接在S.pombe公司,因为内含子探针显示信号强度相对于外显子探针平均下降32倍(). 目前对预测内含子的注释似乎大体上是准确的;94%的注释内含子检测显示信号强度显著降低。然而,在剩下的6%中,5%的表达水平与周围基因的表达水平相似,这表明拼接效率低下或可能存在误译。值得注意的是,剩下的1%显示的信号强度是周围基因的八倍以上(),包括位于注释蛋白编码基因内含子内的三个潜在的ncRNAs,我们通过链特异性qPCR-rps3、SPBC1734.10c和SPAC6F6.03c进行了验证(补充图6和补充表3在线)。由内含子处理的独特转录物很少;只有四个注释在S.pombe公司,都是snoRNAs(). 由于成熟的snoRNAs是结构化的,并且没有poly(a)尾,因此它们在其他转录组格式中的代表性很低三,而它们是HybMap数据集中异常突出的功能。最后,tRNAs是提供极高信号的结构化RNA()尽管我们注意到它们的相似性排除了精确的映射。
大量未注释的抄本
我们观察到大量未注释的转录单位(片段),称为“转换”12例如,最近确定的14,15端粒酶ncRNA(TER1)在我们的数据集中很容易观察到(). 我们根据以下标准确定了转换:(i)两个或多个连续探针的伪中值至少比基线高3.5倍,(ii)与任何注释元素的分离至少180 bp。使用这些阈值,我们在富介质中定义了7093个先前未知的变换,增加阈值会产生较低的变换数(). 其中,38%居住在基因间区域()35%与已知转录物反义(). 其余的位于基因间UTR边界,是独立的转染片段和长时间未标记的UTR的混合物。两种RT-PCR检测了20个输血器(补充表3)和股特异性定量PCR,均得到验证(补充图6). 然后,我们分析了RNA Pol II的全基因组占用情况(参考文献。16)并发现包括SPAC6F6.03c(如上所述)在内的大多数高转录转染物显示Pol II水平远远高于基因组平均水平(和数据未显示)。综上所述,HybMap和Pol II ChIP数据揭示了大量潜在的新转录物。
转录片段和潜在非编码RNA的定量。Transfrags是根据阈值标准进行量化的。HybMap识别的新Transrags用阴影框表示。(一)最近发现的ncRNA TER1在我们的数据集中被观察为一种转换。(b条)全基因组分析在每种情况下都会产生类似的高转化率。(c-e公司)来自聚(A)富集RNA(覆盖蓝线)和Pol II ChIP(绿线)的数据为潜在ncRNA的存在提供了证据。转片段存在于三种一般的基因组环境中:基因间区域(c(c)),在已知基因的反义链中(d日)在内含子区域(e(电子)).
替代生长和应激条件的转录组
然后,我们导出了用于替代生长和胁迫条件的转录组:最小培养基、热应激和DNA损伤(甲基磺酸甲酯,MMS)。正如预期的那样,GO分析显示了与所施加条件相关的基因类别的变化(补充表4-9在线)17在这里,我们只讨论主要的一般特征,以条形格式显示富介质的信号强度,以叠加的彩色线显示替代条件的信号强度(). 对于热应激,热休克基因热休克蛋白16在30°C时适度转录,但在热应激期间上调了10倍以上(). 同样,硫胺素生物合成基因(thi4个)和奋乃静代谢(阿塞尔)分别在最小介质或DNA损伤中上调(). 完整的数据集可在国家生物技术信息中心基因表达综合数据库(NCBI GEO)中获得(参见方法中的加入代码部分)。
来自不同生长条件的转录体和位点。来自替代生长条件(彩色线)的信号覆盖在标准条件(条)上。(a-f型)热应力下(a、 b),最小介质(c、 d日)或彩信治疗(e、 如果); 特定基因的表达(a、 c、e)和变压器(b、 d、f)被诱导。
在替代生长条件下,运输量上调
为了确定每个生长条件下的候选功能性ncRNAs,我们定义了每个条件下相对于其在富培养基中的值显著增加或减少的转换,称为“衍射”(差分转换)。为了量化衍射,我们首先选择了特定的转化物——那些在初始状态下从基线上调了3.5倍以上,并且存在于距离注释基因>180 bp的基因间区域(总计约7200,). 然后,我们确定(针对每种情况)这些转换的百分比,其信号强度与富介质中的水平相差两倍以上。根据这些标准,我们发现在热应力状态下,“衍射”变形的百分比为24%,在最小介质中为12%,在MMS状态下为15%。因此,当生长条件改变时,非注释转录组的很大一部分会发生改变。显著衍射的例子包括热应激期间反义链上产生的ncRNA()和两个来自基因5′末端附近的基因间区域,无论是在最小培养基还是MMS中().
转录位点的保存
然后,我们确定通过HybMap新鉴定的RNA在远亲酵母物种中是否保守。我们选择了20个新发现的跨多个探针的RNA(通常>5个探针),其表达量是基线水平的10倍以上,然后对两个最近测序的日本血吸虫和章鱼链球菌.使用严格的截止值(E类值为10−4),我们发现其中11个RNA在八孢链球菌和3个远亲日本角鲨该分析表明HybMap确实揭示了新的功能转录本。为了确定这些RNA编码蛋白质的潜力,我们进行了一个3帧翻译,并搜索了具有特定于S.pombe公司; 20个RNA中有8个显示了这种ORF。最后,我们的保守和ORF搜索的交叉点确定了两个RNA(转换基因Q和AA),它们在预测的最长ORF内共享密码子偏置和序列保守(在下文和补充表10在线)。因此,HybMap将具有重要功能潜力的转化酶识别为ncRNAs或小蛋白。
反义转录物的性质
反义转录发生在哺乳动物基因组的特定位点18以及在美国。绒球19基因组。在这里,我们描述了其范围全基因组、性质和来源(和). 首先,我们观察到来自正反义探针对的信号之间存在显著相关性(+0.595,P(P)值<2×10−16),以及在反义信号和RNA Pol II占用之间(+0.50,P(P)值<2×1016). 在动态转录组比较中,感觉-反义相关性尤其明显:在热休克期间,基因上调>4倍,表明反义转录显著增加,而受抑制的基因则显示出显著减少(). 值得注意的是,反义转录与组蛋白H3占有率略有负相关(-0.20;P(P)值<2×10−16)16,但与H3K36me3略有正相关(+0.21;P(P)值<2×10−16),在Pol II转录区发现的标记。总之,这些结果增加了高转录区和轻度组蛋白缺乏区易受反义转录增加影响的可能性;也就是说,强义转录产生反义转录。
反义转录的特征。(一)正反义转录的相关性。432个基因在热休克方面与标准条件相差至少四倍。对于每个基因,将正义链的中位数变化绘制为反义链。(b、 c)标准条件下的信号(条)覆盖聚(A)富集数据(覆盖蓝线)。反义转录通常可分为两类,包括具有可忽略的聚腺苷酸反义转录物的基因(绝大多数)(b条)和带有多聚腺苷反义转录物的罕见基因(c(c)).
值得注意的是,我们对聚(A)选择的RNA样本的检测表明,反义转录物高度减少(和)这表明大多数反义转录物缺乏多聚腺苷酸化。此外,由于缺乏反义信号,信号在基因上与背景的偏离通常更大,注释基因之间的区别也更清楚(). 然而,在我们的poly(a)数据集中,我们确实发现了一些反义信号沿整个基因高的位置,这表明某些反义转录物,包括来自编码某些转录因子的基因的转录物,确实是聚腺苷化的(和补充表11在线)。不同RNA PolI/II/III类反义转录物的其他特征在补充说明.
Poly(A)RNA表现出不同的转录和以前未知的RNA转录。(一)我们在用poly(A)数据覆盖(实心紫色线)。括号表示三个不同于hsp60,cip2和SPAC630.07c。值得注意的是,由于非腺苷酸反义的盛行,这些转录物在总RNA中无法区分。(b、 c)聚腺苷化转录物清楚地对应于相关酵母物种中最保守的两种转化物中的每一种。
诱导分化转录
我们数据集的一个特别显著的特征是“诱导分化转录”的流行,其中转录物位于远离高转录注释基因启动子的相反链上。例如,在热应激期间,转录本偏离热休克蛋白16相反链上的启动子,产生包含大多数侧翼基因的反义转录物(); 这已通过特定于股的qPCR证实(数据未显示)。另一个已确认的实例是cnl2-thi4最小介质中的轨迹(和数据未显示)。
以前未知的发散性poly(A)RNA在我们的静态poly(A)数据集中也很常见,这表明发散性转录是许多位点基础转录的一个特征。例如,我们发现poly(A)转录本与hsp60,cip2和SPAC630.07c系列(). 其中两个不同的转录本,热休克蛋白60和计算机集成电路2,通过链特异性qPCR进行测试和验证(数据未显示)。由于高水平的反义(通常不是聚腺苷化的),这些未标记的聚(A)转录物在总RNA数据集中变得模糊,但在聚(A(). 此外,我们发现与两个转录本(transrag Q和AA,补充表10)在三种相关的酵母中高度保守,并且共享S.pombe公司密码子偏倚(). 因此,总RNA和聚(A)选择的RNA数据集有助于揭示转录组的不同方面。
TSS前的特定于绞线的引入信号
我们通常在串联基因上观察到的一个特征是,在真正的转录起始位点(TSS)之前,感觉探针的信号强度降低。这方面的一个明显示例如所示,其中“dips”在紧邻5′端的感觉链中被选择性地看到(注意,这些基因位于底部/反向链上)。虽然很常见,但它并不是一个不变的特征。目前,我们不理解这一共同而奇怪的特征的基础。
端粒染色质的基因间转录测量
这个S.pombe公司基因组包含三种异色区域:端粒、着丝粒和沉默交配位点。在酵母菌中,抑制性端粒异染色质从端粒末端(含有重复元素)传播到染色体臂,并被与转录相关的染色质修饰所反对19,20、转录本身或Pol III基因(TFIIIC结合位点)21.英寸S.pombe公司,异色区域带有H3K9me(参考。22). 我们数据的一个显著特征是,随着检测从基因富集臂向端粒的推进,基因间转录从基线水平逐渐下降到接近背景水平的程度(); 当遇到H3K9me时,基因间转录信号在两条链上同步下降。我们认为基因间区域内的机会主义转录水平可以作为染色质沉默程度的替代测量。
异色位点和侧翼区域的转录特征。来自顶部/向前和底部/反向绞线的信号被覆盖,以实现直接比较。下面的彩色实线表示唯一(绿色)和非唯一(紫色)探针的位置。(一)端粒附近的转录抑制。1号染色体亚卵裂球的物理图谱伴随着异色标记H3K9me2(ChIP数据,黑色)和与转录ORF相关的标记H3K 36me3(ChIP信息,绿色)的图谱。值得注意的是,随着来自H3K9me2的信号增加,基因间转录接近背景水平。(b条)1号染色体着丝粒内的转录。值得注意的是,这两条链都转录于dh1型重复。转录高表达tRNAs两侧的相反链。染色体2和3的结果见补充图7.
着丝粒的转录特征
的着丝粒S.pombe公司都很复杂。为了简单起见,我们将其分为四个一般区域:(i)一个部分独特的中央区域,它含有高水平的组蛋白H3变体CENPA23,24,两侧是(ii)一个最内层的重复序列,带有一组tRNAs,这可能有助于形成一个边界21,25在中心区域和(iii)重复DNA元件区域之间(dg、dhI,其他),通过RNAi依赖机制沉默(涉及H3K9me和组蛋白去乙酰化),通常由(iv)位于沉默重复区(异染色质)和表达基因之间边界的不同数量(chr.1,右侧除外)的tRNA介导26-31对于重复元素,信号代表类平均和,在某些重复区域,考虑拷贝数时,几乎没有转录。然而,中心仪的某些部分(即侧面dh1型)清晰地转录,并具有来自两股的可观察信号,与早期报告一致32我们的数据有助于确定转录的位置和大小(和补充图7在线)。额外的异色区(MAT基因座,补充图8以及rDNA位点(补充图9在线)。
异染色质中的tRNA和绞线特异性转录
着丝粒数据集的一个显著特征是位于imr重复序列中的tRNA的影响。我们注意到,tRNAs自身的信号不能唯一地归因于地图位置,因为它们的相似性。然而,tRNA转录本本身并不是人们感兴趣的特征。相反,我们观察到tRNA周围的区域选择性地转录在tRNA相对的链上(,补充图7和数据未显示)。在大多数情况下,这些侧翼序列是唯一的,可以确定归属。此外,常染色质中的tRNAs通常没有观察到这种明显的特异性效应(). 因此,通过一种未知的机制,Pol III转录或机器似乎在异染色质内创建了一个“岛”,使tRNA对侧链上的机会转录成为可能。
讨论
这里,开发了一种高密度股特异性转录组分析方法,并应用于S.pombe公司我们发现HybMap是一种简单、重复性高、准确且相对便宜的技术,应该广泛应用于其他生物。由于HybMap使用的是总RNA,没有扩增或标记,所以结构和非多聚腺苷酸化的RNA被保留下来并被清楚地检测到。虽然我们的研究是在单个阵列平台(安捷伦技术公司)上进行的,但该技术的简单性应允许其应用于其他阵列平台,尽管我们还没有直接进行测试。我们使用了一大组内部控制探针(来自斑马鱼),实现了阵列的有效规范化,并提供了非特定背景信号的测量,这是区分噪音和真实转录的重要特征。该技术的敏感性和广泛的动态范围使我们能够检测基因间和反义转录的新特性,以及转录组的其他特征。
首先,我们提供了大量有助于改进基因组注释的信息,包括在各种阈值标准下的大量先前未知的ncRNA。特别令人感兴趣的是在替代生长条件下非注释基因座(diffrags)的选择性变化。未来研究的一个挑战是确定这些转录物的多少比例有助于一般或条件依赖性健康。在这里,我们对总RNA和聚(A)选择RNA的单独数据集将被证明有助于确定这些转录物是否更可能是新编码或非编码RNA。
我们为基因间区域的广泛转录提供了证据S.pombe公司虽然我们还没有评估这种转录的目的,但我们假设了几种可能的用途。首先,这种转录可能对抗抑制性染色质,并可能通过帮助增加组蛋白周转来帮助染色质动力学,从而为转录因子和其他DNA结合蛋白提供可搜索的空间。或者,它可能是一种定位DNA损伤的机制,RNA聚合酶招募因子用于转录偶联修复受损部位33最后,我们强调其在基因组进化中的可能用途:通过机会主义转录,细胞可以在基因组序列空间中寻找新的有用编码或ncRNAs,从而将机会主义的转录转化为功能性转录。通过这种机制,ncRNA或小ORF有机会(例如通过突变或插入)从一个次要的贡献者进化为一个更重要的贡献者。来自间基因的转录物通常不被聚腺苷酸化,但可能仍足以生成低水平的肽,其组成和丰度可以通过突变和选择进行修改。一个特别显著的特征是在某些强启动子上的基础转录和诱导分化转录,这些启动子通常是多聚腺苷化的(). 一种解释是,这些转录物可能是由方向保真度的错误调节引起的,基本因子(如TBP)和RNA聚合酶只是在“错误”方向上组装和启动,这可能是TBP结合缺乏序列严格性的结果。然而,我们推测这一过程可能为编码或ncRNAs的协调表达进化提供了一种手段;通过突变、重排或插入,一个更有用的发散启动子和转录子可以从这个初始版本进化而来。因此,最初看似浪费和不准确的转录组实际上可能是帮助适应的工具。
我们在基因中观察到广泛的反义转录,这表明通常缺乏多聚腺苷化。因此,反义转录可能在没有充分利用因子(基础和染色质)进行位点特异性启动子启动和加工的情况下产生,尽管这仍有待正式测试。我们观察到高转录和组蛋白缺乏基因的反义转录增加,这与开放染色质的机会主义起源一致。目前,尚不清楚基因内的反义转录在S.pombe公司我们注意到异染色质(端粒;). 我们认为基因间转录水平可作为大区域染色质状态的替代测量,聚合异染色质可防止机会性启动。
一个关键问题是如何将机会主义意义和反义转录与S.pombe公司RNAi途径,因为双链RNA可导致siRNA沉默32,34-36首先,由于HybMap不能测量细胞dsRNA的水平37,尚不清楚互补正/反义转录物是否真的是双链的体内然而,已知siRNA产生的正反馈回路利用了新生的poly(A)RNA,而我们的数据表明,绝大多数反义转录物缺乏聚腺苷酸化。因此,缺乏多聚腺苷酸化可能有助于阻止机会性dsRNA进入RNAi途径。
一个特别值得注意的特征是靠近5′端的感觉链特异性“dip”,最常见于串联基因。其中一种推测可能性是,增强子和起始前复合物之间可能形成DNA环,增强器结合蛋白可以捕获来自上游基因的机会性RNA聚合酶,然后将Pol II直接传递到起始前复合体,从而防止其在一个特定方向上通过和转录循环区域。另一个股特异性特征是异染色质中tRNA反义链上存在转录“岛”。在这里,我们将有兴趣确定这种情况是如何发生的,以及这种转录是否有助于形成中央区域(承载CENPA)和中心周围重复区域的非常不同的染色质之间的边界。这一特征可能在机械上类似于先前证明的MAT位点异染色质边界元件(TFIIIC结合位点)附近的转录21。这些是S.pombe公司转录组值得在未来的研究中探索。
方法
酵母菌株和处理条件
酵母的生长、操作和分子生物学都是按照标准协议进行的。我们使用了原营养波姆裂殖酵母h90所有实验的应变。对于富培养基,除非另有说明,否则菌株在酵母提取物上生长,其中葡萄糖(2%)补充有组氨酸、尿嘧啶、亮氨酸和腺嘌呤,温度为32°C,光密度为600 nm 1.0。我们采集细胞,在机械粉碎后,我们将细胞材料储存在−80°C。对于热休克转录组,细胞在600 nm处培养到1.0的光密度,并转移到在40℃水浴中预热的烧瓶中。培养细胞,摇晃15分钟,然后收获。对于最小的培养基转录组,细胞在缺乏氨基酸和含有2%葡萄糖的培养基中培养。对于甲基磺酸甲酯转录组,细胞在600 nm处培养至0.6的光密度,并用MMS(0.02%)处理1 h。
核酸纯化
我们使用Ambion提取总RNA米尔Vana试剂盒和用Qiagen Oligotex PolyA纯化试剂盒分离的poly(A)RNA。
平铺阵列的设计
我们将整个S.pombe公司基因组,包括线粒体基因组,每55个碱基对含有60个寡核苷酸。我们在正向链上生成了每个探针的反向互补,以平铺反向链,总共458566个探针。此外,我们从斑马鱼阵列中添加了500个探针,与S.pombe公司作为后台控件。斑马鱼探针的GC含量中位数(37%)和熔化温度(71°C)与S.pombe公司探针。我们使用BLAST算法将每个探针与基因组对齐,以获取拷贝数信息。这套由两个244K阵列组成的阵列由安捷伦科技公司制造。
阵列杂交和抗体检测
RNA样品(15μg总RNA或1μg聚(A)RNA)被切割并与安捷伦Hi-RPM GE杂交试剂盒试剂结合。然后,我们将这些样品与阵列载玻片在65°C下杂交17小时。载玻片用6×SSPE(0.005%)洗涤N个-月桂酰肌苷在20°C和0.06×SSPE中保持1分钟,0.005%N个-月桂酰肌苷在31°C下放置1分钟。然后,我们将载玻片与0.025 mg/ml抗RNA-DNA杂交复合物的初级单克隆小鼠抗体孵育,该复合物可在ATCC(HB-8730)的杂交瘤细胞系中获得。将抗体稀释在500μl SB+BSA(100 mM MES,pH 6.6,1 M NaCl,0.05%吐温20和1 mg/ml BSA)中。60分钟的孵育温度为25℃。培养后,我们在NSWB(6×SSPE,0.01%吐温20)中清洗载玻片四次,持续3分钟。在500μl SB+BSA中以3μg/ml的浓度使用Cy3标记的山羊抗小鼠第二抗体(KPL,078−18−061)。我们将载玻片与第二抗体在25°C下孵育60分钟。最后,我们在室温下将载玻片在NSWB中清洗四次,持续3分钟,并使用扩展动态范围软件在安捷伦G2505B微阵列扫描仪中进行扫描。扫描图像的特征提取是使用安捷伦特征提取软件9.5.1版完成的。
计算分析方法
本分析中使用的所有软件都是开源的,可以从TiMAT2项目站点获得。我们获得了S.pombe公司Wellcome Trust Sanger Institute的注释和基因组序列(此处称为2007年4月的构建)。这些文件以及低级和高级分析文件都可以从我们的bioserver下载。请参阅下面的相关URL。
转录组分析
对于静态图谱,安捷伦微阵列转录组数据的处理分为三个基本步骤:数据规范化、滑动窗口摘要和富集区域识别。对于每个条件(生长和或RNA分数)和链,我们从cy3通道中提取未经调整的信号强度中值。然后,我们将探针映射到2007年4月的构建,并保留那些精确匹配<100的探针。每个条件下分离出两个生物复制样品,在复制对之间,数据集高度相似(热应激、,第页= 0.96; 最小介质,第页=0.96;DNA损伤,第页= 0.97). 我们对每个条件的配对数据集进行分位数归一化38以及两种不同的缩放方式。首先,我们对数据进行了缩放,使斑马鱼对照探针的中位数为1。在第二个实验中,我们对数据进行缩放,使修剪后的基因间区域探针的中位数为1。修剪的基因间探针被定义为任何已知注释中>240 bp(4个探针)的探针。我们通过记录来计算探针级别的“oligo”摘要2每个条件下两个生物复制探针的平均值。窗口级摘要是通过识别包含两个或多个寡核苷酸起始位置的60 bp窗口并计算日志生成的2相关值的伪中值。该窗口汇总得分被分配到窗口“Pse”的中心位置,或表示为热图“PseHM”数据。最后,通过合并超过设定阈值且相邻或重叠的窗口,识别出高得分窗口的扩展区域,称为“间隔”。我们根据修剪后的基因间或斑马鱼对照中位数以上的相对转录选择了几个不同的阈值。
动态差异图
为了确定不同RNA组分(总RNA和poly(A))和不同生长条件(丰富、最小、DNA损伤和热休克)之间的变化区域,我们使用了与生成静态图类似的方法。对每种情况下的两个生物复制品进行分位数标准化和缩放,使斑马鱼对照组的中位数为1。我们通过获取日志来计算探测级别摘要2平均治疗与平均对照之间的比率。对照数据定义为来自富培养基条件的RNA或总RNA。我们通过识别包含2个或更多寡核苷酸的60-bp窗口来计算窗口级摘要。通过首先计算治疗和对照复制品探针之间的所有相对差异对,以及其次计算这些相对差异对的伪中位数,对这些窗口进行评分。在某些情况下,将伪中位数相对差异分数转换为对数2(比率)。最后,将重叠的高得分或低得分窗口合并为区间,并根据其最佳窗口得分进行排名。
致谢
我们感谢S.Leppla(美国国立卫生研究院)慷慨提供S9.6抗体,感谢Bob Schackmann(犹他大学)提供寡核苷酸合成。这项工作得到了霍华德·休斯医学研究所(B.R.C.、D.H.、T.J.P.和供应品)、美国国立卫生遗传学研究院培训拨款T32 GM007464(N.D.)、亨茨曼癌症研究所(D.A.N.)和CA24014(核心设施)的支持。
工具书类
1Birney E等人。通过ENCODE试点项目鉴定和分析人类基因组中1%的功能元件。自然。2007;447:799–816. [PMC免费文章][公共医学][谷歌学者] 2Okazaki Y等。基于60770全长cDNA功能注释的小鼠转录组分析。自然。2002;420:563–573.[公共医学][谷歌学者] 三。David L等人。酵母基因组中高分辨率转录图谱。程序。国家。阿卡德。科学。美国。2006年;103:5320–5325. [PMC免费文章][公共医学][谷歌学者] 4Washietl S、Hofacker IL、Lukasser M、Huttenhofer A、Stadler PF。保守RNA二级结构的定位预测了人类基因组中数千个功能性非编码RNA。自然生物技术。2005;23:1383–1390.[公共医学][谷歌学者] 5Kampa D等。通过对人类21号和22号染色体转录组的深入分析发现的新RNA。基因组研究。2004;14:331–342. [PMC免费文章][公共医学][谷歌学者] 6Steigele S、Huber W、Stocsits C、Stadler PF、Nieselt K酿酒酵母表示多种不同的功能。BMC生物。2007;5:25. [PMC免费文章][公共医学][谷歌学者] 7Struhl K.转录噪声和RNA聚合酶II启动的保真度。自然结构。分子生物学。2007;14:103–105.[公共医学][谷歌学者] 8Perocchi F、Xu Z、Clauder-Munster S、Steinmetz LM。转录组微阵列实验中的反义伪影通过放线菌素D解决。核酸研究。2007;35:e128。 [PMC免费文章][公共医学][谷歌学者] 9Hu Z,Zhang A,Storz G,Gottesman S,Leppla SH.用于小RNA检测的基于抗体的微阵列分析。核酸研究。2006年;34:e52。 [PMC免费文章][公共医学][谷歌学者] 10Boguslawski SJ等,DNA单克隆抗体的鉴定。RNA及其在杂交种免疫检测中的应用。免疫学杂志。方法。1986;89:123–130。[公共医学][谷歌学者] 11Kapranov P、Willingham AT、Gingeras TR。基因组全转录及其对基因组组织的影响。Nat.Rev.基因。2007;8:413–423.[公共医学][谷歌学者] 12Kapranov P等人。RNA图谱揭示了新的RNA类别和普遍转录的可能功能。科学。2007;316:1484–1488.[公共医学][谷歌学者] 13Wood V等。波姆裂殖酵母的基因组序列。自然。2002;415:871–880.[公共医学][谷歌学者] 14Leonardi J,Box JA,Bunch JT,Baumann P.TER1,裂变酵母端粒酶的RNA亚单位。自然结构。分子生物学。2008;15:26–33.[公共医学][谷歌学者] 15Webb CJ,Zakian VA葡萄裂殖酵母TER1端粒酶RNA。自然结构。分子生物学。2008;15:34–42. [PMC免费文章][公共医学][谷歌学者] 16Gordon M等人。SAPHIRE的全基因组动力学,这是基因激活和染色质边界的基本复合物。分子细胞。生物。2007;27:4058–4069. [PMC免费文章][公共医学][谷歌学者] 17Chen D,等。裂变酵母对环境胁迫的全球转录反应。分子生物学。单元格。2003;14:214–229. [PMC免费文章][公共医学][谷歌学者] 18Katayama S等。哺乳动物转录组中的反义转录。科学。2005;309:1564–1566.[公共医学][谷歌学者] 19Nicolas E等。HDAC复合物在启动子沉默、反义抑制和DNA损伤保护中的不同作用。自然结构。分子生物学。2007;14:372–380.[公共医学][谷歌学者] 20Wiren M等。核小体密度组蛋白乙酰化和HDAC在裂变酵母中功能的全基因组分析。EMBO J。2005;24:2906–2918. [PMC免费文章][公共医学][谷歌学者] 21Noma K,Cam HP,Maraia RJ,Grewal SI。TFIIIC转录因子复合体在基因组组织中的作用。单元格。2006年;125:859–872。[公共医学][谷歌学者] 22Volpe TA等。RNAi对异色沉默和组蛋白H3赖氨酸-9甲基化的调节。科学。2002;297:1833–1837.[公共医学][谷歌学者] 23Allshire RC、Javerzat JP、Redhead NJ、Cranston G.裂变酵母着丝粒位置效应杂色。单元格。1994;76:157–169.[公共医学][谷歌学者] 24Takahashi K等人。裂变酵母着丝粒中具有严格对称性和异常染色质结构的低拷贝数中心序列。分子生物学。单元格。1992;三:819–835. [PMC免费文章][公共医学][谷歌学者] 25Scott KC,White CV,Willard HF.裂变酵母着丝粒1处依赖RNA聚合酶III的异染色质屏障。《公共科学图书馆·综合》。2007;2:e1099。 [PMC免费文章][公共医学][谷歌学者] 26Baum M、Ngan VK、Clarke L。着丝粒K型重复序列和中央核心的结合足以建立功能性葡萄裂殖酵母着丝粒。分子生物学。单元格。1994;5:747–761. [PMC免费文章][公共医学][谷歌学者] 27Partridge JF、Scott KS、Bannister AJ、Kouzarides T、Allshire RC。来自裂变酵母着丝粒的顺式作用DNA介导组蛋白H3甲基化和沉默因子的募集,并粘附到异位部位。货币。生物。2002;12:1652–1660。[公共医学][谷歌学者] 28Steiner NC、Hahnenberger KM、Clarke L.裂变酵母的着丝粒葡萄裂殖酵母是高度可变的遗传位点。分子细胞。生物。1993;13:4578–4587. [PMC免费文章][公共医学][谷歌学者] 29Clarke L,Amstutz H,Fishel B,Carbon J.裂变酵母着丝粒DNA分析葡萄裂殖酵母.程序。国家。阿卡德。科学。美国。1986;83:8253–8257. [PMC免费文章][公共医学][谷歌学者] 30Nakaseko Y,Kinoshita N,Yanagida M葡萄裂殖酵母染色体。核酸研究。1987;15:4705–4715. [PMC免费文章][公共医学][谷歌学者] 31Nakaseko Y、Adachi Y、Funahashi S、Niwa O、Yanagida M。染色体行走显示在裂变酵母的所有着丝粒区域都存在高度同源的重复序列。EMBO J。1986;5:1011–1021. [PMC免费文章][公共医学][谷歌学者] 32Motamedi MR等。两种RNAi复合物RITS和RDRC在物理上相互作用并定位于非编码着丝粒RNA。单元格。2004;119:789–802.[公共医学][谷歌学者] 33Lindsey-Boltz LA,Sancar A.RNA聚合酶:细胞对DNA损伤反应中最特异的损伤识别蛋白?程序。国家。阿卡德。科学。美国。2007;104:13213–13214. [PMC免费文章][公共医学][谷歌学者] 34Cam HP等。异染色质和RNAi介导的裂变酵母基因组表观遗传控制的综合分析。自然遗传学。2005;37:809–819.[公共医学][谷歌学者] 35Verdel A等人RNAi介导的RITS复合物对异染色质的靶向作用。科学。2004;303:672–676. [PMC免费文章][公共医学][谷歌学者] 36Reinhart BJ,Bartel DP。小RNA对应于着丝粒异色重复序列。科学。2002;297:1831.[公共医学][谷歌学者] 37Kato H等人。RNAi依赖性异染色质组装需要RNA聚合酶II。科学。2005;309:467–469.[公共医学][谷歌学者] 38Bolstad BM、Irizarry RA、Astrand M、Speed TP。基于方差和偏差的高密度寡核苷酸阵列数据归一化方法的比较。生物信息学。2003;19:185–193.[公共医学][谷歌学者]