基因组研究。2004年10月;14(10a):1902-1910年。
哺乳动物microRNA宿主基因和转录单位的鉴定
英国剑桥CB10 1SA Hinxton Wellcome Trust Genome校区Wellcome-Trust Sanger学院
2004年4月28日收到;2004年7月27日接受。
摘要
为了对哺乳动物中microRNAs(miRNAs)的转录形成一个全球视角,我们注释了这类非编码RNA(ncRNAs。在已知的232个哺乳动物miRNAs中,我们发现161个与123个定义的转录单位(TU)重叠。我们在90个具有广泛分子功能的蛋白编码基因的内含子中以及66个mRNA-like非编码RNA(mlncRNAs)的内含子和外显子中鉴定了miRNAs。此外,还鉴定了基于宿主基因身份的miRNAs新家族。所有miRNA宿主基因的转录模式都是从各种来源获得的,说明了miRNA表达的空间、时间和生理调节。这些发现强烈表明,miRNAs与其宿主转录物并行转录,这里确定的两种不同的miRNAs-转录类别(“外显子”和“内含子”)可能需要稍微不同的生物发生机制。
MicroRNAs(miRNAs)是一类进化上保守的大类非编码RNA(ncRNAs,noncoding-RNA),长18-22个核苷酸,介导基因转录后沉默。miRNAs最早发现于秀丽隐杆线虫带有的标识林-4和let-7miRNA基因,通过与靶基因3′非翻译区(UTR)的反义结合,充当靶基因的转录后阻遏物;有关综述,请参阅安布罗斯2000). 此后不久,在蠕虫、苍蝇、植物和脊椎动物中发现了数百种其他miRNA(有关综述,请参阅卡林顿和安布罗斯2003;巴特尔2004). 快速的进展已经开始揭示miRNAs在发育和其他生物过程中的遗传作用。例如,在秀丽线虫,let-7和线-4miRNAs作为异慢性基因发挥作用,其中任何一种的突变都会破坏细胞命运的正确规范(安布罗斯2000). 在果蝇属,基因突变miR-14型导致正常细胞死亡模式的中断以及脂肪代谢缺陷(Xu等人,2003年). 在哺乳动物中,已从大量组织和细胞类型中鉴定出约230个miRNAs(Lagos-Quintana等人。2001,2002,2003;Mouralatos等人,2002年;Dostie等人,2003年;Houbavey等人,2003年;Lim等人,2003年;Michael等人,2003年;Kim等人,2004年).
目前的miRNA生物发生和成熟模型表明,miRNA的分区逐步加工首先发生在细胞核中,然后发生在细胞质中。主流观点认为,miRNAs(pri-miRNAs)的初级转录物在细胞核中由RNase III酶Drosha处理成干环中间产物,称为前miRNAs(Lee等人,2003年). 然后,这些前miRNAs被Dicer转运至细胞质进行分裂,并成熟为其活性形式(Lee等人,2003年). 虽然Northern blot分析已检测到少数miRNAs的22-、75-nt RNA以及更长的pri-miRNA转录物,但产生绝大多数miRNAss的转录单位(TU)或基因宿主尚未进行详细研究。
在本研究中,我们开始通过注释哺乳动物miRNAs在人类和小鼠基因组中的位置来确定其转录模式。我们发现,超过一半的已知哺乳动物miRNAs位于蛋白编码或非编码TUs的内含子内,而~10%由长非蛋白编码转录物的外显子编码,也称为mRNA-like noncoding RNAs(mlncRNAs;Erdmann等人,2000年). 我们的注释阐明了miRNA的转录模式,并允许识别miRNA的“内含子”和“外显子”转录类。我们整理了定义明确的microRNA宿主基因的表达模式,以说明microRNA在广泛生物背景下的可能表达模式。
结果和讨论
miRNA注册包含232个哺乳动物miRNA(http://www.sanger.ac.uk/Software/Rfam/mirna/;Griffiths-Jones 2004年). 其中我们鉴定了117个位于蛋白编码基因内含子或长ncRNA转录物中的miRNAs(,补充表A、B)。大约40%(90)的miRNA位于蛋白编码基因的内含子内,而~10%(27)位于长ncRNA转录物的内含子中(). 有趣的是,30个miRNAs与ncRNAs的外显子重叠(补充表C)。在某些情况下(14),miRNAs位于外显子或内含子(“混合”),这取决于宿主转录本的选择性剪接(,补充表D)。当miRNA簇与单个宿主转录物重叠时,绝大多数miRNA位于同一内含子或外显子(补充表a-D)。此外,32个miRNAs与相反DNA链上转录的两个或多个TU重叠(补充表A-D)。这一观察表明,miRNAs通常与复杂的转录位点相关。其余70个miRNAs的转录起源尚不明确,因此没有进一步分析。总之,共有161个miRNAs与mRNAs或ncRNAs的转录相关。基于这些观察结果,我们建议将miRNAs分为外显子(外显子衍生)miRNA或内含子(内含子衍生)micRNAs。
表1。
哺乳动物miRNAs在宿主转录物内含子和外显子中的分布
给出的数字代表与人类或小鼠基因组中转录物重叠的miRNAs总数(见方法)。为了进行比较,转录物内含子中的miRNA根据宿主基因的性质(蛋白质编码vs.ncRNA)进行分离。九种“混合”miRNAs转录于交替剪接的mlncRNA宿主的内含子或外显子中,其余与蛋白质编码宿主基因以及交替剪接转录物的mlncRNAs相关。星号(*)表示仅来自mlncRNA转录物的混合miRNA的数量。
蛋白质编码miRNA宿主基因的部分列表如所示这些miRNA宿主基因编码的蛋白质具有广泛的生物学作用,从胚胎发育到细胞周期和生理学(补充表a、D)。为了对miRNA可能用于其转录的蛋白质编码基因类别进行展望,我们调查了所有miRNA宿主基因的基因本体论(GO)分类(2001年基因本体联盟;http://www.geneontology.org/). GO注释miRNA基因宿主最常见的两种“生物过程”分类是“代谢”(GO:0008152;19/90;21%),其次是“细胞生理过程”蛋白质(GO:00050875;14/90;16%),最常见的GO“分子功能是“嘌呤核苷酸结合”(GO:0017076;8/90;9%)和“DNA结合”(GO:0003677;第7页,共90页;8%)。比较miRNA宿主基因最常见的GO分类和带有GO注释的哺乳动物基因的整个集合,并没有发现这些类别基因的不成比例表示(数据未显示)。我们还注意到,与人类疾病有关的几个基因是miRNAs的宿主。例如,无义、剪接、移码或缺失突变氯化物通道蛋白5(CLCN5公司)基因导致人类患者中的X连锁隐性疾病——牙本质病和肾结石(OMIM:30008;山本等人,2000). 对CLCN5公司-编码的miR-188尚未在该疾病中进行研究。
大量基于内含子的miRNAs存在于蛋白质编码基因的相关家族中(,补充表A、D、E)。这使我们能够根据宿主基因身份将特定的miRNAs组分为新的家族。在某些情况下,宿主基因家族有助于识别相关的内含子miRNAs组(). 例如,miR-148b型和miR-152基因是序列相关的,位于编码共变异转运体亚单位的两个基因中(参见,补充表E)。在其他例子中,我们注意到在相关蛋白质家族中发现的与序列无关的miRNAs。例如,miR-105型和miR-224型位于分别编码配体门控离子通道γ-氨基丁酸受体-α-3和-ε亚单位的两个基因中,尽管成熟的miRNAs在序列上无关().
除了蛋白质编码基因中的miRNAs外,我们还发现TUs中有66个miRNAss缺乏显著的蛋白质编码潜力(). 对这些miRNA宿主TU的更详细分析揭示了一些先前分类的长ncRNAs(见表,和补充表B-D)。这些包括:BIC(Tam 2001年),在白血病2(DLEU2;Migliazza等人,2001年),横纹肌肉瘤中的非编码RNA(NCRMS;Chan等人,2002年),突触特异-7H4(7H4;Velleca等人,1994年)、FLJ34037(Ota等人,2004年)以及大量FANTOM2长ncRNAs(Okazaki等人,2002年;Numata等人,2003年). 以前只有BIC RNA被认为是miRNA的载体(Lagos-Quintana等人,2002年). 这些类型的ncRNA转录物有时被称为mRNA-like ncRNA(mlncRNAs;Erdmann等人,2000年)因为它们与mRNA具有相同的属性,例如剪接(例如BIC:Tam 2001年),聚腺苷化(例如,空气:Sleutels等人,2002年),长转录单位(例如,Xist:Hong等人,1999年),以及可能的空间/时间限制表达(例如,Ntab:French等人,2001年). 大多数非编码mRNA-like RNA的分子/遗传功能尚不清楚,但一些,如Xist和Air,已经进行了更详细的研究。
表4。
微小核糖核酸 | 铬一 | 人类宿主TU IDb | 鼠标主机TU IDb | miRNA定位c(c) | 宿主转录本描述 |
---|
let-7a-2、miR-100、-125b-1 | 11 (9) | 恩塞斯特G00000015836 | ENSMUSESTG00000011922公司 | 内含子2(4) | 新型mlncRNA |
let-7d | 9 (13) | OTTHUMG0000020259 | | 内含子3 | 织女星mlncRNA |
miR-7-2型 | 15 (7) | | ENSMUSESTG0000007393公司 | 内含子1 | 新型mlncRNA |
miR-15a,-16-1 | 13 (14) | OTTHUMG0000016927 | 1810047A1 6瑞克 | 内含子4 | DLEU2 mlncRNA |
miR-30a,-30a*,-30c-2 | 6 (1) | 恩塞斯特G00000011458 | | 内含子3 | 新型mlncRNA |
miR-31型 | 9 (4) | 总计00000019681 | | 内含子1 | 新型mlncRNA |
miR-129-2型 | 11 (2) | 11_43541975 AceView公司 | | 内含子1 | 新型mlncRNA |
miR-132,-212 | 17 (11) | | ENSMUSESTG0000011295 M建筑30 | 内含子1 | 新型mlncRNA |
miR-135a-1型 | 3 (9) | 3_5 2291509 AceView公司 | | | 新型mlncRNA |
miR-135a-2型 | 12(10) | 196475辆NCBI | ENSMUSESTG0000002435公司 | 内含子9(1) | NCRMS mlncRNA |
miR-135b型 | 1 (1) | ENSESTG00000002491号机组 | ENSMUSESTG00000018175公司 | 内含子1 | 新型mlncRNA |
miR-141,-200c型 | 12 (6) | | ENSMUSESTG00000015291 MBuild30号机组 | 内含子1 | 新型mlncRNA |
miR-154型 | 14 (12) | | ENSMUSESTG00000016217公司 | 内含子2 | 新型mlncRNA |
miR-181a,-181b-2 | 9(2) | OTTHUMG0000020657 | | 内含子1 | 织女星mlncRNA |
miR-181b-1,-213 | 1 (1) | | ENSMUSESTG0000012306公司 | 内含子2 | 新型mlncRNA |
miR-194-1型 | 1 (1) | | 2010103J01瑞克 | 内含子1 | 里肯mlncRNA |
miR-302型 | 4 (3) | 4_1 14030028 AceView公司 | | 内含子2 | 新型mlncRNA |
miR-325型 | -(十) | | 库存00000006551 | 内含子1 | 新型mlncRNA |
表5。
微小核糖核酸一 | 铬b | 人类宿主TU IDc(c) | 鼠标主机TU IDc(c) | miRNA定位d日 | 主持人成绩单描述 |
---|
let-7b,let-7c-2 | 22 (15) | OTTHUMG00000030111 | | 外显子1 | 织女星mlncRNA |
let-7i | 12 (10) | | D630033A02瑞克 | 外显子1 | 里肯mlncRNA |
miR-22型 | 17 (11) | ENSESTG0000028158号 | 2210403K04瑞克 | 外显子2 | 里肯mlncRNA |
miR-29b-2型 | 1 (1) | 1_2 05058566 AceView公司 | C030002C11瑞克 | 外显子1 | 里肯mlncRNA |
miR-34b,-34c | 11 (9) | ENSESTG00000013662号 | | 外显子2 | 新型mlncRNA |
miR-101-1(miR-101) | 1 (4) | | ENSMUSESTG00000022081公司 | 外显子2 | 新型mlncRNA |
miR-122a型 | 18 (18) | 18_54266208宏视 | | 外显子2 | 新型mlncRNA |
miR-133b | 6 (1) | 6_5 2060506 AceView公司 | | 外显子1 | 新型mlncRNA |
miR-137 | 1 (1) | 1_9 7978084 AceView公司 | ENSMUSEST公司G00000012545 | 外显子2(3) | 新型mlncRNA |
miR-143,-145 | 5 (18) | 5_1 48836826 AceView公司 | | 外显子1 | 新型mlncRNA |
miR-146型 | 5(11) | ENSESTG0000012459公司 | 5830402E17瑞克 | 外显子2(1) | 里肯mlncRNA |
miR-155型 | 21 (16) | 114614 NCBI公司 | 比克NCBI | 外显子3(2) | BIC mlncRNA |
miR-192基因 | 11 (19) | 11_64434198 AceView | | 外显子1 | 新型mlncRNA |
miR-195型 | 17 (11) | LOC284112 AceView公司 | | 外显子1 | 新型mlncRNA |
miR-196b型 | 7 (6) | 7_2 6962152 AceView | | 外显子1 | 新型mlncRNA |
miR-199a-2、-199a*-2 | 1 (1) | 1_1 69353084 AceView | | 外显子1 | 新型mlncRNA |
miR-202型 | -(7) | | G630041I22Rik公司 | 外显子2 | 里肯mlncRNA |
miR-206型 | 6 (1) | | 4831414J02瑞克 | 外显子1 | 7H4 mlncRNA |
miR-214型 | 1 (1) | 1_1 69353084 AceView | D230012O04Rik公司 | 外显子2(1) | 里肯mlncRNA |
miR-215型 | 1 (1) | | 2010103J01瑞克 | 外显子2 | 里肯mlncRNA |
miR-221基因 | X(X) | X_44651888 AceView | | 外显子1 | 新型mlncRNA |
miR-223型 | X(X) | X_64102086 AceView | 9830169G21里克 | 外显子3(2) | 里肯mlncRNA |
miR-296型 | 20 (2) | 20_58078195 AceView公司 | D330038P10瑞克 | 外显子1 | 里肯mlncRNA |
miR-324-5p,-324-3p | 17 (11) | 17_7329130 AceView | | 外显子3 | 新型mlncRNA |
miR-331 | 12 (10) | | A630071D13瑞克 | 外显子1 | 里肯mlncRNA |
除了上面提到的先前定义的ncRNA TUs外,我们还发现了数十种新的miR TU宿主,其蛋白质编码潜力很小(参见方法,表,和补充表B-D)。例如,ENSEMBL中的EST和cDNA数据允许识别含有miR-100,let-7a-2、以及miR-125b-1在介绍中(,). 人/鼠宿主转录本1的序列比对(ENSEST00000036713/ENSMUSEST0000030830;数据未显示);转录本2(ENSEST0000036715/2610203C20Rik)没有显示出显著的同源性(). 然而miR-100,let-7a-2、和miR-125b-1型人类和小鼠的转录位点在排列和结构上非常相似(). 这种类型的一些miRNA宿主可能是所谓的“内外”基因,类似于一些小核仁RNA(snoRNA)宿主(Tycowski等人,1996年),其中宿主基因的转录纯粹用于产生内含子编码的RNA。一些内含子中含有miRNAs的mlncRNA宿主也可能作为功能性RNAs。
哺乳动物的基因组组织miR-100,let-7a-2,miR-125b-1人和小鼠的基因座和序列比对miR-125b-1型宿主转录本。(A类)已识别的转录本显示为外显子,外显子表示为垂直线,并在上面按数字顺序标记。虚线表示转录本的拼接。miRNA前体的位置用三角形表示。外显子不符合比例。人/鼠转录本1分别对应于ENSEST0000036713和ENSMUSESTT0000030830。转录本2对应于人类ENSEST0000036715和小鼠2610203C20Rik转录本。(B)转录本2的DNA序列比对如图所示。相同的底座用黑色表示。共有多聚腺苷酸化位点如方框所示。注意,人类转录物2的核苷酸597-955未显示。
大量miRNA与新型非编码转录物的外显子重叠(表,; 补充表C、D)。例如miR-22型-预测的发夹前体完全包含在非编码TU的外显子2内,剪接模式在人类和小鼠中通常是保守的,尽管缺乏蛋白质编码潜力(). 小鼠和人类之间的显著序列保守性miR-22型在5′端和miR-22型-预测发夹前体(). 哺乳动物的整体保护率如此之高miR-22型/TU可能在生物发生或定位中起重要作用。虽然哺乳动物miRNAs发夹前体预测中的高序列保守性是一个共同特征(Lim等人,2003年),尚不清楚在miR-22型/TU是外显子类更常见的现象。老鼠和人类的结合miR-155/BIC没有显示超出预测发夹前体的这种扩展守恒(数据未显示)。除了miR-22型,另外29个其他miRNA包含在转录物的外显子中(). 在大多数情况下,外显子miRNA在mlncRNA转录本中被识别,但在两个罕见的情况下,我们注意到miRNA与蛋白质编码转录本的3′UTR重叠(补充表D)。
哺乳动物的基因组组织miR-22型人和小鼠的基因座和序列比对miR-22型宿主转录本。(A类)外显子显示为白色矩形,并在上面标记。人/小鼠miR-22宿主转录本分别对应于ENSEST0000065902和2210403K04Rik。(B)DNA序列比对miR-22型显示了人/鼠宿主转录本。相同的底座为黑色。成熟miR-22序列以灰色突出显示。外显子1和2之间的保守剪接位点连接也以灰色突出显示。请注意,未显示小鼠转录本的核苷酸688-1658。
TUs内含子或外显子中miRNA的流行促使我们询问是否可能从宿主基因表达数据中获得可靠的miRNA表达模式。与哺乳动物snoRNAs类似,内含子miRNAs可以通过包含在其前mRNAs的内含子中并通过核酸外切酶从脱支内含子中切除而与宿主基因共转录(Tycowski等人,1993年). 与酵母snoRNAs类似,哺乳动物外显转录来源的miRNAs可以通过双链区域内的内切核裂解从ncRNA转录物中获得(Chanfreau等人,1998年). 如果宿主基因和miRNA发生平行转录,则会观察到宿主转录物和miRNA的类似表达模式。为了测试这种可能性,我们通过RT-PCR分析了成年小鼠几个器官中五种预测的miRNA宿主转录物的表达,并将其表达模式与相应的外显子或内含子miRNA的表达模式进行了比较(参见方法和). 在五分之四的病例中,我们注意到宿主基因/转录物表达之间的确切相关性()以及之前报道的小鼠成体器官中miRNA的表达(Sempere等人,2004年). 这一结果表明,miRNA表达可能可靠地来源于宿主转录表达信息,并强烈表明基因组中重叠的转录物可能是miRNA的宿主。
表6。
miRNA表达与宿主转录表达的比较
一miRNA表达源自Sempere等人(2004).
b溴化乙锭染色凝胶图片显示小鼠成年大脑(B)、肝脏(Li)、心脏(H)、肺(Lu)、肾(K)和脾脏(S)的RT-PCR结果。
上述结果促使我们从这里鉴定的所有宿主基因中获得可能的miRNA表达模式信息。我们从一些公开来源(包括初级文献)和公开基因表达模式数据库中收集了宿主基因表达数据(见方法)。该分析可识别生理调节、信号转导和组织/器官特异转录的miRNA宿主(有关miRNA宿主表达模式的完整描述,请参阅补充表A-D)。例如,miR-33型位于的简介中SREBP2号机组()是胆固醇稳态中的一个重要基因,在转录水平上受到甾醇的严格调控(Sato等人,1996年). 此外,我们鉴定了三个内含子miRNAs的簇(miR-25,-93、和-106亿)可能与DNA复制许可因子MCM7()是一种在非分裂细胞中静止的基因,在细胞周期的S期之前上调(Fujita等人1996). 有趣的是,人类miR-7-3型包含在的内含子2中垂体特异性因子1(),一种在脑垂体中表达的基因(Tanaka等人,2002年). 这种成熟的miRNA在基因组中有另外两个相同的拷贝,其中一个(miR-7-1型)可能与普遍表达的基因的表达有关,HNRPK公司(补充表E)。这说明相同miRNAs的表达模式信息可能会被不同但重叠的转录模式混淆。在基因组中存在多个同源miRNAs的情况下,通过分析各自宿主基因的表达来区分单个miR拷贝的表达可能是有用的(不同宿主基因中包含的类似/同源microRNAs列表见补充表E)。
目前miRNA领域的教条是,所有miRNA到成熟miR的分区处理发生在细胞核中的Drosha和细胞质中的Dicer(有关综述,请参阅巴特尔2004;他和汉农2004). 在两项精液研究中,发现miRNAs在HeLa细胞中依赖Drosha进行处理(Lee等人,2003年)一种特殊的前/前miRNA在细胞核中富集,而成熟的miR在细胞质中(Lee等人,2002年). 然而,我们注意到,在这些研究中测试的miRNAs是内含子类miRNA(即。,miRs-15a、-16-1、-20、-30a; 补充表A、B),“混合”miRNA(miR-21型)(补充表D)和几个未定义的转录类miRNAs(数据未显示)。代替本研究中对哺乳动物中两类转录miRNA的发现,在实验验证的外显转录类miRNA的背景下重新审视这些实验将是非常有趣的。Drosha和Dicer处理和成熟miRNAs的所有转录类似乎有共同之处;然而,哺乳动物中存在外显子miRNAs意味着生物发生也可能存在差异。在这方面,值得注意的是,我们发现miR-206型突触相关mlncRNA的外显子7H4内(,补充表C;Velleca等人,1994年;Numata等人,2003年). 7H4最初由Velleca等人鉴定(1994)作为一种RNA选择性地发现于大鼠骨骼神经肌肉接头的运动终板中。在神经肌肉接头处检测到7H4,提出了一种有趣的可能性,即miR-206的未加工形式可能以pri-miR-206/7H4 RNA的形式被转运到细胞核外。未来的研究将需要确定一些miRNA是否可以被主动转运到嵌入其宿主转录物中的细胞核外的亚细胞区室。
结论
这里的研究结果清楚地表明,哺乳动物miRNAs的一大亚群的表达可能与其他基因的表达有转录关联,编码蛋白质和ncRNAs。两类不同的miRNAs的鉴定,即其他转录物的重叠内含子和外显子编码,表明miRNA的成熟可能比先前认为的更复杂。负责核糖体和剪接体RNA修饰的哺乳动物snoRNAs被证明是从蛋白质编码(通常是核糖体蛋白质)基因的内含子中切除的(Qu等人,1995年). 大约一半的哺乳动物miRNAs是通过类似机制表达的,这对我们理解基因表达、调控和基因构成的基本定义具有重要而深远的意义。以前的研究已经证明哺乳动物的内含子和其他明显的非编码序列中存在无法解释的保守性水平(Bejerano等人,2004年). 最近还讨论了基因外显子和内含子序列产生的平行输出的调节可能性(马蒂克2003). 虽然我们还远没有全球范围内平行转录的明确证据,并且这里提供的数据仅占非编码保守的一小部分,但宿主基因中miRNAs的存在,以及内含子snoRNAs所报道的作用,在更大范围内为这一现象提供了诱人的暗示。
方法
类mRNA非编码RNA的鉴定
miRNA宿主转录本被指定为mlncRNAs,其过程与FANTOM基因组探索研究小组采用的过程类似(Okazaki等人,2002年). 为了鉴定mlncRNA候选miRNA宿主,我们使用BLASTX(E值<10-5)或那些与Pfam数据库中已知的基序或域同源的基序(Bateman等人,2004年).
miRNA宿主基因RT-PCR
使用RNA RT-PCR Miniprep Kit(Stratagene)从2-3岁小鼠中制备总RNA。为了防止hnRNA(核前体RNA)的RT扩增,在第一链cDNA合成步骤中使用寡核苷酸引物代替基因特异性引物。为了明确区分剪接cDNA和基因组DNA污染,设计了特异性引物来扩增预测的microRNA宿主转录物的内含子,并进行了-RT对照反应。PCR检测5个microRNA转录单位的引物分别为:miR-9-3宿主转录本、ENSMUSESTG0000007408、5′-GTGGCCAGGAAAAGAAAAAG-3′(正向)和5′-CTCTGTCATCCTGTGGCTTTG-3′(反向);miR-22载体转录本,2210403K04Rik,5′-CAGTGA TTTTGCTCCTGTCCAC-3′(正向)和5′-CACTGAGC TACAACCCAGTCAT-3′(反向);miR-137载体转录本,ENSMUESTG0000012545,5′-CAGAGTCCGCATGAAGAGAGAG CAA-3′(正向)和5′-GTCCTGGCAGGTTA-3′(反向);miR-153宿主转录本,ENSMUSG00000054701,5′-CTGGCTGACCTATACCACTC-3′(正向)和5′-CAATCAG GACGTAGGTCCACT-3′(反向);miR-219宿主转录本,ENSMUESTG0000007085MBuild30,5′-AGAGGCGCCGCTT GGGTTCAG-3′(正向)和5′-TCATTCCCAGCTGG TTT-3′(反向)。
致谢
我们感谢托尼·考克斯(Tony Cox)和詹姆斯·斯塔克(James Stalker)在生成ENSEMBL DAS源以进行基因组注释方面提供的技术援助,感谢罗素·格罗科克(Russell Grocock)博士提供的有益讨论和技术帮助,感谢乔斯·琼克斯(Jos Jonkers)博士和马杜里·沃伦(Madhuri Warren)博士批判性地阅读。A.R.是NIH博士后研究员。这项工作由Wellcome信托基金资助。
脚注
[补充材料可在www.genome.org上在线获取。]
文章和出版物位于http://www.genome.org/cgi/doi/10.1101/gr.2722704。文章于2004年9月在网上发表,然后印刷。
工具书类
- Al-Shahrour,F.、Diaz-Uriarte,R.和Dopazo,J.,2004年。FatiGO:一个网络工具,用于查找基因本体术语与基因组之间的重要关联。生物信息学 20:578-580. [公共医学][谷歌学者]
- Ambros,V.2000年。控制发育时间秀丽隐杆线虫.货币。操作。遗传学。开发。 10:428-433. [公共医学][谷歌学者]
- 巴特尔,D.P.2004。微RNA:基因组学、生物发生、机制和功能。单元格 116:281-297页。[公共医学][谷歌学者]
- Bateman,A.,Coin,L.,Durbin,R.,Finn,R.D.,Hollich,V.,Griffiths-Jones,S,Khanna,A.,Marshall,M.,Moxon,S.,Sonnhammer,E.L.等人,2004年。Pfam蛋白质家族数据库。核酸研究。 32:D138-141。[PMC免费文章][公共医学][谷歌学者]
- Bejerano,G.、Pheasant,M.、Makunin,I.、Stephen,S.、Kent,W.J.、Mattick,J.S.和Haussler,D.2004年。人类基因组中的超保守元素。科学类 304:1321-1325. [公共医学][谷歌学者]
- Bono,H.、Yagi,K.、Kasukawa,T.、Nikaido,I.、Tominaga,N.、Miki,R.、Mizuno,Y.、Tomaru,Y.,Goto,H.和Nitanda,H.等人,2003年。使用RIKEN cDNA微阵列对小鼠转录组进行系统表达谱分析。基因组研究。 13:1318-1323.[PMC免费文章][公共医学][谷歌学者]
- Carrington,J.C.和Ambros,V.2003年。微小RNA在动植物发育中的作用。科学类 301:336-338. [公共医学][谷歌学者]
- Chan,A.S.、Thorner,P.S.、Squire,J.A.和Zielenska,M.,2002年。染色体12q21上一个新基因NCRMS的鉴定及其在横纹肌肉瘤亚型之间的差异表达。癌基因 21:3029-3037. [公共医学][谷歌学者]
- Chanfreau,G.、Legrain,P.和Jacquier,A.1998年。酵母核糖核酸酶III是小核仁RNA代谢中的关键加工酶。分子生物学杂志。 284:975-988. [公共医学][谷歌学者]
- Dostie,J.、Mouralatos,Z.、Yang,M.、Sharma,A.和Dreyfuss,G.,2003年。神经元细胞中的许多微小RNP含有新的微小RNA。核糖核酸 9:180-186.[PMC免费文章][公共医学][谷歌学者]
- Erdmann,V.A.、Szymanski,M.、Hochberg,A.、Groot,N.和Barciszewski,J.2000。非编码、类mRNAs RNAs数据库Y2K。核酸研究。 28:197-200.[PMC免费文章][公共医学][谷歌学者]
- French,P.J.,Bliss,T.V.和O'Connor,V.2001年。Ntab是一种在大鼠脑中大量表达的新型非编码RNA。神经科学 108:207-215中。[公共医学][谷歌学者]
- Fujita,M.、Kiyono,T.、Hayashi,Y.和Ishibashi,M.,1996年。hCDC47,MCM家族的人类成员。S相核结合形式的解离。生物学杂志。化学。 271:4349-4354. [公共医学][谷歌学者]
- 基因本体联盟。2001.创建基因本体资源:设计与实现。基因组研究。 8:1425-1433.[PMC免费文章][公共医学][谷歌学者]
- Griffiths-Jones,S.2004年。microRNA注册。核酸研究。 32:D109-111。[PMC免费文章][公共医学][谷歌学者]
- He,L.和Hannon,G.J.2004。微小核糖核酸:在基因调控中发挥重要作用的微小核糖核酸。Nat.Rev基因。 5:522-531. [公共医学][谷歌学者]
- Hong,Y.K.、Ontiveros,S.D.、Chen,C.和Strauss,W.M.,1999年。小鼠Xist基因的新结构及其与X染色体失活期间染色体选择/计数的关系。程序。国家。阿卡德。科学。 96:6829-6834.[PMC免费文章][公共医学][谷歌学者]
- Houbavey,H.B.,Murray,M.F.和Sharp,P.A.2003年。胚胎干细胞特异性微RNA。开发单元 5:351-358. [公共医学][谷歌学者]
- Kim,J.、Krichevsky,A.、Grad,Y.、Hayes,G.D.、Kosik,K.S.、Church,G.M.和Ruvkun,G.2004。鉴定哺乳动物神经元中与多核糖体共纯化的许多microRNA。程序。国家。阿卡德。科学。 101:360-365.[PMC免费文章][公共医学][谷歌学者]
- Lagos-Quintana,M.、Rauhut,R.、Lendeckel,W.和Tuschl,T.,2001年。识别编码小表达RNA的新基因。科学类 294:853-858. [公共医学][谷歌学者]
- Lagos-Quintana,M.、Rauhut,R.、Yalcin,A.、Meyer,J.、Lendecel,W.和Tuschl,T.,2002年。小鼠组织特异性microRNA的鉴定。货币。生物。 12:735-739. [公共医学][谷歌学者]
- Lagos-Quintana,M.、Rauhut,R.、Meyer,J.、Borkhardt,A.和Tuschl,T.,2003年。来自小鼠和人类的新microRNA。核糖核酸 9:175-179页。[PMC免费文章][公共医学][谷歌学者]
- Lee,Y.、Jeon,K.、Lee,J.T.、Kim,S.和Kim,V.N.,2002年。微RNA成熟:逐步加工和亚细胞定位。EMBO J。 21:4663-4670.[PMC免费文章][公共医学][谷歌学者]
- Lee,Y.,Ahn,C.,Han,J.,Choi,H.,Kim,J.和Yim,J..,Lee,J.、Provost,P.、Radmark,O.、Kim,S.等,2003年。核RNase III Drosha启动微RNA加工。自然 425:415-419. [公共医学][谷歌学者]
- Lim,L.P.、Glasner,M.E.、Yekta,S.、Burge,C.B.和Bartel,D.P.,2003年。脊椎动物microRNA基因。科学类 299:1540. [公共医学][谷歌学者]
- Mattick,J.S.2003年。挑战教条:复杂生物体中非蛋白编码RNA的隐藏层。生物论文 25:930-939. [公共医学][谷歌学者]
- Michael,M.Z.、O'Connor,S.M.、van Holst Pellekaan,N.G.、Young,G.P.和James,R.J.,2003年。结直肠肿瘤中特异性microRNA积累减少。摩尔癌症研究。 1:882-891. [公共医学][谷歌学者]
- Migliazza,A.,Bosch,F.,Komatsu,H.,Cayanis,E.,Martinotti,S.,Toniato,E.,Guccione,E.,Qu,X.,Chien,M.,Murty,V.V.等人,2001年。B细胞慢性淋巴细胞白血病中缺失的13q14染色体区域的核苷酸序列、转录图和突变分析。血液 97:2098-2104年。[公共医学][谷歌学者]
- Mouralatos,Z.、Dostie,J.、Paushkin,S.、Sharma,A.、Charroux,B.、Abel,L.、Rappsilber,J.,Mann,M.和Dreyfuss,G.,2002年。miRNPs:一类新的核糖核蛋白,含有许多microRNAs。基因与发育。 16:720-728.[PMC免费文章][公共医学][谷歌学者]
- Numata,K.、Kanai,A.、Saito,R.、Kondo,S.、Adachi,J.、Wilming,L.G.、Hume,D.A.、Hayashizaki,Y.和Tomita,M.,2003年。RIKEN小鼠全长cDNA收集中假定非编码RNA的鉴定。基因组研究。 13:1301-1306.[PMC免费文章][公共医学][谷歌学者]
- Okazaki,Y.M.、Furuno,T.、Kasukawa,J.、Adachi,H.、Bono,S.、Kondo,I.、Nikaido,N.、Osato,R.、Saito,H.和Suzuki,I.等人,2002年。基于60770条全长cDNA功能注释的小鼠转录组分析。自然 420:563-573. [公共医学][谷歌学者]
- 大田、T.Y.、铃木、T.、西川、Otsuki、T.,杉山R.、Irie、A.、Wakamatsu、K.、Hayashi、H.、Sato、K.和Nagai等,2004年。21243条全长人类cDNA的完整测序和表征。自然遗传学。 36:40-45. [公共医学][谷歌学者]
- Qu,L.H.,Henry,Y.,Nicoloso,M.,Michot,B.,Azum,M.C.,Renalier,M.H.,Caizergue-Ferrer,M.和Bachellerie,J.P.,1995年。U24是一种新的内含子编码的小核仁RNA,与28S rRNA具有两个12 nt长的系统发育保守互补性。核酸研究。 23:2669-2676.[PMC免费文章][公共医学][谷歌学者]
- Sato,R.、Inoue,J.、Kawabe,Y.、Kodama,T.、Takano,T.和Maeda,M.,1996年。甾醇调节元件结合蛋白-2的甾醇依赖性转录调控。生物学杂志。化学。 271:26461-26464. [公共医学][谷歌学者]
- Sempere,L.F.、Freemantle,S.、Pitha Rowe,I.、Moss,E.、Dmitrovsky,E.和Ambros,V.2004年。哺乳动物microRNA的表达谱揭示了脑表达的microRNA子集,可能在小鼠和人类神经元分化中发挥作用。基因组生物学。 5:R13。[PMC免费文章][公共医学][谷歌学者]
- Sleutels,F.、Zwart,R.和Barlow,D.P.,2002年。非编码的Air RNA是沉默常染色体印迹基因所必需的。自然 415:810-813. [公共医学][谷歌学者]
- Su,A.I.,Cooke,M.P.,Ching,K.A.,Hakak,Y.,Walker,J.R.,Wiltshire,T.,Orth,A.P.,Vega,R.G.,Sapinoso,L.M.,Moqrich,A.等人,2002年。人类和小鼠转录组的大规模分析。程序。国家。阿卡德。科学。 99:4465-4470.[PMC免费文章][公共医学][谷歌学者]
- Tam,W.,2001年。人类BIC基因的鉴定和特征,该基因位于21号染色体上,编码非编码RNA。基因 274:157-167. [公共医学][谷歌学者]
- Tanaka,S.、Tatsumi,K.、Okubo,K.和Itoh,K.,Kawamoto,S.,Matsubara,K.以及Amino,N.,2002。人类垂体中活性基因的表达谱。《分子内分泌杂志》。 28:33-44. [公共医学][谷歌学者]
- Tycowski,K.T.、Shu,M.D.和Steitz,J.A.,1993年。一个小核仁RNA由编码核糖体蛋白S3的人类基因内含子加工而成。基因与发育。 7:1176-1190年。[公共医学][谷歌学者]
- ____. 1996年,一种带有内含子而非外显子的哺乳动物基因,产生稳定的RNA产物。自然 379:464-466. [公共医学][谷歌学者]
- Velleca,M.A.,Wallace,M.C.和Merlie,J.P.,1994年。一种新的突触相关非编码RNA。分子细胞生物学。 14:7095-7104.[PMC免费文章][公共医学][谷歌学者]
- Xu,P.、Vernooy,S.Y.、Guo,M.和Hay,B.A.,2003年。这个果蝇属microRNA Mir-14抑制细胞死亡,是正常脂肪代谢所必需的。货币。生物。 13:790-795. [公共医学][谷歌学者]
- Yamamoto,K.、Cox,J.P.、Friedrich,T.、Christie,P.T.、Bald,M.、Houtman,P.N.、Lapsley,M.J.、Patzer,L.、Tsimaratos,M.,Van,T.H.W.G.等人,2000年。登特氏病中肾脏氯离子通道(CLCN5)突变的特征。《美国肾脏学会杂志》。 11:1460-1468. [公共医学][谷歌学者]