小鼠遗传学导论

小鼠遗传学导论

在过去几十年里,小鼠遗传学经历了许多里程碑式的发展持续表现毛色性状的自交系的世代或者在20世纪初对肿瘤的易感性,直到常规的基因操作,条件靶向和全基因组测序或转录谱分析个人。作为一个实验系统,鼠标具有令人难以置信的洞察力基因功能、基因-疾病关系的剖析和大量其他数据。

目录





基因、等位基因和基因型

遗传学最基本形式的研究是基因。它们是什么,在哪里,它们是如何工作的,它们有什么不同,以及它们是如何这形成了遗传特征的基础。遗传特征涵盖了代谢的范围活动、疾病易感性、身体形态、头发颜色、血型和更多信息。

这些特征的代码存在于生物体的DNA中。当一个基因激活后,DNA转录成信使RNA(mRNA),然后翻译成蛋白质。基因激活的调节受以下因素控制能与非编码启动子或增强子结合的转录因子元素。它们将RNA聚合酶和其他因子招募到转录起始位点,将序列复制到新分子中。这个最终编码蛋白质的基因区域称为外显子并与作为mRNA处理的一部分移除的内含子拼接在一起。这个pre-mRNA中的典型剪接位点共识序列使用“CAG|G”3'供体和5'剪接位点受体的“MAG|GTRAGT”,其中M是A或C,R是A或G[1]。额外的转录后调控可能也可由非编码microRNA(miRNA)、小干扰RNA(siRNA)、,小核或核仁RNA(snRNA和snoRNA)或其他过程。信使核糖核酸被封端、聚腺苷酸化并从细胞核输出到核糖体,在那里它被转化为蛋白质。


中心教条
图1。生物学的中心法则:DNA到mRNA到蛋白质。


基因
图2。层次结构的信息图形说明物种级基因组、基因(功能单位)、序列变异它定义了等位基因,导致个体基因型,当表达时决定表型。详见右图。底部照片显示一辆肥胖的C57BL/6J- 勒普对象/勒普对象鼠标在右侧,带有杂合的勒普对象/勒普+瘦弱的室友在左边。

在一个物种中,所有成员都携带同一组基因,或功能单元。小鼠参考基因组包含一个大约24500个蛋白质编码基因并于2002年进行了全序列测定[2].结构上,这些基因分布在19对常染色体以及X和Y性染色体上。为了进行比较,人类有23对染色体(22个常染色体加上XX或XY),其中包含估计20687个蛋白质编码基因[]。90%以上的鼠标和人类基因组可以排列成共享的同步区,也就是说,同源基因以相同的相对顺序保存的区块,表明有共同的祖先。在基因水平上,小鼠同源物具有已被识别和分类17,096人类基因。

物种内个体之间的变异是由变异基因引起的形式称为等位基因。一些更改可以更改表达式或函数导致可观察到的表型差异的基因,抗病性/易感性或代谢,但许多其他等位基因导致序列水平之外几乎没有可检测到的变化。变异等位基因可能包括单核苷酸多态性(SNP)、插入和缺失(indels),或拷贝数变化(CNV)。对于实验室模型生物,在使用基因工程技术的地方也存在靶向等位基因专门改变、删除或引入DNA序列。一个基因可能有具有不同生物学后果的多个等位基因,以及MGI中的每个等位基因被赋予一个唯一的标识符,作为上标附加到基因符号。有关更多信息,请参阅下面的术语部分。

除了嵌合体这种罕见的情况外,小鼠体内的每个有核细胞身体携带相同的DNA代码。然而,不同的基因表达模式允许这些细胞发育成各种组织和器官,并产生反应刺激。这个基因表达数据库在MGI,您可以搜索表达的基因在不同的小鼠解剖结构中,特别强调胚胎发展。

最终结果,无论是单个测量还是所有测量结果的合成个体可观察或可测量的特征称为表型。在MGI中,表型注释为完整的基因型,该基因型包括特别感兴趣的等位基因以及背景。同样不同特定等位基因可能具有不同的特征和生物学特性影响(考虑错义编码变体与敲除等位基因与条件或报告靶向等位基因),菌株背景中的其他等位基因,无论已知或未知,都可能对一个或一组特征产生修饰效应。例如 勒普对象等位基因显示纯合子的背景敏感性勒普对象/勒普对象 基于C57BL/6J背景糖尿病前期患者表现出严重肥胖综合征,而勒普对象/勒普对象 在C57BLKS背景上成为严重糖尿病和不育,除肥胖外预期寿命。

快速词汇表

有关完整的词汇表,请参阅:MGI词汇表

期限 定义
近交系 在所有位点上基本上都是纯合的菌株。在老鼠身上,需要兄弟-姐妹交配至少连续20代。在近交系中,个体之间的基因是相同的;尽管不同的近交系每个菌株都携带一组独特的等位基因。查看更多.
阿勒 核苷酸不同于其他形式的基因变体之一顺序。二倍体生物在每个位点携带两个可能相同的等位基因(纯合的)或不同的(杂合的)。半合子用于描述等位基因你会在哪里期望一个生物体在“正常”状态下有两个等位基因状态(即Y染色体、雄性X连锁基因或插入外源DNA)。包括自然变异和目标变异。
表型等位基因 产生明显变化的等位基因变体。可能是自发的突变或靶向。
目标小巷 使用实验室技术专门破坏、改变或引入DNA使“靶向”等位基因在后代。包括敲除、敲除、报告、条件等位基因等。
转基因 通过通过随机整合构建成动物的生殖系。
基因型
  1. 个人携带的整套遗传信息。全部等位基因,自然和靶向以及背景。
  2. 对生物体携带的遗传信息的描述。最简单的情况是,基因型可能是指单个基因携带的信息轨迹,如A/A公司,A/A公司,或账户.
表型
  1. 生物体或个体的可观察或可测量特征。
  2. 在MGI中,也指结构化描述性词汇表(参见哺乳动物表型本体论)
地点/地点(插图) 字面意思是“地点”。指染色体位置或坐标,或基因/簇可以在那里进行映射。
内源性 起源于生物体内的东西。前任。基因序列尚未成为目标。
同源性
  1. 两个或多个基因由共同祖先DNA序列的后代相关。可应用于不同物种的基因(正交曲线),或基因物种内的重复(伞降).
  2. 一对染色体中的一条,在第一次减数分裂。
  3. 一个物种的形态结构与另一个物种相关从一个共同的祖先结构进化而来的物种。

近交系

要开始理解小鼠模型遗传学,从根源开始是很重要的-自交系。近交系是指经过精心培育的小鼠兄弟姐妹或父母至少连续20次以上世代产生一个遗传和表型一致的品系。大多数实验室菌株现在是数百代的近交系。在一个近交系内小鼠品系,所有个体都具有相同的基因型且纯合子(携带单个等位基因变体)。近交系的成员本质上是遗传的彼此的克隆,这允许遗传上良好的实验再现性影响性状,确保研究动物模型的一致性和一致性,甚至跨多代或不同实验室。

近交衍生

图3。近交系的衍生。独特菌株实验室小鼠是通过反复交叉(兄弟姐妹)产生的和/或回交(弹簧的父母),直到小鼠在所有位点都是纯合的和后代是相同的。



图4。近交20代的后果。实线上的点表示基因组中在任何情况下都是纯合的个人每一代的动物。上的点虚线表示基因组中将被修复的部分两只动物选择生成下一代。发件人(Silver,1995年)。

近交系

虽然在近交系中所有小鼠的基因都是同质的,但不同的是自交系将携带一组不同的固定等位基因,并表现出不同的表型因此具有特征。为特定品种选择合适的近交系在使用实验室小鼠时,实验或控制是一个重要的考虑因素。

拥有一个有特色且一致的背景也是一个有价值的工具在检查靶向等位基因操纵。通过比较靶向株系与亲本株系的表型,可以确定哪些生物系统受到了影响关于单个修饰基因功能的推断。

为近交菌株命名,以确定特定的遗传背景。这些姓名由大写字母和/或数字组合而成,也可能有子串名称(正斜杠后面的字母或数字)和或lab代码以指示保持应变的位置。请参阅命名教程下面的视频(需要Flash),或浏览小鼠和大鼠品系命名的完整指南。如果下面的教程不是显示在此页面上,您也可以查看它在这里.



经允许使用杰克逊实验室.


最常用的自交系是C57BL/6J,也是该菌株测序以生成“参考”小鼠基因组。有关特定近交系,请参阅小鼠表型数据库[4].

目标小巷

如上所述,近交系在遗传研究中的优势之一是它们为利用突变体研究单个基因的作用提供了一个稳定的框架或敲除等位基因。不同于基于人群的人类研究,其中许多基因因素正在分离,一种新的已知突变在可预测的背景下允许研究人员将新的表型归因于该特定基因并推断这是正常功能。由于需要稳定、可预测的背景MGI的表型归因于小鼠的完整基因型(特定等位基因在确定的近亲繁殖背景下)。许多突变等位基因表现出相同的表型无论背景如何,但其他人改变了外显率或显示出一系列其他途径修饰物以背景依赖方式产生的表型。

小鼠作为实验遗传模型最有用的方面之一就是这种容易产生靶向等位基因的能力。典型的靶向等位基因是基因敲除,目标基因的全部或部分编码区被替换通过选择磁带,完全消除功能。这是通过引入一种在靶向两侧包含同源序列的载体插入胚胎干细胞。细胞内的细胞机械将载体与小鼠内源性序列的同源臂以及是否发生重组在两侧,盒式磁带将被引入生殖系。这些ES细胞可以被选择并移植回假怀孕雌性小鼠,在那里它们将生长以及发展。中的插图图5(C)显示杂合靶向等位基因。

同源重组

图5。通过同源重组产生靶向等位基因。各种靶向等位基因可在利用胚胎干细胞的正常过程细胞中的同源重组。(A)首先,确定目标构造包含要引入的磁带的向量(工程盒)两侧都有DNA序列与上游和下游完全匹配(即同源)内源性基因周围的区域或研究人员想要替换的区域。在基因敲除等位基因的情况下,工程化盒通常会将编码外显子替换为可选择的标记,如新霉素耐药性促进阳性ES选择和富集的基因(NEO盒)细胞克隆。向量中通常会内置一个否定选择标记同源区下游,以进行不完全筛选(单臂)或随机重组。(B)目标载体被导入多能干细胞的细胞核,其中同源臂与内源性基因。在一个类似于减数分裂过程的过程中,对齐的区域交叉,将工程结构纳入内源性位点并去除封闭的内源性序列。(C)完整的、正确定位的细胞现在具有在其生殖系中构建参考序列。ES细胞可以使用可选择的标记、测序、,和/或Southern印迹,然后阳性克隆可以生长成囊胚并植入假孕受体小鼠,在那里它们将发育为胚胎。

同样的策略也可以用于向鼠标中引入特定的新变体。这可能是一种旨在复制突变的单一、特异的工程替代物在人类临床病例中发现(例如。Bbs1中的M390Rtm1Vcs(tm1Vc)),重组酶识别序列在里面活泼地基因组操作(LoxP、FRT)或从另一物种引入完整的cDNA,它被称为转基因。

图6。小鼠中四种最常见的靶向等位基因类型示意图。顶部row描述了外显子正确剪接的内源性(或未改变的)等位基因(见虚线)并产生全长的功能性蛋白质。下面,敲除等位基因(KO)利用同源重组来取代某些功能外显子,带有包含可选标记的靶向盒。这个基因不再能够产生功能蛋白。A类有条件地靶向等位基因,通常也被称为“floxed”,代表“由LoxP侧翼”引入重组酶可识别序列目标外显子。当没有重组酶表达时,这些基因功能正常;然而,如果正确的重组酶在同一个细胞(如剪刀所示),它能够作用于这些部位并产生改变的等位基因,非功能性蛋白质。对于报告基因,引入了一个磁带包含可检测的标记,通常是荧光标记或lacZ基因在显微镜下观察。这些通常用于检测基因模式作为标记物的表达将指示目标启动子激活。它们经常破坏正常的基因剪接或蛋白质构象,因此可能会充当空值或只有部分活动。底部一行描述了转基因,即外源(非小鼠)DNA导入细菌符合目的或生产新的功能性(非小鼠来源)蛋白质。

最常见的靶向等位基因类型

表1。常见的工程等位基因类型。几种最常见的工程研究群体使用的等位基因,包括在MGI中。存在其他等位基因类型,如以及以下所示的组合和变化

Allele类型 发电 描述 最常见的用途(其他可能适用)
淘汰赛 靶向同源重组 替换已知基因的编码区(完整基因或特定外显子)用一个目标盒式磁带。完全丧失功能。 用于通过与非靶基因的比较来研究靶基因的功能控制。
敲除(核苷酸替代) 靶向同源重组 将已知基因的编码区替换为含有特定突变的同一基因 用于研究这种变异的表型影响,通常来自人类临床观察。功能影响是等位基因特有的。
敲入(插入) 靶向同源重组 靶向结构用于将新变体引入特定位点。可能是靶基因的另一种变体或一个全新的cDNA 用于研究变体的作用和/或表达所需的变体或新变体基因产物,前任。人源化小鼠或重组酶内源性启动子。
弗洛伊德 靶向同源重组 在靶基因两侧引入LoxP重组酶识别序列,结构的外显子或部分 cre重组酶在同一细胞中的共表达将重塑侧翼区域根据LoxP站点的方向性。在没有cre的情况下该基因通常被认为是野生型。请参阅第节条件巷和cre-Lox允许组织特异性切除或表达基因。允许研究基因发育活力所必需的,这在基因敲除时对胚胎是致命的。
FRT公司 靶向同源重组 在靶基因两侧引入FRT重组酶识别序列,构建体的外显子或部分 类似于floxed,但对与Flp重组酶(flipase)的共表达敏感。
目标报告者 靶向同源重组 将报告基因(GFP、LacZ、荧光素酶等)插入已知的遵循某些调节序列的位点。但可能破坏内源性基因这是不需要的。 用于监测内源性启动子的转录活性体内. 如果用作功能蛋白质的标签,则可用于研究蛋白质定位或基因产品的细胞贩运
基因陷阱 随机插入 带有可选标记的已知盒式磁带随机并入生殖系。请参阅国际基因陷阱联盟 高通量基因破坏。磁带通常具有报告功能使研究人员能够确定插入位点确定后的内源性启动子
转基因(cre/Flp) 通常是随机插入,可能是有针对性的 启动子的控制 用于指定哪些组织将表达位点特异性重组酶,因此,当和/或在生物体内的什么时候和/或什么地方会有漂浮的/FRT基因重塑。请参阅第节条件巷和cre-Lox
转基因(表达) 通常是随机插入,可能是有针对性的 一种外源基因在小鼠中的表达 感兴趣的非小鼠蛋白的表达。
转基因(记者,cre) 通常是随机插入,可能是有针对性的 一个带有loxP侧翼STOP密码子的报告基因在编码序列 允许研究人员评估cre重组酶的转基因活性转基因品系。与cre共同表达删除STOP密码并激活这位记者正在标记有cre活性的组织。请参阅更多.

条件性等位基因与cre-Lox系统

对于许多基因来说,完全无效的等位基因可能会对胚胎发育或生存能力。此外,调查人员可能经常希望检查基因只在特定器官系统或细胞中的作用类型,而不会在其他地方引起异常。定点重组酶技术可以有效地引起基因组中的缺失、易位和反转当基因组重构重组酶共同表达时,DNA具有高保真性。通过限制重组酶在特定组织或细胞系中的表达-或将其置于药物诱导启动子-基因组的控制之下重塑也可以局限于特定的组织或时间点。

实验室小鼠中最常用的系统称为“cre-lox”,包括最初从P1噬菌体克隆的cre重组酶和重组酶识别位点被称为“loxP位点”(P1上的X位点)。LoxP公司位点为32个碱基对共有序列,具有8个碱基核和两个反向重复序列。

ATAACTTCGTATA公司GCATACAT公司塔塔加格塔特►

反向重复使loxP位点具有方向性的能力。如果这两个侧翼loxP站点(目标的上游和下游)的方向相同方向,随着loxP重复序列的一个,floxed片段将被切除(如图所示在图5中),如果loxP位点方向相反(面对面),则段如果loxP位点位于不同的染色体上(a反式排列),重组酶将介导染色体易位。

通常,cre和loxP菌株是分开培养并杂交在一起生产的cre-lox菌株。

  1. 带有靶向“floxed”等位基因的小鼠,在靶区两侧携带两个loxP
  2. cre重组酶转基因小鼠发起人

此杂交后代将携带以下基因的两个漂浮目标等位基因兴趣以及重组酶。在重组酶表达的组织中两侧的loxP位点将被切除(或以其他方式重组),产生组织限制性淘汰赛。在cre启动子不活跃的组织中,重组酶不会表达而floxed基因将保持功能完整。

组织特异性切除
图7。通过与cre-rewise共表达对漂浮等位基因进行组织特异性切除。

给定cre转基因等位基因的重组酶活性可以通过交叉将小鼠培养成报告菌株,该菌株在报告基因(例如lacZ或GFP)。如果cre重组酶在组织中具有活性STOP将被删除,记者表示。

要定位在特定组织类型中表达的cre重组酶菌株,或在特定已知启动子的控制下,使用MGI的重组酶(cre)门户,或使用搜索表型、等位基因和疾病模型查询表,指定“转基因(Cre/Flp)”在中类别第节。

结构化词汇表和本体

生物学中的结构化受控词汇表允许使用标准化、层次化术语。它还允许MGI等数据库对类似的内容进行注释类似标题下的发现,因此研究人员不需要浏览多个不同精度级别的关键字。

MGI使用三个主要词汇注释数据:
  1. 这个哺乳动物表型(MP)本体
    提供注释哺乳动物表型数据的标准化术语。它当前位于MGI和大鼠基因组数据库使用(RGD公司). 这个表型表在等位基因详细页和受影响的生理系统和表型(左)人-鼠:疾病连接结果由MP术语填充。最高级别的术语表示生理系统(例如,“心血管系统”、“生长/大小”、“肾/尿”、,“生殖”、“肿瘤发生”等),带有来自MP和HPO(人类表型本体)的分层组织的子术语用于越来越具体的注释。
    引用:Smith CL、Goldsmith CA、Eppig JT。哺乳动物表型本体作为注释、分析和比较表型信息的工具。基因组生物. 2005;6(1):R7。PMID:15642099

  2. 这个基因本体论(作为基因本体联盟)
    • 蜂窝组件:细胞或其细胞外环境的组成部分
    • 生物过程:具有定义的分子事件的操作或集合开始和结束,与综合生活单元的功能相关——细胞、组织、器官和有机体
    • 分子功能:基因产物在分子上的元素活性水平,如结合或催化
    为一系列基因产品属性提供标准化术语,并描述这些基因产物在细胞环境中的正常行为。GO是物种中性,旨在适用于从原核生物到复杂的多细胞生物。在MGI中,与基因产品相关的GO术语可以是在中找到基因本体(GO)分类功能区在基因详细信息页面上。
    引用:Ashburner M、Ball CA、Blake JA、Botstein D、Butler H等人。基因本体:生物学统一的工具。基因本体联盟。自然遗传学2000年5月;25(1):25-9. PMID:10802651

  3. 这个小鼠发育解剖浏览器
    为组织、器官和解剖结构提供标准化术语小鼠在胚胎发育过程中一直处于成年状态。解剖学词典是的一部分e-Mouse Atlas项目(EMAP)。鼠标开发分为Theiler阶段(TS),在此阶段,特定预计将发生过程。1-26期为胚胎期,27期为围产期28期为产后(成人)。
    引文:Hayamizu TF、Baldock RA、Ringwald M.鼠标解剖本体:增强和工具探索和整合生物医学数据。哺乳动物基因组2015年7月25日PMID:26208972
    Hayamizu TF、Wicks MN、Davidson DR、Burger A、Ringwald M、Baldock RA。小鼠发育解剖学EMAP/EMAPA本体:2013年更新。第页,共页生物医学语义学2013年8月26日;下午4点(1):15分23972281

  4. 这个人类表型本体浏览器
    提供描述临床异常的标准术语。包括独立的子目录例如表型异常、遗传模式、临床修饰、死亡率/年龄,以及频率。在MGI中,HPO术语可以在Human-Mouse:Disease Connection results部分找到,在上组织并映射到MP术语受影响的生理系统和表型(左)
    引文:Köhler S、Vasilevsky NA、Engelstad M、Foster E、McMurry J、AyméS、Baynam G、Bello SM、[…]Smith CL、[…]Smedley D、,Mungall CJ、Haendel M、Robinson PN。核酸研究2017年1月4日PMID:27899602

  5. 这个疾病本体浏览器.
    提供描述人类疾病的标准化术语。在MGI中,DO术语可以在Human-Mouse:Disease中找到连接结果部分,组织并映射到人类疾病(右)。

工具书类

1.Baralle D,Baralle M.拼接行动:评估导致疾病的序列变化。医学遗传学杂志。2005年10月;42(10):737-48. PMID:16199547

2.小鼠基因组测序协会,Waterston RH,Lindblad-Toh K,Birney E,Rogers J,Abril JF、Agarwal P、,等。初步排序和比较分析小鼠基因组。自然。2002年12月5日;420(6915):520-62. PMID:12466850

3.ENCODE项目联盟,Bernstein BE、Birney E、Dunham I、Green ED、Gunter C、Snyder M。人类基因组中DNA元素的综合百科全书。自然2012年9月6;489(7414):57-74. PMID:22955616

4.Grubb SC、Bult CJ、Bogue MA。小鼠表型数据库。核酸研究。2013年11月15日。PMID:24243846