Transcriptome-Wide Identification of Novel Imprinted Genes in Neonatal Mouse Brain

Xu Wang; Qi Sun; Sean D. McGrath; Elaine R. Mardis; Paul D. Soloway; Andrew G. Clark

doi:10.1371/journal.pone.0003839

公共科学图书馆一号。2008; 3（12）：e3839。

2008年12月4日在线发布。数字对象标识：10.1371/journal.pone.0003839

预防性维修识别码：项目经理2585789

PMID：19052635

新生小鼠脑内新印迹基因的转录组全鉴定

徐旺,¹ 戚孙,² 肖恩·麦格拉思,^三伊莱恩·马尔迪斯,^三保罗·D·索洛维,⁴和安德鲁·克拉克^1,^*

安妮·弗格森-史密斯，编辑器

作者信息文章注释版权和许可信息 PMC免责声明

关联数据

补充材料: 图S1：该文件包含带书签的pdf格式的图S1.1至S1.20。
（271百万PDF）
电话：0003839.s001.pdf（250万）
GUID:0E598E4F-FFC5-4015-845B-8E9534EE5CAC
表S1：该文件包含表S1.1至S1.19，作为书签pdf。
（0.35 MB PDF格式）
第00003839.s002.pdf页（346000）
GUID:9F06EAC1-1401-4533-A7A1-064B0034AAF6
参考S1：支持参考表1.
（0.03 MB文件）
邮编：0003839.s003.doc（27K）
GUID:F4DB2DFA-FFAB-451C-97C8-DC45DB95CA8C

摘要

印迹基因显示差异等位基因表达的方式取决于传递亲本的性别。印迹的程度通常是组织特异性和/或发育阶段特异性的，并且在包括癌症在内的一些疾病中可能会改变。在这里，我们应用Illumina/Selexa对互惠F1小鼠新生脑转录组进行测序，并鉴定了26个具有亲本-原生质依赖性差异等位基因表达的基因。等位基因特异性焦磷酸测序证实了其中17个，包括三个新的印迹基因。已知的和新的印迹基因都是在先前报道的差异甲基化区域（DMR）附近发现的。胎盘中已知的10个印记基因的表达水平足以达到读取深度，从而提供检测印记的统计能力，但所有这些都与新生儿脑转录计数数据中的非印记一致。还发现了三对紧密相连且相互印迹的基因对，它们的表达模式表明存在转录干扰。尽管覆盖了5000多个基因，但此次扫描仅在新生儿大脑中发现了三个新的印记refseq基因，这表明该组织几乎具有详尽的特征。这种方法有可能在应用于多个组织和发育阶段后生成完整的印迹基因目录，从而阐明印迹基因的机制、生物信息学预测和进化以及与基因组印迹相关的疾病。

介绍

迄今为止，已有98个基因在小鼠中经历了基因组印记，56个基因在人类中被印记，这两个物种中有38个重叠的基因[1]两个物种的印记基因列表都不完整。全基因组生物信息学预测面临着高假阳性率的挑战，主要是因为已知印迹基因的训练集很小，而且我们不知道所有驱动组织的信号以及印迹的时间特异性[2],[3]对人类印迹基因进行彻底扫描的尝试遇到了几个缺点，包括使用最合适的组织和发育阶段的挑战，而依赖淋巴母细胞系（LCL）则加剧了这个问题[4]许多印记基因表现出组织和发育阶段特异性表达，许多基因仅在大脑发育的特定阶段表达和印记。人类研究还面临着信息丰富的杂合SNP数量少的挑战，因此等位基因特异性分析仅对一小部分个体有用。因此，需要系谱信息来区分基因组印迹和随机单等位基因表达[5],[6]这些因素大大增加了对人类印记基因进行转录全扫描所需的工作量和成本。相比之下，大规模的小鼠研究使用了单亲二体性[7]–[12]检测父母对孩子的影响。虽然这种方法已经发现了许多印迹基因，并改进了印迹破坏后果的表型分析，但并非所有基因组区域都被单亲失配所覆盖，而且这种异常的基因组配置可能会扭曲表达模式。使用等位基因特异探针的基于微阵列的方法只能可靠地检测到几乎“全部或全部”的印记，因为母体与父体等位基因表达之间的数量差异由于完美匹配和不匹配探针的交叉杂交而具有很高的误差[13],[14]事实上，基因组印迹可能是从完整的单亲表达到所表达的亲本等位基因中轻微但显著的偏差的连续体，一种能够在转录组规模上可靠检测等位基因特异表达的数量差异的技术将大大加速印迹研究。

结果

Illumina测序结果和SNP覆盖率

短阅读测序(例如转录物的Illumina/Selexa测序）提供了大量的序列标签，可以对两个传递的亲代等位基因编码的转录物进行简单计数，从而为印迹研究提供了许多优势。在这项研究中，我们对AKR/J和PWD/PhJ小鼠株的相互杂交后代的转录物中的基因组印迹进行了定量评估。从出生后第2天（P2）F1雌性小鼠全脑提取总RNA。对每个F1雌性大脑cDNA样本进行一轮Illumina测序。我们从PWD x AKR杂交中获得了1072.63 Mbp的序列数据（首先列出雌性菌株），从AKR x PWD中获得了1136.35 Mbp的高质量32 bp读取数据(图S1.1). 平均而言，27.74%的读数与NCBI RefSeq小鼠基因组数据库对齐。等位基因之间的序列异质性很大，导致ELAND在将读取数据映射到基因组时表现不佳，因此该映射是使用NCBI BLAST程序进行的(表S1.1). 总计，33519739和35510887个读数与相应的反向交叉中的RefSeq数据库对齐。这些序列涵盖了15491个RefSeq基因，其中至少有一个完全匹配的Illumina基因在两个反向杂交中读取。在这些基因中，我们分别鉴定了814360和884828个阅读跨越Perlegen SNP的两个互惠杂交[15].质控过滤后(表S1.2)、320804和327451个包含SNP的高质量读取保留，允许识别每个读取的原始父级（请参阅方法了解更多详细信息）。我们的研究涵盖了5533个RefSeq基因（5076个独特的Entrez基因），在两个互惠杂交中，总SNP计数为4个或更多(表S1.3). 从小鼠脑EST数据库中，在P4小脑中5500个含有polyA的3′端EST序列的cDNA克隆中，3500个是不同的物种[16]这与SAGE最近对P30小鼠大脑的研究形成了对比，其中每个细胞拷贝数为5或更多的匹配GenBank转录本数量为4161[17]但这些数据缺乏等位基因特异性鉴定。基于这一信息，我们可以查询几乎所有当前已知的转录基因在小鼠新生脑中的印记状态，这些转录基因具有可检测的表达，并且计数信息丰富。

检测基因组印迹

根据Illumina读取数据中AKR和PWD SNP等位基因的计数，对两个亲本等位基因相对表达水平进行量化(图1). 我们定义第页₁是PWD x AKR杂交中AKR等位基因计数的百分比，以及第页₂AKR x PWD杂交中AKR等位基因的计数百分比(表S1.4). 我们将一个基因确定为父亲表达的候选印记基因，如果第页₁与第页₂以及在哪里第页₁>0.5和第页₂<0.5（对于母体表达的基因，第页₁<0.5，以及第页₂>0.5) (表S1.5). 两个独立二项式的Storer-Kim检验[18],[19]用于测试两个二项式参数之间差异的显著性，第页₁和第页_2,研究中涉及的每个基因[18].q个-计算每个基因的值，并应用0.05的错误发现率阈值[20]使用这些标准，我们鉴定了13个父系和13个母系表达的候选印迹基因第页₁>0.65,第页₂<0.35 (第页₁<0.65,第页₂>母体基因为0.35）和q个-值分别<0.05(表1).

保存图片、插图等的外部文件。对象名称为pone.0003839.g001.jpg

在单独的窗口中打开

图1

Illumina序列读数对齐免疫球蛋白2成绩单。

顶部面板是摘要窗口或映射到4038 bp的所有1253 cDNA读取免疫球蛋白2成绩单(NM_010514号). 蓝色箭头表示有义读数，红色箭头表示反义读数。从图中可以看出，大多数读取都与转录本3′末端附近的1kb区域对齐。左下角的面板给出了Illumina的读名，右下角给出了序列对齐。有义阅读用黑色字体打印，反义阅读用红色字体。有许多重叠的32-bp读取与转录本唯一对齐，每个核苷酸都有一个质量分数。中间有一个SNP（a/G）。通过直接计算SNP处参考核苷酸和替代核苷酸的数量，我们能够量化两个亲本等位基因的相对表达水平。

表1

通过转录物中的偏倚等位基因计数确定的候选印记基因。

已知IP基因	PWD x AKR		AKR x PWD		q值	AKR百分比		已知状态^†	已验证状态	Sig_SNP（q<0.1）^¶	高温淬火
	AKR公司^*	PWD公司^*	AKR公司^*	PWD公司^*		第1页	第2页				第1页	第2页
纳特 ¹	1182	1	21	1853	0	99.9%	1.1%	知识产权	知识产权	4	100.0%	0.0%
Snarpn公司 ²	898	1	1	19	0	99.9%	5.0%	知识产权	知识产权	1	100.0%	0.0%
蛇形花纹 ²	888	1	1	18	0	99.9%	5.3%	知识产权	知识产权	1	100.0%	0.0%
第13页 ^三	168	0	6	74	0	100.0%	7.5%	尼泊尔卢比	知识产权	三	98.8%	3.0%
那不勒斯 ^三	22	0	0	67	1.2电子19	100.0%	0.0%	尼泊尔卢比	知识产权	1	100.0%	0.0%
发票5f_v2 ⁴	41	三	14	80	1.4E-17号机组	93.2%	14.9%	知识产权	知识产权	2	91.9%	7.8%
中士 ⁵	9	0	0	54	2.0E-09年	100.0%	0.0%	尼泊尔卢比	知识产权	2	100.0%	1.5%
Rasgrf1型 ⁶	16	0	0	20	7.5E-09段	100.0%	0.0%	知识产权	知识产权	三	100.0%	0.0%
影响 ⁷	15	6	8	83	1.2E-06	71.4%	8.8%	尼泊尔卢比	知识产权	2	79.1%	19.8%
Zrsr1型 ⁸	11	0	1	14	6.7E-05年	100.0%	6.7%	知识产权	知识产权	0	97.5%	0.4%
Gtl2公司 ⁹	1	339	193	1	0	0.3%	99.5%	尼泊尔卢比	知识产权	4	0.0%	100.0%
第19页 ¹⁰	2	14	61	1	5.8E-10段	12.5%	98.4%	尼泊尔卢比	知识产权	三	9.4%	100.0%
Cdkn1c公司 ¹¹	0	8	13	0	1.3电子04	0.0%	100.0%	尼泊尔卢比	知识产权	1	3.6%	100.0%
命令1 ¹²	12	33	22	7	2.6E-03型	26.7%	75.9%	知识产权	知识产权	0	41.2%	72.5%
新型IP基因	PWD x AKR		AKR x PWD		q值	AKR百分比		已知状态 ^†	已验证状态	Sig_SNP（q<0.1） ^¶	高温淬火
	AKR公司 ^*	PWD公司 ^*	AKR公司 ^*	压水堆 ^*		第1页	第2页				第1页	第2页
Inpp5f公司	359	19	89	1293	0	95.0%	6.4%	-	知识产权	7	83.2%	19.1%
2410042D21瑞克	21	7	16	32	0.024	75.0%	33.3%	-	eQTL^$	0	79.9%	83.6%
BC043301号	8	0	三	9	0.042	100.0%	25.0%	-	eQTL公司	0	-	-
1810044A24Rik公司	7	20	25	5	1.1E-03段	25.9%	83.3%	-	知识产权	1	20.6%	73.5%
吉格	9	35	21	9	0.002	20.5%	70.0%	-	eQTL公司	1	40.9%	36.1%
Ppfia2型	6	16	32	8	0.003	27.3%	80.0%	-	eQTL公司	0	-	-
初级1	6	81	5	2	0.005	6.9%	71.4%	-	eQTL公司	1	-	-
阿斯	24	60	27	14	0.005	28.6%	65.9%	-	eQTL公司	1	53.7%	56.3%
2010012O05瑞克	6	17	41	16	0.010	26.1%	71.9%	-	eQTL公司	0	56.7%	57.6%
17兰特	10	24	39	17	0.013	29.4%	69.6%	-	eQTL	0	54.5%	55.1%
Pdcl公司	5	13	61	23	0.018	27.8%	72.6%	-	eQTL公司	0	56.8%	58.9%
Blcap公司	6	13	15	2	0.025	31.6%	88.2%	-	知识产权	1	25.2%	73.7%

在单独的窗口中打开

^*：过滤后Illumina序列数据中AKR和PWD等位基因的计数。

^†：新生儿脑中已知印迹基因的印迹状态报告（IP：印迹；NR：未报告）。

^¶：具有以下特征的重要SNP数量q个-每个基因的值≤0.10。

^$：eQTL：表达数量性状位点

在26个候选基因中，共有17个基因通过Sanger测序和Pyrosequencing的组合被证实印迹。其中14个是已知的印迹基因。纳特(聚乙二醇5),发票5f_v2,Rasgrf1型,Zrsr1公司(U2af1-rs1型),Snarpn公司和蛇形花纹已知基因在小鼠新生脑中以父系特有的表达方式印记(表1; 支持的参考S1)[21]–[25]Illumina序列数据以及Sanger测序和Pyrosequencing都证实了这一点(图S1.2–S1.5).神经元抑制素(纳特)，小鼠第2染色体上的一个基因，已知印在小鼠新生脑中[21]。在我们的数据中，纳特显示100%的父系单等位基因表达q个-零值(表1). Illumina读数覆盖了该基因最后外显子内的四个SNP。在3057个观察到的父系等位基因携带读取中，所有这些基因都显示100%的父系表达(图2A)Sanger测序证实了这一结果(图2C)并通过焦深测序(图2C).

保存图片、插图等的外部文件。对象名称为pone.0003839.g002.jpg

在单独的窗口中打开

图2

已知印迹基因的验证纳特（也称为Peg5型).

（A） Perlegen SNP NES08901860、NES0890 1861、NES08 901863和NES08 90 1864的等位基因计数。蓝色条（从左到右）分别表示PWD x AKR和AKR x PWD F1中父系等位基因的Illumina读数（母系基因型列在第一位）。红色条表示母体等位基因Illumina读取计数。（B） Perlegen SNP NES08901861的Sanger测序验证。我们在NES08901861之前发现了一个相邻的SNP位置。目标序列为GCCCT（AC/GA）ATCT。（C），Perlegen SNP NES08901861的焦深测序验证。目标序列为GCCCT（AC/GA）ATCT。

7个已知印迹基因在新生儿脑中的印迹状态，包括父系表达的第13页,高级证书和那不勒斯(表1;图S1.6-S1.8)[26],[27]母性表达Gtl2公司(梅格3),影响,第19页和Cdkn1c公司(第57页^{知识产权2}) (表1;图S1.9–S1.11)[28]–[31]我们的数据支持它们在P2新生儿大脑中的印记(表1).Gtl2公司（也称为梅格3)是小鼠12号染色体上的一个非编码RNA基因，据报道它印在小鼠胎盘上[28].虽然Gtl2型已在大脑中确定[32],[33]未检测新生儿脑内的印迹状态。Solexa数据中没有包含Perlegen SNP，但从Solexa读数的集合中，发现了4个新的SNP，建议Gtl2公司文字记录(学而思_035484)仅由母体等位基因表达(图3A). 这已通过焦深测序得到证实(图3B). 的另一个拼接变体Gtl2公司NM_144513，在我们对新印迹基因的定制安捷伦微阵列调查中被鉴定为印迹基因（A.Clark未发表的数据），PWD x AKR杂交的探针强度差异为1847倍，互惠杂交的探针密度差异为793倍。NM_144513中的Perlegen SNP（NES17649478），但不是学而思_035484通过焦深测序进行验证(图3C). 分析明确表明，这两种剪接变体都有印记。仔细检查就地单亲双相畸形小鼠的胎脑图像与我们的研究结果一致，表明只有母亲的表达[34].

保存图片、插图等的外部文件。对象名称为pone.0003839.g003.jpg

在单独的窗口中打开

图3

已知印迹基因的验证Gtl2公司.

（A） Allele计算通过组装Solexa读数发现的4个新SNP。蓝色条（从左到右）分别代表PWD x AKR和AKR x PWD F1中父系等位基因的计数。红色条表示母体等位基因计数。在其中一个中发现了四个新的SNPGtl2公司成绩单(学而思_035484)与母体等位基因在两个互易杂交中的单等位基因表达一致，并通过Pyrosequencing证实。的另一个拼接变体Gtl2公司NM_144513，之前我们使用定制的安捷伦等位基因特异性微阵列（未发表）发现其印迹，PWD x AKR杂交的探针强度相差1847倍，互惠杂交的探针密度相差793倍。NM_144513中的Perlegen SNP（NES17649478），但不是学而思_035484通过高温测序进行了验证。我们的结论是学而思_035484和NM_144513印在新生儿大脑中。（B）新SNP1的焦磷酸测序验证Gtl2公司目标序列为TGT（A/G）GAGGGA。（C） Perlegen SNP NES17649478的焦深测序验证。目标序列是GA（A/G）GATAG。

识别出已知和新的印记基因

我们还通过Illumina短读测序发现了三个新的印记基因，并通过Sanger和Pyrosequencing进行了验证。据Choi等人。[22],Inpp5f公司是已知印记基因的剪接变体发票5f_v2共有4个外显子和部分最后外显子。序列数据中涵盖了七个SNPInpp5f公司，其中2个由共享发票5f_v2。由于所有七个SNP都显示出显著的父亲过度表达，我们得出结论：Inpp5f公司也印在P2新生儿大脑中(图S1.2). 从形式上讲，也有可能Inpp5f公司和发票5f_v2共用同一个3′端。之前曾报道过基因区域附近的两个CpG岛[22]CpG1没有甲基化，CpG2是DMR（差异甲基化区域），只有父系等位基因被甲基化。之前报道的两个非印迹基因，1810044A24Rik公司 [35]和Blcap公司 [36]在我们的序列数据中发现主要是母体表达的新印记基因(q个-值0.0011和0.025），并通过Pyrosequencing验证，它们显示80%来自母体等位基因。的压印状态1810044A24Rik公司在C57BL/6和C3H/HeJ的相互杂交中也通过高温测序进行了验证(图S1.12、S1.13). 的压印状态Blcap公司由于缺乏外显子SNP，C57BL/6和C3H/HeJ中未得到验证。两个已知的印迹基因，第13页和纳特，位于1810044A24Rik公司和Blcap公司分别为。CpG岛第13页只在母体等位基因处甲基化[26]在纳特之前已确定[26],[37]，所以这三个新的印记基因都在基因区域附近或内部有DMR(表S1.19). 9个基因仅在汇集所有SNP后才达到边际显著性，但没有显示具有显著偏斜频率的单一SNP。在所有9例中，焦平测序明确证明它们没有被压印(表1).

本研究中已知印迹基因的覆盖率

在小鼠已知的98个印迹基因中，45个在AKR和PWD菌株之间同时具有RefSeq ID和SNP。在45个已知的带有SNP的印迹基因中，有33个包含在我们的短读序列数据中。由于在小鼠新生脑中检测不到表达，其余12个基因未被筛选出的含有SNP的高质量读码覆盖(表S1.6). 33个覆盖的已知印迹基因中有14个是显著的(表1). 在非重要的母体表达的印记基因中，Ppp1r9a、Asb4,计算器和Ube3a公司已被报告为脑内印记[38]–[41]它们都有一个略微重要的P（P）-值。Ube3a公司印迹通过焦平测序进行了验证。含有高质量SNP的读取计数过低的基因，例如格纳斯,加特姆,Tnfrsf23型,锌1,数字频道,那不勒斯,Osbpl5公司,Grb10级和Slc22a2系列印记状态仍不确定，但数据与强印记不一致(表S1.6). 所有已知的母体表达基因都有足够深度的序列读取，其等位基因偏向模式与其已知的印记状态一致。Gtl2公司,第19页,Cdkn1c公司和命令1在Solexa数据中具有重要意义，并且它们被证实在新生儿大脑中有印记。第1页第9页具有显著的标称值P（P）-值，但经多次测试校正后不显著。然而，Solexa计数与优先母体表达一致(表S1.7).Asb4类,计算器,Ube3a公司具有边际显著性P（P）-由于数据中包含少量含SNP的读操作，这表明它们可能会在新生儿大脑中留下印记。我们证实了Ube3a公司通过焦深测序方法在新生儿大脑中留下印记第页₁和第页₂比率0.392和0.755。数据中包含的其他基因，Gatm、Tnfrsf23、Zim1、Dcn、Nap1l4、Osbpl5、，和Slc22a2系列不显著，这与已知的印记在胎盘而不是新生儿脑中的事实一致(表S1.7).格纳斯，一个已知的印记基因存在于脑垂体中，但不存在于小鼠的整个大脑中[42]–[45]，在Solexa数据中没有统计显著性。然而，焦深测序验证显示，0.459/0.562的比率为第页₁/第页₂这表明从母亲遗传来的等位基因表达略高。Grb10级印在胎盘和大脑中[46]–[48]但在第页₁和第页₂在Solexa数据中，尽管有足够的表达水平来提供足够的能力测试。随后的焦深测序证实了P2新生儿脑中的非印迹状态(表S1.7). 事实上，组10在小鼠大脑中印有父系表达，但在其他组织中只显示母系表达[48]。有可能组10在大脑的其他阶段（例如胎儿大脑）被印记，但在小鼠的P2大脑中没有印记，或者印记状态可能因菌株而异，AKR x PWD F1无法印记组10。对于在我们的数据中没有统计显著性的父亲表达的已知印记基因，马格尔2和桩3与100%父系表达一致。Rtl1号机组和应对策略2如序列计数数据所示，可能是母体表达，但读取次数太少，无法达到统计显著性。While期间应对策略2是母性表达的，并且Rtl1号机组由父系遗传的等位基因表达，包含microRNA的反义转录物由母系等位基因表示[49].免疫球蛋白2和Slc38a4系列与非印迹一致，与人类和小鼠的表达模式一致[50]–[53],免疫球蛋白2经Pyrosequencing证实在大脑中有双向表达(表S1.7).

紧密相连的印记基因对

在迄今为止发现的10对已知印记基因中[1]，8对相互印记（母体表达为有义转录物，父体表达为反义转录物或反之亦然）[41],[49],[54]–[66](表S1.8). 其余两个只显示父亲的表情[51],[67],[68]。这些印记案例都是在使用不同鼠种的不同样品中发现并分别验证的(表S1.8). 在我们的Illumina序列数据中，三个相互表达的紧密相连的反义（或义）对被充分覆盖以进行统计分析(表S1.9). 其中四个是已知的印记基因(第13页,纳特,Zrsr1公司,命令1)和两个(1810044A24Rik公司,Blcap公司)是我们证实的新型印记基因之一。第13页,纳特和Zrsr1公司位于1810044A24Rik公司,Blcap公司和Commd（命令）分别为。有趣的是，在这三对中，Peg13-1810044A24Rik，Nnat-Blcap公司和Zrsr1-命令1，第一个基因是父亲表达的印记基因，100%单等位基因表达，而第二个基因是母亲表达的部分印记基因(图4). 这种模式与父亲表达的义转录物的单等位基因表达可能会减少反义转录物父亲拷贝的相对表达的可能性一致，从而导致主要由母亲表达。我们的假设是，父亲表达的印记基因驱动着母亲基因的明显印记，可能是通过转录干扰。虽然文献中已经注意到这种相互印记[24],[69],[70]这是第一项全基因组研究，确定了小鼠新生脑中多个量化良好的病例。

保存图片、插图等的外部文件。对象名称为pone.0003839.g004.jpg

在单独的窗口中打开

图4

Illumina序列数据涵盖的敏感-反义基因对。

三个基因对的基因结构显示嵌套结构。蓝色阴影表示父系等位基因，粉红色阴影表示母系等位蛋白。虚线框表示没有表达式。箭头代表转录的方向。每个基因的两个父母外显子的高度之和与表达水平成比例，表达水平由完美匹配的Illumina读数的总计数进行量化。同一基因中父系和母系等位基因外显子的相对高度代表两个亲本等位基因的相对表达水平。外显子下的短垂直线指示SNP位置，并标记母体和父体等位基因的两个反向杂交的总数。

成绩单范围内的印记状态模式

为了研究我们研究涵盖的所有转录物的印记状态模式，我们绘制了5076个独特的Entrez基因，在小鼠基因组的两个双向杂交中计数为四个或更多(图5;图S1.14). 我们将印迹状态定义为两个互惠杂交中AKR百分比之间的差异，即第页₁-第页₂(表S1.4). 大多数基因的值为第页₁-第页₂接近零，表明没有明显的印记。已知印迹簇中的正反义对和印迹基因在全基因组图中清晰显示(图S1.14). 共有1606个非显著基因，在两个互惠杂交中的总计数均为25或更多，形成了一个良好的组织特异性非印迹数据集，用于计算预测和进化分析(表S1.10).

保存图片、插图等的外部文件。对象名称为pone.0003839.g005.jpg

在单独的窗口中打开

图5

印迹状态的染色体扫描。

（A） 2号染色体的印记状态。（B） 7号染色体的印记状态。每个图都包含独特的Entrez基因，在两个互惠杂交中，包含SNP的Illumina读数不少于4。每根杆的高度是两个倒十字（p1-p2）中AKR百分比的差值，代表压印的强度。颜色代表印记的方向，蓝色代表父亲的表情，红色代表母亲的表情。颜色的强度表示重要性，灰色表示不重要(q个-值≥0.10），浅蓝色和粉红色表示轻微显著（0.05≤q个-值<0.10），深蓝色和红色表示显著(q个-值<0.05）。如果出现以下情况，则显示基因名称|第页₁-第页₂| ≥0.3.

印迹基因的父脑和母体胎盘偏倚

当比较序列读取数据中父系和母系表达的印记基因时，我们发现父系表达过多（11个父系和6个母系），其中大多数（11个中的9个）表现出强烈的单等位基因表达（90%–100%）。三个母体表达的基因仅部分印在大脑中，母体等位基因的表达量为70%-80%(表1). 总的来说，有一种偏向于父亲在大脑中表达的印记基因，而在胎盘中报告的29个印记基因中，只有8个是父亲表达的(表S1.11).

讨论

通过直接计数SNP，以准确比率量化等位基因特异性表达

基因组印记并不总是100%来自父系或母系等位基因的“全部或全部”效应。相反，印记的程度是从单亲完全表达到双亲等位基因同等表达的连续统一体。微阵列杂交可以识别单亲表达，但不能给出两个亲本等位基因的可靠比率，因为没有好的方法来量化完美探针和错配探针之间的亲和力差异。直接对cDNA进行Sanger测序的方法不是定量的，并且会遗漏母体与父体表达之间存在定量差异的病例。为了解决这些问题，我们采用Illumina/Selexa测序方法对小鼠F1代新生脑互惠基因的整个转录本进行了测序，并通过计算转录本中SNP位置的等位基因特异序列读取数，获得了两个亲本等位基因的相对表达率。该方法通过独立的方法（焦磷酸测序和桑格测序）得到了很好的验证。我们展示了许多新生儿大脑基因印迹状态的发现，包括在任何组织中未知的基因。只要对等位基因特异性差异表达感兴趣，就会广泛使用通过短阅读转录组测序对等位蛋白特异性表达进行评分，包括量化顺式-作用调节性SNP效应[71].

组织和发育阶段特异性基因组印迹详尽剖析的途径

由于这些基因的发现是以一种病态的方式进行的，因此在人类和小鼠中发现印记基因的情况仍然是零星的。不同的研究使用了不同的小鼠菌株，测试了不同组织和发育时间点的印记状态，迄今为止发表的研究中没有一项采用真正的转录宽屏幕进行印记。我们的研究显示了一种以高度一致的方式定量评估每个组织的整个转录组印迹状态的方法。短读测序方法的一致性具有明显的优势，为建立小鼠和人类所有转录基因的印记状态目录铺平了道路。

嵌套和紧密连锁基因的印记

我们的短阅读转录组测序方法确定了三对紧密相连且相互印记的基因，其中父亲表达的基因显示100%的单等位基因表达，而母亲表达的基因仅部分印记在新生儿大脑中。这些数据与父亲表达的基因被强烈印记的情况一致，并且由于其印记，存在转录干扰，导致从相反链转录的基因（或嵌套在第一个转录物中的基因）表达较弱。这会给人留下一种母性表达较弱的印记。部分印迹基因对母体表达的偏见，强印迹基因的父系表达，以及对链转录物的明显转录干扰都有待进一步分析，以了解调节其印迹的机制及其功能和进化意义。

基因组中有多少印记基因？

据估计，哺乳动物基因组中约有1%的基因被印记。然而，这一估计范围很广，大约有100个基因[2]到600个基因[3]，到2000多个基因[72]这种差异是由于对印迹状态的组织特异性的忽视以及无法对非印迹基因进行推断。使用我们的方法，通过计算与两个亲本等位基因相对应的读数，我们可以确定一个基因没有印记的统计置信度，以及识别那些只有部分印记的基因。这使我们能够确定统计置信度，即印记基因列表在新生儿大脑中接近穷尽。除了我们在新生儿大脑中发现的三个新的印记基因外，我们还证实了7个已知印记基因的印记状态，我们还发现了7个已知印记在其他组织中的额外基因在新生儿大脑中的新印记状态。我们覆盖了5000多个转录本，没有发现新的印迹簇，只发现了少量新的印记基因。总的来说，数据表明，印在新生儿大脑中的基因列表已接近完整，剩下的唯一被发现的基因要么表达水平很低，要么显示出一种小的亲缘偏见，要么只印在大脑的一小部分。

材料和方法

小鼠应变

从Jackson实验室购买了四种小鼠菌株（C57BL/6、C3H/HeJ、AKR/J、PWD/PhJ）(网址：www.jax.org). 我们进行了两对小鼠互惠杂交（C57BL/6 x C3H/HeJ，C3H/HeJ x C57BL/6，AKR/J x PWD/PhJ，PWD/PhJ x AKR/J）。使用Qiagen RNeasy Lipid Tissue Mini Kit从P2 F1小鼠全脑提取总RNA样本。RNA浓度和A₂₆₀纳米/安培₂₈₀使用NanoDrop ND-1000分光光度计检查nm比值。使用安捷伦2100生物分析仪检查RNA完整性。所有样本的RIN（RNA完整性数）均为10。

所有涉及小鼠的程序均已获得康奈尔大学动物护理和使用委员会的批准（方案编号2002-0075，自2006年1月27日起批准三年）。康奈尔大学获得AAALAC认证。

转录组的Illumina测序

华盛顿大学基因组中心对PWD和AKR小鼠的每只倒数F1进行了一次Illumina基因组分析仪运行。cDNA是使用改进的SMART技术（ClonTech）合成的。为了提高序列覆盖率，我们使用了大小选择程序，删除了长度小于1.3 kb的cDNA。在Illumina Genome Analyzer上运行一次Illumiana Genome分析仪，每次运行一个倒数F1样品。

-简介

使用修改的SMART协议将小鼠总RNA转换为第一链cDNA。然后PCR扩增第一链cDNA，并在6%聚乙二醇（PEG）/0.55M氯化钠（NaCl）中进行大小分级，以富集cDNA≤1250bp。然后使用以下方法从cDNA中删除SMART适配器嗯使用11%PEG/0.5M NaCl将I和适配器从反应中移除。然后将纯化的cDNA群体进行片段化，并用作标准Illumina片段库的源。

-修改后的SMART

根据Clontech SMART协议（E.Mardis，个人通信）的修改版本，使用约1µg总RNA和SuperScript II（Invitrogen），从小鼠总RNA中生成第一链cDNA。

-循环优化PCR和生产PCR

将修改后的SMART cDNA用作PCR反应的模板，以确定反应不再呈指数增长的周期数。循环优化反应使用1µl第一链cDNA反应。在16至24个周期之间的2个周期时间点去除等分试样。然后在275 v的闪蒸凝胶（Lonza）上运行5 min，通过观察确定最佳循环数。

生产PCR由8个组成与循环优化反应相同的100µl反应组成，但每个反应使用2µl第一链cDNA，并使用经验确定的最佳循环数扩增所有8个反应。根据制造商的方案，用两个Qiaquick柱（Qiagen）纯化和浓缩PCR产物，并用每个柱30µl缓冲液EB（Qiangen）洗脱。

-粒度分级

为了分离≤1250 bp的cDNA，将生产PCR反应中扩增的cDNA重新悬浮在6%PEG-8000、0.55 M NaCl和羧酸盐顺磁性珠的300µl反应中。将混合物剧烈涡旋并在室温下孵育10分钟。将反应置于磁粉收集器（MPC，Invitrogen）上2分钟，将含有≤1250 bp分数的上清液转移到干净的管中。根据制造商的方案，在Qiaquick柱上纯化该cDNA片段，并在50µl缓冲液EB中洗脱。

-适配器去除和cDNA纯化

cDNA合成过程中添加的5′和3′适配器包含夫人在含有1×NEB缓冲液4（20 mM三醋酸、50 mM醋酸钾、10 mM醋酸镁、1 mM二硫苏糖醇、pH 7.9@25°C）、10µg 10mg/ml BSA、64µM S-腺苷蛋氨酸（新英格兰生物实验室）和12个单位的100µl反应中通过消化去除的I识别序列夫人I（新英格兰生物实验室）在37°C下保持30分钟。根据制造商的方案，用1个Qiaquick柱纯化并浓缩消化后的cDNA，并用30µl缓冲液EB洗脱。

第二轮PEG/NaCl分馏进一步去除了夫人1消化。这里，通过Qiaquick柱纯化的cDNA在11%PEG-8000、0.5M NaCl和羧酸盐顺磁性珠的300µl反应中重新悬浮。将混合物剧烈旋涡并在室温下培养10分钟。将反应物置于MPC上2分钟，然后丢弃上清液。用70%乙醇将顺磁性珠子洗涤两次并风干。将含有顺磁性磁珠的管从MPC中取出，并将磁珠重新悬浮在50µl缓冲液EB中，并剧烈旋转。将反应物置于MPC上2分钟，将上清液转移到干净的试管中。该片段含有大于150 bp的cDNA，不含5′和3′适配器。

-雾化/Covaris剪切和Illumina/Selexa文库准备

样品B17（PWD/PhJ x AKR/J）：cDNA通过雾化剪切（在50 PSI下2分钟），剪切后的DNA根据制造商的方案用单个Qiaquick柱纯化/浓缩。样品B21（AKR/J x PWD/PhJ）：cDNA用Covaris S2系统在75%甘油中剪切，程序如下：4个处理10个周期，每个处理60秒；占空比=20%；强度=10；1000次循环/脉冲。通过乙醇沉淀纯化/浓缩cDNA。

然后根据制造商的协议制备剪切cDNA用于Illumina测序。在适配器结扎和琼脂糖凝胶分离后，从150-200 bp大小的选择部分制备文库。使用单端读取方案对文库进行测序，每次在Illumina基因组分析仪上收集32bp的数据。通过Illumina仪器软件进行数据分析和基础调用。

Illumina序列数据分析

我们从PWD/PhJ x AKR/J交叉口（简称PWD x AKR）的七条车道中获得33519739次读取（总计1072.63 Mbp），从八条车道中获取35510887次读取（合计1136.35 Mbp）的反向交叉口AKR/J x PWD/PhJ（简称AKR x PWD）。两次都有很高的序列质量，95%的基地通过了Q20(图S1.1).

我们使用了NCBI BLAST程序的本地版本(http://www.ncbi.nlm.nih.gov/blast/blast.cgi)将32-bp读取与鼠标RefSeq数据库对齐(网址：http://www.ncbi.nlm.nih.gov/RefSeq/). blastn程序的参数针对短读和我们的目的进行了优化。我们在CBSU集群的180个节点上执行了BLAST作业(http://cbsuapps.tc.cornell.edu/index.aspx)使用P-BLAST实用程序。PWR x AKR交叉中23.82%的总读取与RefSeq数据库一致，每次读取3.57次。AKR x PWD交叉中31.18%的总读取与RefSeq数据库一致，每次读取3.02次(表S1.1). 通过与RefSeq基因（或同一Entrez基因的不同转录本）的唯一匹配，筛选出含有高质量SNP的读取。通过Perlegen小鼠SNP数据库中SNP位置Illumina读数的相对计数估计两个亲本等位基因的相对表达水平(表S1.14–S1.18;图S1.15–S1.20). 小鼠98个已知印迹基因中有59个位于小鼠RefSeq数据库中。我们根据BLAST对齐信息将它们组装成ace文件。在Illumina组装的12个已知印迹基因中，有20个新的SNP被称为(表S1.12和S1.13).

相对亲本表达的估计

为了确定小鼠RefSeq数据库中SNP的位置，我们使用了Perlegen小鼠SNP数据库中的SNP基因型和信息(http://mouse.perlegen.com). Perlegen Sciences和NIEHS对包括PWD和AKR在内的15个基因组覆盖率为70%的小鼠菌株中的800万个SNP进行了基因分型。SNP密度约为3个SNP/kb，数据库中涵盖了大多数基因区域。审查和验证的小鼠RefSeq序列的基因组坐标（从NM和NR开始，参见http://www.ncbi.nlm.nih.gov/RefSeq/key.html#状态)从UCSC基因组浏览器下载(网址：www.genome.ucsc.edu2007年7月组装）。根据RefSeq基因坐标筛选RefSeq序列中的SNP位置。为了校正RefSeq基因序列比对中的缺口，我们还使用SNP位置上游和下游20 bp进行了文本匹配。18797个RefSeq序列中共发现206589个Perlegen SNP(表S1.14和S1.15)，平均SNP密度为11个SNP/RefSeq序列(图S1.15). 根据Illumina序列读取，调用了Perlegen SNP数据库中缺失数据的4127个SNP。所有高质量Perlegen单核苷酸多态性的基因型(q个-Illumina读数中包含的得分≥10，替代等位基因的错配≤4，参考等位基因错配≤3，匹配长度≥28）在两个倒数F1中进行汇总。207407个Perlegen RefSeq SNP中有175687个（84.71%）未涵盖或未提供信息（两个方向的SNP计数均小于1个）。在31720个Illumina覆盖的Perlegen单核苷酸多态性中，有25289个（83.21%）通过Illuminia reads得到确认，4127个（13.58%）Perlgen单克隆多态性在AKR和PWD菌株中缺失数据（N），根据Illumiana序列信息被调用(图S1.19). 新称的SNPs被纳入数据分析。从结果来看，Illumina短阅读序列识别的SNP的基因型与Perlegen SNP一致，表明我们的Illumiana基因组分析仪运行的序列质量较高。只有161个不一致的SNP，其中大多数是互补等位基因，可能来自RefSeq基因的反义转录。

RefSeq转录物的表达水平通过Illumina序列数据中完全匹配的读取次数进行量化。15491个RefSeq基因被两个互易杂交中的每一个至少一个完美匹配所覆盖(图S1.20).

为了进行质量控制并过滤出真正的含SNP的读数，考虑了几个标准。根据Illumina序列SNP与Perlegen SNP信息的一致性，将Illuminia序列SNP（Illumiana读数中存在的Perlegen-SNP）分为六类(表S1.16). 1-5类是一致的SNP。类别1包括AKR和PWD菌株之间多态的SNP。这些是我们想在研究中用来量化父母相对表达的SNP。2类SNP也一致，但AKR和PWD菌株之间的SNP没有多态性。类3-5是在Perlegen数据库中缺少数据（N）的SNP。其余的Illumina SNP被归为0类，即不一致的SNP。大多数Illumina SNP的质量分数都在20分或以上(图S1.16). 错配数量的分布表明，模式1类SNP与完全匹配的参考和替代等位基因一致，这是任何其他SNP类中都没有的属性(图S1.17). 因此，在以下分析中使用了1类SNP。关于包含SNP的读取的匹配长度，80%以上的读取具有完整长度匹配（32 bp），并且大多数读取的匹配长为25或更大。blastn算法是一种局部对齐算法，因此，如果在读取的第一个或最后两个bp中存在SNP，则对齐将被截断，尽管它仍被视为全长匹配(图S1.18). 在总结每个RefSeq基因的最终SNP计数之前，使用了两组筛选标准(表S1.2). 过滤器1和过滤器2都是保守的，过滤后的读数都与Entrez基因数据库唯一匹配（由于选择性剪接，可能是多个RefSeq）。由于没有车道效应，两个互惠杂交中的AKR和PWD计数由RefSeq基因和SNP汇总。326个1类SNP在Illumina序列数据中没有多态性，因为小鼠基因组中含有SNP的序列重复匹配，所以我们不知道含有这些SNP的转录物来自哪里。这些SNP不包括在最终分析中(表S1.17).

检测基因组印迹和统计分析

我们有两个倒数F1的过滤AKR和PWD等位基因计数。我们定义第页₁作为PWD x AKR杂交中AKR等位基因比例第页₂AKR x PWD杂交中的AKR等位基因比例(表S1.4). 如果一个基因在两个亲本等位基因中的表达相同，第页₁和第页₂约为0.5。如果基因是来自AKR衍生的等位基因的具有较高表达的表达QTL（eQTL），第页₁大约等于第页₂以及两者第页₁和第页₂将大于0.5。父亲表达的印记基因将具有以下模式第页₁>0.5和第页₂<0.5，而母体表达的印记基因将具有以下模式第页₁<0.5和第页₂>0.5 (表S1.5). 反向杂交的优点是我们可以区分eQTL和真正的基因组印迹。

需要进行正式的统计测试来测试其重要性。我们没有使用费希尔精确测试，因为这是一种保守的测试，会导致大量功率损失，尤其是当总计数很小时[73]相反，我们使用现代统计方法，即两个独立二项式的Storer-Kim方法来测试两个二项式参数之间是否存在显著差异，第页₁和第页₂ [18]. TheP（P）-使用Wilcox代码计算值[19]在R中（版本2.60，网址：www.r-project.org). 的95%置信区间第页₁和第页₂也通过Wilson方法获得[74]（R，binom包）。错误发现率(q个-值）由R中的qvalue包计算[20].

Sanger和Pyrosequencing验证

我们使用Pyrosequencing Assay Design Software Version 1.0.6（Biotage AB）为候选印迹基因设计了Pyrose测序PCR和测序引物。为了确保引物中没有SNP，在设计引物时，对Perlegen数据库中的SNP位置进行标记并排除。使用TaqGold酶（Applied Biosystems）进行热测序的PCR扩增，进行45个循环的三步PCR（95°C，45 s，46–58°C，30 s，72°C，10–20 s），然后最后延长10分钟。PCR产物（80–300 bp）通过外显核酸酶I和虾碱性磷酸酶纯化，并使用原始Pyro PCR引物在ABI 3730xl DNA分析仪（Applied Biosystems）上使用BigDye Terminator v3.1进行双向测序。序列色谱图采用CodonCode Aligner 2.0.4版（CodonCodeCorporation DNA测序软件）进行分析。用生物素标记的正向（或反向）引物在相同条件下扩增用于焦磷酸测序的PCR产物。使用Pyro Gold试剂（Biotage，AB）在PSQ™96 MA Pyrosequencer（BiotageAB）上进行Pyrose测序。两个亲本等位基因的相对水平通过PSQ™96 MA Pyrossequencer软件（版本2.02 RC 5.8，Biotage，AB）使用等位基因量化方法进行量化。

支持信息

图S1

该文件包含带书签的pdf格式的图S1.1至S1.20。

（2.71 MB PDF格式）

单击此处查看其他数据文件。^{（250万，pdf）}

表S1

该文件包含表S1.1至S1.19，作为书签pdf。

（0.35 MB PDF格式）

单击此处查看其他数据文件。^{（346K，pdf）}

参考S1

支持参考表1.

（0.03 MB文件）

单击此处查看其他数据文件。^{（27K，文件）}

致谢

我们感谢康奈尔脊椎动物基因组中心对这项研究的支持。我们感谢审稿人和编辑为改进本书的表述提出的建议。在审查过程中，我们注意到Schulz等人（2008 Hum.Mol.Genet.，advanced electronic pub.）确认了Blcap公司在小鼠大脑中。

脚注

竞争利益：提交人声明不存在相互竞争的利益。

基金：作者没有任何支持或资金可供报告。

工具书类

1莫里森IM、拉姆齐JP、斯宾塞HG。哺乳动物印记普查。趋势Genet。2005;21:457–465.[公共医学][谷歌学者]

2Luedi PP、Dietrich FS、Weidman JR、Bosko JM、Jirtle RL等。新型人类印迹基因的计算和实验鉴定。基因组研究。2007;17:1723–1730. [PMC免费文章][公共医学][谷歌学者]

三。Luedi PP、Hartemink AJ、Jirtle RL。印迹小鼠基因的全基因组预测。基因组研究。2005;15:875–884. [PMC免费文章][公共医学][谷歌学者]

4Pollard KS、Serre D、Wang X、Tao H、Grundberg E等。识别新印记基因的全基因组方法。人类遗传学。2008;122:625–634.[公共医学][谷歌学者]

5Lomvardas S、Barna G、Pisapia DJ、Mendelsohn M、Kirkland J等。染色体间相互作用和嗅觉受体选择。单元格。2006;126:403–413.[公共医学][谷歌学者]

6Gimelbrant A，Hutchinson JN，Thompson BR，Chess A.人类常染色体上广泛的单等位基因表达。科学。2007;318:1136–1140.[公共医学][谷歌学者]

7Schulz R，Menheniott TR，Woodfine K，Wood AJ，Choi JD，等。使用微阵列和单亲双失配对新印迹基因的染色体全识别。核酸研究。2006;34：e88。 [PMC免费文章][公共医学][谷歌学者]

8Yamazawa K、Kagami M、Ogawa M、Horikawa R、Ogata T。第7号染色体的母亲单亲二体的胎盘发育不良。美国医学遗传学杂志。2008;146个:514–516.[公共医学][谷歌学者]

9Ogata T，Kagami M，Ferguson-Smith AC。调节14号染色体父系和母系单亲二分体表型结果的分子机制。表观遗传学。2008;三:181–187.[公共医学][谷歌学者]

10Cattanach BM，Kirk M.小鼠母系和父系染色体区域的差异活性。自然。1985;315：496–498。[公共医学][谷歌学者]

11Cattanach BM、Barr JA、Evans EP、Burtenshaw M、Beechey CV等。Prader-Willi综合征的候选小鼠模型，显示Snrpn表达缺失。自然遗传学。1992;2:270–274.[公共医学][谷歌学者]

12Ferguson-Smith AC、Cattanach BM、Barton SC、Beechey CV、Surani MA。小鼠7号染色体亲本印迹的胚胎学和分子研究。自然。1991;351:667–670.[公共医学][谷歌学者]

13Serre D、Gurd S、Ge B、Sladek R、Sinnett D等。人类基因组中的差异等位基因表达：一种稳健的方法来识别调节基因表达的遗传和表观顺作用机制。公共科学图书馆遗传学。2008;4：e1000006。 [PMC免费文章][公共医学][谷歌学者]

14Bjornsson HT、Albert TJ、Ladd-Acosta CM、Green RD、Rongione MA等。基于SNP特异性阵列的等位基因特异性表达分析。基因组研究2008 [PMC免费文章][公共医学][谷歌学者]

15Frazer KA、Eskin E、Kang HM、Bogue MA、Hinds DA等。近交系小鼠中827万SNP的序列变异图。自然。2007年；448:1050–1053.[公共医学][谷歌学者]

16Matoba R、Kato K、Saito S、Kurooka C、Maruyama C等。小鼠小脑发育过程中的基因表达。基因。2000;241:125–131.[公共医学][谷歌学者]

17Chrast R、Scott HS、Papasavas MP、Rossier C、Antonarakis ES等。SAGE小鼠脑转录组：唐氏综合征16三体部分小鼠模型（Ts65Dn）和正常小鼠P30脑基因表达的差异。基因组研究。2000;10:2006–2021. [PMC免费文章][公共医学][谷歌学者]

18Storer BE，Kim C.比较2个二项式比例的一些精确检验统计量的精确性质。美国统计协会杂志。1990;85:146–155. [谷歌学者]

19Wilcox RR.阿姆斯特丹，波士顿：学术出版社。1 v.（各种页码）p；2003年，应用现代统计技术。[谷歌学者]

20Storey JD，Taylor JE，Siegmund D.错误发现率的强控制、保守点估计和同时保守一致性：统一方法。英国皇家统计学会期刊B辑统计方法。2004;66:187–205. [谷歌学者]

21Kagitani F、Kuroiwa Y、Wakana S、Shiroishi T、Miyoshi N等。Peg5/Neuronatin是一种印迹基因，位于小鼠第2染色体亚远端。核酸研究。1997;25:3428–3432. [PMC免费文章][公共医学][谷歌学者]

22Choi JD、Underkoffler LA、Wood AJ、Collins JN、Williams PT等。Inpp5f的一种新变体印在大脑中，其表达与内部CpG岛的差异甲基化相关。分子细胞生物学。2005;25：5514–5522。 [PMC免费文章][公共医学][谷歌学者]

23Plass C、Shibata H、Kalcheva I、Mullins L、Kotelevtseva N等。通过RLGS-M将小鼠9号染色体上的Grf1识别为印迹基因。自然遗传学。1996;14:106–109.[公共医学][谷歌学者]

24Wang Y，Joh K，Masuko S，Yatsuki H，Soejima H，et al.小鼠Murr1基因印在成人大脑中，可能是由于反义U2af1-rs1基因的转录干扰所致。分子细胞生物学。2004;24:270–279. [PMC免费文章][公共医学][谷歌学者]

25Leff SE、Brannan CI、Reed ML、Ozcelik T、Francke U等。小鼠Snarpn基因的母体印迹和与人类Prader-Willi综合征区域的保守连锁同源性。自然遗传学。1992;2:259–264.[公共医学][谷歌学者]

26Smith RJ、Dean W、Konfortova G、Kelsey G。在全基因组筛查中识别母亲甲基化的新印记基因。基因组研究。2003;13：558–569。 [PMC免费文章][公共医学][谷歌学者]

27Piras G、El Kharroubi A、Kozlov S、Escalante-Alcalde D、Hernandez L等。潜在抑癌基因Zac1（Lot1）和ε-肌多糖基因是母体印迹基因：通过新单亲成纤维细胞系的减法筛选鉴定。分子细胞生物学。2000;20:3308–3315. [PMC免费文章][公共医学][谷歌学者]

28Schmidt JV、Matteson PG、Jones BK、Guan XJ、Tilghman SM。Dlk1和Gtl2基因相互连接并相互印记。基因发育。2000;14:1997–2002. [PMC免费文章][公共医学][谷歌学者]

29Hagiwara Y、Hirai M、Nishiyama K、Kanazawa I、Ueda T等。通过等位基因信息显示筛选印迹基因：鉴定父系表达的基因对小鼠18号染色体的影响。美国国家科学院院刊。1997;94:9249–9254. [PMC免费文章][公共医学][谷歌学者]

30Hemberger M、Redies C、Krause R、Oswald J、Walter J等。H19和Igf2在小鼠大脑的神经外胚层源性细胞中表达和差异印迹。Dev基因进化。1998;208:393–402.[公共医学][谷歌学者]

31Hatada I，Mukai T.小鼠p57KIP2（一种细胞周期依赖性激酶抑制剂）的基因组印迹。自然遗传学。1995;11:204–206.[公共医学][谷歌学者]

32McLaughlin D，Vidaki M，Renieri E，Karagogeos D。胚胎发育和成年期间前脑中母体印记基因Gtl2的表达模式。基因表达模式。2006;6：394–399。[公共医学][谷歌学者]

33Yevtodiyenko A、Steshina EY、Farner SC、Levorse JM、Schmidt JV。178 kb BAC转基因印记小鼠Gtl2基因并定位组织特异性调控元件。基因组学。2004;84:277–287.[公共医学][谷歌学者]

34da Rocha ST、Tevendale M、Knowles E、Takada S、Watkins M等。Dlk1和相互印迹的非编码RNA的限制性共表达，Gtl2：顺式控制的意义。开发生物。2007;306:810–823.[公共医学][谷歌学者]

35Davies W，Smith RJ，Kelsey G，Wilkinson LS。新型印迹基因Nap1l5和Peg13及其非印迹宿主基因在成年小鼠脑中的表达模式。基因表达模式。2004;4:741–747.[公共医学][谷歌学者]

36Evans HK，Weidman JR，Cowley DO，Jirtle RL。blcap/nnat的比较系统发育分析揭示了优生动物特有的印记基因。分子生物学进化。2005;22:1740–1748.[公共医学][谷歌学者]

37Kikyo N、Williamson CM、John RM、Barton SC、Beechey CV等。母系或父系复制远端Chr 2的小鼠中神经元生成素的遗传和功能分析。开发生物。1997;190:66–77.[公共医学][谷歌学者]

38Ono R，Shiura H，Aburatani H，Kohda T，Kaneko-Ishino T，等。小鼠近端6号染色体上一个新的大型印迹基因簇的鉴定。基因组研究。2003;13:1696–1705. [PMC免费文章][公共医学][谷歌学者]

39Mizuno Y、Sotomaru Y、Katsuzawa Y、Kono T、Meguro M等。Asb4、Ata3和Dcn是使用RIKEN cDNA微阵列高通量筛选确定的新印记基因。生物化学与生物物理研究委员会。2002;290:1499–1505.[公共医学][谷歌学者]

40Hoshiya H、Meguro M、Kashiwagi A、Okita C、Oshimura M.Calcr，6号染色体近端印迹簇中的一种脑特异性印迹小鼠降钙素受体基因。人类遗传学杂志。2003;48:208–211.[公共医学][谷歌学者]

41Albrecht U、Sutcliffe JS、Cattanach BM、Beechey CV、Armstrong D等。小鼠Angelman综合征基因Ube3a在海马和浦肯野神经元中的印记表达。自然遗传学。1997;17:75–78.[公共医学][谷歌学者]

42Weinstein LS，Liu J，Sakamoto A，Xie T，Chen M.微审查：GNAS：正常和异常功能。内分泌学。2004;145:5459–5464.[公共医学][谷歌学者]

43Weinstein LS，Yu S，Warner DR，Liu J.刺激性G蛋白α亚基突变的内分泌表现和基因组印迹的作用。Endocr版本。2001;22:675–705.[公共医学][谷歌学者]

44Weinstein LS，Yu S，Ecelbarger CA。肾单位不同段异源三聚体G蛋白G（S）α亚单位的可变印迹。美国生理学杂志肾生理学。2000;278：F507–514。[公共医学][谷歌学者]

45Yu S、Yu D、Lee E、Eckhaus M、Lee R等。异三聚体Gs蛋白α亚单位（Gsalpha）基因敲除小鼠的可变和组织特异性激素抵抗是由于Gsalpha基因的组织特异性印迹所致。美国国家科学院院刊。1998;95:8715–8720. [PMC免费文章][公共医学][谷歌学者]

46Mergenthaler S、Hitchins MP、Blagitko-Dorfs N、Monk D、Wollmann HA等。关于人类GRB10在发育中大脑中印记状态的相互矛盾的报告：体细胞杂种预测等位基因表达起源的可靠性如何？美国人类遗传学杂志。2001;68:543–545. [PMC免费文章][公共医学][谷歌学者]

47Blagitko N、Mergenthaler S、Schulz U、Wollmann HA、Craigen W等。人类GRB10以高度组织特异性和异构体特异性的方式从父系和母系等位基因中印记和表达。人类分子遗传学。2000;9:1587–1595.[公共医学][谷歌学者]

48Hikichi T、Kohda T、Kaneko-Ishino T、Ishino F.小鼠Meg1/Grb10和人类Grb10基因的印迹调控；脑特异性启动子和小鼠特异性CTCF结合位点的作用。核酸研究。2003;31：1398–1406。 [PMC免费文章][公共医学][谷歌学者]

49Seitz H，Youngson N，Lin SP，Dalbert S，Paulsen M，et al.印迹微RNA基因转录为反义的反向印迹逆转录酶样基因。自然遗传学。2003;34:261–262.[公共医学][谷歌学者]

50Ohlsson R、Hedborg F、Holmgren L、Walsh C、Ekstrom TJ。人类发育过程中IGF2和H19表达的重叠模式：双等位基因IGF2表达与H19表达缺乏相关。发展。1994;120:361–368.[公共医学][谷歌学者]

51DeChiara TM、Robertson EJ、Efstratiadis A.小鼠胰岛素样生长因子II基因的父母印记。单元格。1991;64:849–859.[公共医学][谷歌学者]

52Jones BK，Levorse J，Tilghman SM。Igf2和H19基因之间核酸敏感区的缺失会导致Igf2的失调和肥胖增加。人类分子遗传学。2001;10:807–814.[公共医学][谷歌学者]

53Charalambous M、Menheniott TR、Bennett WR、Kelly SM、Dell G等。Igf2/H19位点的增强子元件驱动印迹和非印迹组织中的基因表达。开发生物。2004;271:488–497.[公共医学][谷歌学者]

54Peters J、Wroe SF、Wells CA、Miller HJ、Bodle D等。小鼠2号染色体远端印迹区Gnas基因座的反向印迹转录物簇。美国国家科学院院刊。1999;96:3830–3835. [PMC免费文章][公共医学][谷歌学者]

55Coombes C、Arnaud P、Gordon E、Dean W、Coar EA等。小鼠Gnas印迹位点Nesp-Gnasxl域印迹标记的表观遗传特性和鉴定。分子细胞生物学。2003;23:5475–5488. [PMC免费文章][公共医学][谷歌学者]

56Lee YJ、Park CW、Hahn Y、Park J、Lee J等，Mit1/Lb9和Copg2，与Peg1/Mest密切相关的小鼠印迹基因的新成员（1）。FEBS信函。2000;472:230–234.[公共医学][谷歌学者]

57Kim J、Noskov VN、Lu X、Bergmann A、Ren X等。通过对小鼠第7号染色体和人类第19q13.4号染色体印迹区域的比较分析，发现了一种新的父代表达泛素特异性加工蛋白酶基因。基因组研究。2000;10：1138–1147。 [PMC免费文章][公共医学][谷歌学者]

58Kim J、Bergmann A、Wehri E、Lu X、Stubbs L.位于PEG3/USP29印迹域中的两个Kruppel型锌指基因ZIM3和ZNF264的印迹和进化。基因组学。2001;77:91–98.[公共医学][谷歌学者]

59Chamberlain SJ，Brannan CI。Prader-Willi综合征印迹中心激活父系表达的小鼠Ube3a反义转录物，但抑制父系Ube3a。基因组学。2001;73:316–322.[公共医学][谷歌学者]

60Paulsen M、Davies KR、Bowden LM、Villar AJ、Franck O等。小鼠第7染色体末端印迹簇和第11p15.5号染色体中Beckwith-Weedemann综合征区域的同步组织。人类分子遗传学。1998;7:1149–1159.[公共医学][谷歌学者]

61Gould TD，Pfeifer K.小鼠Kvlqt1的印记受发育调控。人类分子遗传学。1998;7：483–487。[公共医学][谷歌学者]

62Fitzpatrick GV，Soloway PD，Higgins MJ。靶向缺失KvDMR1的小鼠印迹区域缺失和生长缺陷。自然遗传学。2002;32:426–431.[公共医学][谷歌学者]

63Barlow DP、Stoger R、Herrmann BG、Saito K、Schweifer N。小鼠胰岛素样生长因子2型受体被印记并与Tme基因座紧密相连。自然。1991;349：84–87。[公共医学][谷歌学者]

64胡金凤，巴拉古鲁·KA，伊瓦图里·RD，Oruganti H，Li T，等。中枢神经系统中小鼠胰岛素样生长因子Ⅱ受体正、反义RNA缺乏相互的基因组印迹。生物化学与生物物理研究委员会。1999;257:604–608.[公共医学][谷歌学者]

65Kay GF、Barton SC、Surani MA、Rastan S.印迹和X染色体计数机制决定了Xist在小鼠早期发育中的表达。单元格。1994;77:639–650.[公共医学][谷歌学者]

66Sado T，Wang Z，Sasaki H，Li E.Tsix对小鼠X染色体印迹失活的调节。发展。2001;128:1275–1286.[公共医学][谷歌学者]

67Jong MT、Carey AH、Caldwell KA、Lau MH、Handel MA等。与Prader-Willi综合征遗传区域同源的小鼠染色体区域中RING锌指编码基因的印记。人类分子遗传学。1999;8:795–803.[公共医学][谷歌学者]

68Moore T、Constancia M、Zubair M、Bailleul B、Feil R等。小鼠Igf2上游假定印迹控制区的多重印迹正反义转录物、差异甲基化和串联重复。美国国家科学院院刊。1997;94：12509–12514。 [PMC免费文章][公共医学][谷歌学者]

69Sleutels F、Tjon G、Ludwig T、Barlow DP。Slc22a2和Slc22a3的印记沉默不需要Igf2r和Air之间的转录重叠。Embo J。2003;22:3696–3704. [PMC免费文章][公共医学][谷歌学者]

70Sleutels F、Zwart R、Barlow DP。非编码的Air RNA是沉默常染色体印迹基因所必需的。自然。2002;415:810–813.[公共医学][谷歌学者]

71Nagalakshmi U，Wang Z，Waern K，Shou C，Raha D等。RNA测序确定的酵母基因组转录图谱。科学。2008;320:1344–1349. [PMC免费文章][公共医学][谷歌学者]

72Nikaido I、Saito C、Mizuno Y、Meguro M、Bono H等。使用大规模表达谱在小鼠转录组中发现印记转录本。基因组研究。2003;13:1402–1409. [PMC免费文章][公共医学][谷歌学者]

73Lehmann EL，Romano JP，纽约：施普林格出版社；2005.检验统计假设。第十四页，784。[谷歌学者]

74威尔逊EB。概率推理、连续法则和统计推理。美国统计协会杂志。1927;22:209–212. [谷歌学者]

文章来自PLOS ONE系列由以下人员提供多环芳烃

新生小鼠脑内新印迹基因的转录组全鉴定

徐旺

戚孙

肖恩·麦格拉思

伊莱恩·马尔迪斯

保罗·索洛韦

安德鲁·克拉克

关联数据

摘要

介绍

结果

Illumina测序结果和SNP覆盖率

检测基因组印迹

表1

识别出已知和新的印记基因

本研究中已知印迹基因的覆盖率

紧密相连的印记基因对

成绩单范围内的印记状态模式

印迹基因的父脑和母体胎盘偏倚

讨论

通过直接计数SNP，以准确比率量化等位基因特异性表达

组织和发育阶段特异性基因组印迹详尽剖析的途径

嵌套和紧密连锁基因的印记

基因组中有多少印记基因？

材料和方法

小鼠应变

转录组的Illumina测序

-简介

-修改后的SMART

-循环优化PCR和生产PCR

-粒度分级

-适配器去除和cDNA纯化

-雾化/Covaris剪切和Illumina/Selexa文库准备

Illumina序列数据分析

相对亲本表达的估计

检测基因组印迹和统计分析

Sanger和Pyrosequencing验证

支持信息

图S1

表S1

参考S1

致谢

脚注

工具书类