跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
数据库(牛津)。2011; 2011年:bar040。
2011年9月14日在线发布。 doi(操作界面):10.1093/数据库/bar040
预防性维修识别码:项目经理3173022
PMID:21917859

GETPrime:用于定量实时PCR的基因或转录特异性引物数据库

摘要

人类和其他生物体中的绝大多数基因都经历了选择性剪接,但剪接变异体的生物学功能在很大程度上仍缺乏了解,因为缺乏简单的工具来绘制这些变异体高灵敏度的表达谱和模式。高通量实时定量聚合酶链反应(qPCR)是准确定量核酸序列(包括剪接变体)的理想技术。然而,目前可用的引物设计程序并没有区分剪接变体,而且在整体质量、功能或吞吐量模式上也存在显著差异。在这里,我们介绍了GETPrime,这是一个由一个新平台支持的引物数据库,该平台独特地组合并自动化了对优化qPCR引物设计至关重要的几个特征。这些包括考虑所有基因剪接变体,以实现基因特异性(涵盖大多数剪接变体)或转录特异性(覆盖一个剪接变体的)表达谱分析、引物特异性验证、,根据严格的标准自动选择最佳引物对,并在其基因组背景下对后一种引物对进行图形可视化。GETPrime引物已经过广泛的实验验证,在复杂样本中显示出高转录特异性。因此,自由访问、用户友好的GETPrime数据库允许快速检索和可视化最常见模式生物的基因或基因组的引物,可在http://updepla1srv1.epfl.ch/getprime/.

数据库URL: 网址:http://deplanckelab.epfl.ch.

背景

大规模基因组方法在人类和其他模式生物中证明了广泛的选择性剪接(1,2),当前的基因模型不断更新,以包括额外的剪接事件(). 然而,替代剪接的调控机制,以及单个基因剪接变异体的生物学意义和功能,仍知之甚少(4). 这在很大程度上是因为缺乏简单的工具来分析和量化具有高灵敏度的单个剪接变异体。高通量实时定量聚合酶链反应(qPCR)是准确定量核酸序列(包括剪接变体)的理想技术。此外,它补充了通过微阵列或深度测序进行的基因表达分析,因为后者的分析方法在总成本和所需的计算专业知识方面仍不如定量检测基因转录物的qPCR有效,尤其是那些低表达的基因,如许多转录因子(TF)基因(5,6). 因此,选择合适的引物对获得最佳qPCR结果至关重要。一个理想的qPCR引物设计程序应该至少包括以下特征:首先,鉴于上述对理解单个基因剪接变异体的作用越来越感兴趣(1,7,8)程序需要考虑每个基因的所有带注释的剪接变体,以便能够进行基因(涵盖大多数剪接变体)或转录特异性(涵盖一个剪接变异体)表达谱分析;其次,至少有一个引物需要跨越外显子,以避免扩增污染基因组DNA;第三,需要通过相似性搜索自动评估每个引物的特异性;第四,检索最佳引物组合不需要繁琐的后处理,第五,引物对在其基因组上下文中的位置应该可视化,以便最终用户进行简单的最终评估。

在为大规模TF基因表达谱实验寻找qPCR引物设计软件时,我们考虑了几个软件包,但没有一个满足规定的要求,因为这些程序在质量、功能或吞吐量模式上都有所不同(表1). 基于Primer3的最流行界面(9),名为Primer3Plus(10),允许用户定义设计寡核苷酸引物的各种可能参数和选项。然而,该程序的使用非常耗时,因为用户必须手动处理大量建议的引物,例如,当通过BLAST验证引物特异性时(11). 另一个程序RASE(12)生成用于检测和定量特定剪接亚型的qPCR引物,但无法设计基因特异性引物。此外,其关联的web界面仅支持低吞吐量实验。其他程序,如PerlPrimer(13),数量素数(14)和BatchPrimer3(15)允许批量引物输入,以及qPCR引物的一些数据库,包括定量PCR引物数据库(16)、RTPrimerDB(17),PrimerBank(18)和qPrimerDepot(19)开发用于高通量引物设计或检索。但是,这些软件包中没有一个能够组合和自动化所有重要功能,以满足高通量qPCR实验中qPCR引物设计日益增长的需求,特别是无需后处理以基因或转录特异方式靶向基因的需求(表1).

表1。

先前建立的qPCR引物设计程序与GETPrime的比较

qPCR引物设计成绩单/序列特定基因特异性(覆盖大多数转录本,如果可能的话,覆盖所有转录本)跨越外显子以避免污染DNA的扩增引物特异性的自动验证无需后期处理以选择最佳引物基因组内位置的图形视图实验性引物验证高通量实验接口快速处理
Primer3Plus系列(10)x个x个x个x个x个x个x个
自动启动(36)x个x个x个x个x个
PerlPrimer公司(13)x个x个x个x个x个
Primer Express公司x个x个x个x个x个x个
批次底漆3(15)x个x个x个x个x个
RASE公司(12)x个x个x个x个√+/−
Primique公司(37)x个√+/−x个x个√+/−√+/−
数量优先级(14)√+/−x个√+/−
数据库[RTPrimerDB(17),PrimerBank(27)、qPrimerDepot(19)]x个√+/−x个x个√+
GETPrimedb公司√+

为了填补这一空白,我们开发了自己的qPCR引物设计软件GETPrime。该程序旨在生成针对最新Ensembl版本中可用的每个基因的引物,作为参考资源(20). 然而,为了实现快速引物检索,我们将我们的程序与GETPrimedb链接,GETPrimerdb是一个数据库,可以通过用户友好的基因或转录特异性引物界面进行快速检索智人,小家鼠,秀丽隐杆线虫,黑腹果蝇达尼奥雷里奥在Ensembl数据库中注释的组装染色体中的基因。

数据库建设与开发

底漆生成

GETPrime结合了几个现有工具:PerlPrimer程序(13),爆炸(11)通过自定义perl包装器和Ensembl数据库,实现工作流和决策过程的自动化,以选择最佳引物对(参见工作流,图1).

保存图片、插图等的外部文件。对象名称为bar040f1.jpg

总体底漆设计管道。描述了整个工作流程。绿色方框的解释见图2。粉色和紫色方框的详细说明见图3和4,4分别为。有关更多详细信息,请参阅正文。

GETPrime管道的第一步是从Ensembl数据库中为每个感兴趣的靶基因选择转录本作为输入。为了全面起见,我们将所有具有“已知”或“新”状态的基因纳入GETPrime数据库中的Biomart门户网站(21). 然后根据两个独立的标准选择每个基因特定的转录本:(i)其状态必须标注为“已知”,因为我们选择不将“新”转录本包括在我们的数据库中,因为这些转录本尚未通过物种特定的测序数据验证(来自合集项目的Bert Overduin,个人通信)和(ii)最高连接分数(图2). 在第一轮中,该分数允许选择包含备选剪接变异体中保守外显子连接的转录本。如果多份成绩单获得相同的最高分数,则选择序列最短的成绩单。接下来,这第一个选定的转录本将作为输入提供给我们修改后的PerlPrimer程序。该程序支持外显子连接处一种特定转录物的引物设计,以避免由于DNA污染而导致的非特异性扩增。PerlPrimer使用图形用户界面运行Spidey(22)检测内含子/外显子边界,并搜索输入转录本上所有可能的引物对。为了能够为大量基因生成引物,我们修改了PerlPrimer以使用Ensembl提供的外显子连接坐标。此外,与PerlPrimer经常生成数十个候选引物对而没有质量分数的情况相比,GETPrime运行了一个广泛的工作流,根据严格的参数选择三个最佳的引物对候选(表2)以及允许引物对排序的明确标准(图1和3).

保存图片、插图等的外部文件。对象名称为bar040f2.jpg

基因或转录特异性引物设计的连接得分算法概念的可视化。图中描绘了一个带有三个替代转录本的基因的示意图。蓝色方框代表外显子,线条代表内含子。每个转录本包含外显子a–D和a′的子集。交叉点得分(N个)构成包含相应剪接连接的转录本数量。为了设计基因特异性引物,连接得分的总和,表示为S公司,为每个成绩单和最高成绩单计算S公司-值,该值包含最高N个-选择了分数(此处1). 然后,优先设计基因特异性引物,使其中一个引物跨越最高的外显子连接N个-所选成绩单中的分数(1),如深蓝色箭头所示。

保存图片、插图等的外部文件。对象名称为bar040f3.jpg

选择最佳底漆对的工作流。根据这些层次标准,自动选择最佳引物对。首先,按照图和正文中的描述,对每个引物对进行喷砂处理并可能丢弃。然后,对于剩余的引物对,如果至少有一个引物跨越5′-或3′-UTR,则丢弃对。经过这两个严格的筛选步骤后,剩下的引物根据(i)最高的转录覆盖率,(ii)引物是否位于同一外显子(不理想)内(理想),以及(iii)对于qPCR效率和实验变异更为理想的最小扩增子大小进行排序(35).

表2。

默认和宽松底漆设计参数的比较

qPCR引物质量标准默认参数松弛参数
底漆长度19–25个基点19–25个基点
振幅长度80–200个基点60–300个基点
熔化温度()57–60摄氏度57–60摄氏度
Δ = 1摄氏度Δ = 2摄氏度
不包括%GC仅考虑40-60%仅考虑40-60%
GC夹具每个底漆的三个3′-碱基中的两个必须是G或C每个底漆的三个3′-碱基中的两个必须是G或C
外显子/外显子连接引物5′端至少7 bp,3′端至少3 bp5′端至少7 bp,3′端至少3 bp

熔化温度()在PerlPrimer程序中计算(13)它使用了J.SantaLucia广泛的近邻热力学参数(38,39)和默认盐条件(1.5 mM Mg2+、200 mM寡聚物、0.2 mM dNTP和50 mM单价阳离子)。粗体文本突出显示了默认底漆设计参数和宽松底漆设计参数之间的差异。G=鸟嘌呤;C=胞嘧啶。

第一个重要标准(图3)是指引物特异性,使用BLASTN对所有预测转录物的整个基因组DNA和cDNA进行评估。为了确保BLAST中的引物特异性,我们取消了默认过滤器,因为这允许检测虚假比对,甚至在生物相关基因组区域之外。这也是我们实施低严格性的原因E类-值100,确保检测到与引物序列的所有可能对齐。如果两个引物都与至少60%的序列一致性相匹配,一个DNA或cDNA区域跨越最多5000 bp,并且该区域与目标转录物本身的位置不对应,则会丢弃该引物对,因为它可能错误地指向另一个基因或假基因。与刚刚丢弃的引物相似的引物对(两个引物至少50%重叠),通常移位1到2个碱基,也会被丢弃,以避免运行过多的BLAST搜索。BLAST标准对于专门监测来自同一家族的蛋白编码基因的表达尤其重要,例如同源域TF。第二个标准是丢弃跨越5′-或3′-非翻译区(UTR)的引物对。基于靶向这些区域的引物的转录定量可能是有偏差的,因为3′-UTR包含多个聚腺苷酸化区域,并且如果用寡聚(dT)引物合成cDNA,则5′-UTR经常缺失或截短。其他排名标准是涵盖的基因特异性转录本的数量(如N个如所示图2)扩增子的大小以及引物对是否位于同一外显子内。

如果在排序管道的末尾,没有任何引物对通过选择,则放宽某些参数,直到获得满意的引物对。参数松弛在修改的PerlPrimer脚本和最佳引物对选择工作流程中执行(图4). 在修改后的PerlPrimer脚本中,放松的第一个参数是放大子长度和熔化温度差(表2)其次是外显子/外显子连接标准(允许5′端<7bp和/或3′端<3bp)以及跨越不同外显子的要求。在最佳引物对选择工作流程中,可以放宽的参数是引物特异性的范围和引物在UTR区域的位置,有时这是唯一能够区分两个或多个转录物的位点。在这些宽松条件下生成的引物会被标记,并告知用户哪些参数被更改以获得引物。即使在参数松弛后,也无法找到引物的基因被标记为“无引物”。

保存图片、插图等的外部文件。对象名称为bar040f4.jpg

通过放宽引物设计参数来找到至少一对合适的引物的工作流程。圆圈示意了修改后的PerlPrimer脚本的运行以及图1。圆圈的中心和右侧分别描述了修改后的PerlPrimer脚本中参数的松弛以及在选择最佳引物对时允许的选项。蓝色和绿色圆圈分别表示默认参数和放松的设计参数(表2). 箭头表示逻辑流程。如果任何一组参数都没有找到引物,程序将报告“无引物”。

三对顶级引物与引物对覆盖的转录本列表、正向和反向引物序列、引物熔化温度、起始和终止引物位置、基因的集合状态(“已知”或“新”)一起保存在输出文件中,指示是否放松参数以获得引物对,以及到图形视图的链接。最后,重新分析排名靠前的引物对未涵盖的潜在转录物,以设计涵盖其余组转录物的额外引物对。重复这个过程,直到所有预测的转录本被至少一对引物覆盖。这个针对选定基因组的所有带注释基因的计算练习的结果存储在通用特征格式(GFF)文件中,并保存在MySQL数据库中。

此外,我们的流水线已经通过更改工作流来选择最佳引物对,从而扩展用于转录特定的表达谱分析。不是根据最高转录覆盖率对引物对进行排序,而是根据最小转录覆盖率进行排序。Ensembl第61版中每个模型生物体的最佳排序基因或转录特异性引物对所涵盖的平均基因数列于表3例如,98%的已知小鼠集合基因由基因和转录特异性引物对覆盖。其中,50%没有相关警告,2%是通过放宽引物参数[扩增子长度和熔化温度偏差]获得的(表2)]没有任何其他类型的警告。总计算时间取决于每个模型生物体处理和变化的基因数量,需要两天左右(D.黑腹果蝇)和两周(智人)在我们的服务器上[Linux系统(内核2.6.18),48 x Intel Xeon 2.67 GHz四CPU,74GB RAM内存]。

表3。

每个物种的最佳引物对覆盖的基因的平均数量

物种已知蛋白质编码基因的数量(Ensembl v61)由一对引物覆盖的基因,n个(%)没有警告的底漆对底漆对设计放松,没有其他警告无其他警告的UTR引物对具有跨越标准的引物对放松了,没有其他警告两个引物在不同外显子上的引物对没有其他警告引物对非特异性,无其他警告带有其他警告的底漆对
智人34 96034 093 (97.5)14 5216439672695899731193151
小家鼠29 44528 840 (97.9)14 4256009671832605222072757
秀丽隐杆线虫38 23721 964 (57.4)17 5104031611528833736793
黑腹果蝇14 86914 368 (96.6)8493301427124123593761171
达尼奥雷里奥24 37024 203 (99.3)18 09148749989912612174792

我们计算了基因或转录特异性引物对的平均数量及其主要严格性。

数据库访问

Google Web Toolkit用于生成Web界面并在浏览器中直接显示MySQL查询结果。检索引物对的界面接受基因符号,也被BioMart门户定义为“相关基因名称”(21)和集合基因或转录ID。可以选择找到覆盖一个基因大多数转录本的引物(用最少数量的特异引物实现最大覆盖),或者如果可能的话,为每个单个转录本提供特定的单个引物对,以详细量化剪接变异体。该接口包含不同的过滤可能性,以获得所需的引物输出。例如,可以只选择没有警告的引物,或者决定包括带有个人用户可以接受的特定警告的引文(例如“inUTR”)。界面中添加了一个典型的查询示例,该示例在每个处理步骤中都具有视觉提示,以帮助用户。GETPrime界面的最终输出是一个Excel文件,其中包含引物序列和参数属性,以及基于JBrowse的指向用户内部浏览器的超链接(23),显示了备选转录本和引物位置(图5). 当前的GETPrime数据库基于Ensembl 61版。基于Ensembl 50版的GETPrime早期版本仍然可以通过相同的web界面访问。这两个版本之间的唯一区别是,在当前版本中,包含了新基因,并且每个引物对的超链接都由不同的浏览器类型支持。

保存图片、插图等的外部文件。对象名称为bar040f5.jpg

基于JBrowse的GETPrime引物对图形视图9卢比小鼠基因。左边的蓝色方框是可以在JBrowse基因组视图中拖动的可用轨迹(23). 在本例中,已将转录本、基因特异性引物(如果可能,覆盖大多数剪接变体)和转录特异性引子(如果可能的话,覆盖单个剪接变异体)拖到浏览器中。图的上部显示了缩放、向上或向下移动基因组位置以及输入另一条染色体、染色体上的另一个位置或集合ID的工具。每个引物都由其集合ID、其在GETPrime中的迭代(例如−1)、其排名(例如_3)进行注释及其引物类型(正向引物和反向引物分别缩写为Fwd和Rv)。每个引物的蓝色框表示与转录本的对应,有时两个蓝色框之间的细线用于桥接跨越两个外显子的引物的内含子区域。基因特异性轨道中的引物对覆盖两个转录本。转录物特异性轨道中第一次迭代(“−1”)和第二次迭代(”−2“)的引物对特定于最大的转录物Rbbp9-001和最短的成绩单Rbbp9-002分别是。

数据库验证和应用

实验验证了GETPrime产生的引物的敏感性和特异性。首先,作为对照实验,我们选择了三个常用的引物对,因此,这些引物对已经发表,每个引物对针对以下控制基因之一:Hprt1(小时),免疫球蛋白4,管2c(请参见补充表S1用于序列)。只选择了与GETPrime生成的转录本完全相同的引物对。与成熟的引物对类似,所有三对GETPrime引物对都具有高质量,根据熔化曲线和凝胶分离分析显示出高特异性,并且对qPCR小鼠参考总RNA合成的cDNA具有良好的扩增效率(平均效率为103%R(右)2-值0.997,参见“材料和方法”一节)。此外,每对引物在前脂肪细胞3T3-L1细胞分化前和分化后诱导(“材料和方法”部分,D0、D2和D4)中产生的PCR产物数量是可比较的(ΔC类 < 1).

接下来,我们通过靶向同一小鼠参考总RNA合成的cDNA样品中的60个TF来评估GETPrime引物的质量(“材料和方法”部分)。我们选择TF是因为它们的表达水平通常低于非TF编码基因,因此通常更难检测(24,25)因此,与针对多个基因编码一组不同的蛋白质相比,这种验证分析更加严格。总共,在60对被测引物中,有45对引物具有较高的扩增效率(平均效率为98.94%R(右)2-值为0.994),并根据其相应的解离曲线确定其高度特异性。在剩下的15对引物中,发现其中一对形成了引物二聚体,这表明no模板和no逆转录酶阴性对照中存在明显的熔化曲线峰,和14只产生了一个低信号,可能是因为相应的靶基因在参考RNA和3T3-L1 RNA样品中的含量都很低(26)(“材料和方法”部分)。然而,我们能够为14对引物中的5对生成标准曲线,因为在我们的实验室中可以获得相应的TF开放阅读框(ORF)克隆。这些引物对的平均扩增效率为98.4%R(右)2-值为0.995。因此,我们能够测试的51对引物中,有50对符合qPCR可靠性标准,这表明GETPrime数据库中的绝大多数引物都是高质量的。

为了进一步评估引物特异性,我们设计了一个严格的GETPrime引物检测方法,该引物针对产生同源蛋白的TF ORF克隆库中的一个TF ORFs,这里是同源域或ZF-C2H2 TF(“材料和方法”部分和补充表S2). 对于每个选定的TF靶点,我们获得了清晰的qPCR扩增信号,与使用相同的TF ORF库作为qPCR模板,但不包含各自的靶点TF ORF时相比(补充图S1),表明各自的引物对具有高度的靶向特异性。最后,为了评估GETPrime区分基因特异性转录物的能力,我们使用3T3-L1细胞分化前和分化后诱导,并选择了一个相对直接的剪接场景,其中包含一个基因,Ubtf公司根据Ensembl第50版,它有两种不同的转录形式Ubtf_a型优步(_b),分别代表五种和两种不同的拼接形式(图6A) ●●●●。GETPrime引物能够在两个选定的分化时间点区分两种Ubtf剪接形式,并以定量方式进行区分,因为单个转录物总量与总基因表达量相匹配(图6B) ●●●●。

保存图片、插图等的外部文件。对象名称为bar040f6.jpg

要验证的图形视图和qPCR结果Ubtf公司-靶向引物覆盖Ubtf转录物的全部或子集。(A类)蓝色的“Ubtf”引物对覆盖所有七个转录物(基因特异性引物),红色的“Ubtf_a”和“Ubtf_b”引物对分别覆盖五个和两个转录物(转录物特异性引物)。在本例中,GETPrime无法找到区分每个转录本的引物。(B)分化前(D0)和分化后4天(D4)的相对基因表达水平标准化为Hprt1(小时)管2c表达式级别。'Ubtf’代表涵盖所有七个转录物的引物对,而‘Ubtf_a’和‘Ubtf _b’分别是特定于五个和两个转录物子集的引物。’Ubtf_a+Ubtf_b'代表“Ubtf_a”和“Ubtf _b”的相对基因表达之和。数据表明,GETPrime能够有效区分不同的转录物,因为单个转录物数量的总和与总基因表达量相匹配。

讨论

实验结果证明了GETPrime产生基因或转录特异性qPCR引物的能力。结果还表明,所生成的引物质量较高,并且这些引物能够检测到低丰度转录物,例如TF编码的转录物。此外,它们还证明了其在编码高度同源蛋白质的模板池中特异识别目标的能力,以及高扩增效率。因此,据我们所知,没有其他软件和网络工具提供与GETPrime平台相同的属性集(表1)我们认为,GETPrime是qPCR引物设计领域的一个重要进展。另一个最近开发的qPCR引物设计软件QuantPrime(14)还具有基因特异性引物设计(即覆盖大多数剪接变体)作为选项。然而,该软件并没有提供直接的方法来确定哪些转录本被基因特异性引物覆盖。因此,用户有义务对Ensembl数据库中的每一个引物进行筛选,以找到这些信息,这非常耗时,尤其是在需要针对大量基因的情况下。此外,通常不可能产生涵盖所有基因转录本的引物。对于这些基因,需要使用多个引物对来产生基因特异性读数。与QuantTime相比,GETPrime数据库以易于检索和图形化的方式提供了所有这些信息。因此,虽然很明显QuantPrime是一个功能强大的引物设计程序,但由于它对于大规模qPCR引物设计具有很大的参数灵活性和用户友好的界面,它似乎没有使用先验的产生基因或转录特异性引物的目的。此外,我们发现QuantPrime处理时间随着基因长度和数量的增加而显著增加。GETPrime没有这个缺点,因为它的数据库接口允许直接检索引物。这与其他Primer数据库类似,如qPrimerDepot(19),PrimerBank(27)和RTPrimerDB(17),它还提供预先计算的qPCR引物。然而,这些数据库的局限性在于,它们不能批量检索引物,并且每个基因都会列出多个引物对。然后由个人用户来评估每个引物对的实验适用性,这与GETPrime不同,GETPrime根据定义明确的标准对所有引物进行排序,是很麻烦的。GETPrize的一个重要缺点是,到目前为止,它仅适用于包括人类在内的五种常用模型生物。然而,最终用户可以通过调整GETPrime Perl脚本来满足或甚至可以执行为其他感兴趣的生物体设计引物的需求,GETPrime Perl脚本可应要求提供。因此,GETPrime数据库目前包括以下引物智人,小M,秀丽线虫,D.黑腹果蝇斑马鱼Ensembl数据库第50版和第61版中注释的组装染色体中的基因。因此,我们计划在主要的新Ensembl发布后立即更新GETPrime。

材料和方法

细胞培养

3T3-L1小鼠成纤维细胞(28)在补充有10%胎牛血清的DMEM中培养-谷氨酰胺2mM和青霉素/链霉素(1×)在5%CO中2在37°C下增湿大气,并在通过前保持小于80%的汇流。通过将两天的汇合后细胞[指定为第0天(D0)]暴露于含有10%FCS(瑞士奥尔施维尔的Bioconcept)的DMEM,补充1µM地塞米松、0.5 mM 3-异丁基-1-甲基黄嘌呤和1µg/ml胰岛素(美国圣路易斯的Sigma),诱导3T3-L1细胞分化。在D2时,用含有FCS和1µg/ml胰岛素的DMEM喂养细胞,两天后(D4),将培养基改为10%FBS/DMEM。完全分化通常在第6-8天实现。D0、D2和D4样品已用于RNA提取、cDNA制备和qPCR。

RNA提取和cDNA合成

我们使用了两个不同的实验样品。首先,为了分析引物的质量,我们使用安捷伦的qPCR小鼠参考总RNA(安捷伦科技,美国圣克拉拉)。对于其他报告的实验,我们使用了根据制造商的说明,使用RNeasy Plus Mini Kit(Qiagen)从3T3-L1细胞中分离的总细胞RNA,而不使用DNAse处理。提取后,使用纳米滴分光光度计1000 v3.2.0(美国底特律纳米滴技术公司)对RNA进行定量。使用纳米滴(1.8≤A260/A280≤2.2)和目视检查琼脂糖凝胶上分离的条带,进一步确定RNA质量。根据供应商的建议,使用1μg RNA进行逆转录,逆转录采用随机引物(Invitrogen)和Superscript III First Strand synthesis Supermix(Invit罗gen,Carlsbad,USA),总体积为20µl。cDNA样品储存在−20°C。

定量PCR

采用标准程序,使用Power SYBR Green Master Mix(美国福斯特市应用生物系统公司),在ABI-7900HT实时PCR系统(美国福斯特城应用生物系统)上对96孔板(手动)和384孔板(机器人)进行qPCR,并进行三次技术复制。简单地说,使用了Applied Biosystem的标准方案(50°C持续2分钟,95°C持续10分钟;然后进行40次95°C循环15 s,60°C循环1 min),并通过解离步骤最终确定(95°C持续15 s、60°C持续15s,以及2%至95°C的爬坡率)。DNA、引物和Power SYBR Green Master Mix的数量在补充表S1.

使用qPCR仪器软件计算qPCR扩增效率,并基于五个连续稀释样品(四倍稀释系列)的线性回归。标准曲线的斜率通过以下公式给出了放大效率E类 = 10(−1/坡度)如果放大效率为100%(百分比表示为:E类 − 1) ,则PCR产物的量应每周期增加一倍,从而E类-值为2。如果引物的效率值介于92%和108%之间,且具有相关系数,则认为引物是可靠的,R(右)2(即标准曲线回归线与数据的拟合程度),>0.99。如果qPCR熔融曲线分析产生一个尖锐的分离峰,则引物在靶向感兴趣的基因或转录物方面具有特异性。在极少数情况下,特定的扩增反应显示出所谓的“肩峰”(29)它发生在含有多个熔化域的扩增子中,具有不同的鸟嘌呤胞苷(GC)含量。当在熔融曲线中发现其他峰(非靶向或引物-二聚体)或肩峰时,也可以通过凝胶分离来评估qPCR产物的特异性。所提供的qPCR分析还包括无模板(检测引物二聚体形成)和无逆转录酶(排除DNA扩增)阴性对照。

在标准曲线分析中,具有C类-至少三个>33的稀释系列中的值被认为是低表达的,并且被排除在计算平均扩增效率的分析之外。当一个ORF克隆可用于其中一个基因时,对感兴趣的克隆的四倍稀释系列(起始量~1 pg)的五份等分样品进行引物质量评估。

使用ΔΔ定量3T3-L1的表达C类-方法和数据标准化为Hprt1(小时)管2c表达式。在一组六个测试的候选参考基因中,这两个基因的表达在3T3-L1细胞分化过程中保持最稳定(行动,Hprt1(小时),免疫球蛋白4,克纳布1,Tubb2c、GusB)如geNorm软件中的归一化所示(30).

在我们的实验中,根据Ensembl 50版从GETPrime数据库中检索引物,如果可用,使用最严格的参数,或使用稍微宽松的设计方法“DesignRelaxed”(图4和中的序列补充表S1). 使用Applied Biosystems的SDS 2.4软件直接对标准曲线、解离曲线和结果进行分析。为了允许qPCR数据交换,RDML文件(31)是使用qbase生成的加号软件[http://www.biogazelle.com, (32)]和在补充数据.

家族内引物特异性的检测

为了验证引物特异性,我们首先生成了两个包含80个和55个ORF克隆的文库,分别编码同源域和ZF-C2H2蛋白家族的TF(补充表S2). 根据参考文献(33)和(34)从而使底漆的选择尽可能困难。接下来,我们评估了是否可以分别针对七个(Dlx4、Hoxd10、Hoxc10、Pitx2、Barx1、Irx6、Hoxb6)和六个随机选择的TF ORF(Egr2、Zfp148、Zfp354c、Zfp451、Zfp688、Zscan20)在后一个库中使用GETPrime引物。为此,我们生成了带有或不带有所选目标TF ORF的库。

补充数据

补充数据可在数据库在线。

基金

瑞士国家科学基金会;SystemsX.ch;NCCR计划遗传学前沿;第七研究框架计划玛丽·居里国际重返社会补助金(至B.D.);洛桑理工学院(EPFL)的机构支持。开放获取费用的资金来源:洛桑理工学院(EPFL)。

利益冲突。未声明。

致谢

C.G.设计并编程GETPrime,进行初级测试并起草手稿。A.G.与A.M.K.H.一起设计并编程GETPrime,监督底漆测试并修改界面。F.D.加载GETPrime引物,在浏览器中设计它们的比对。F.De.测试了GETPrime并设计了图形用户界面。J.R.负责监督该项目,并协助GETPrime的规划。B.D.监督GETPrime的设计和编程,测试程序,修改界面并起草手稿。所有作者都修改并批准了最终稿。

工具书类

1Sultan M、Schulz MH、Richard H等。通过人类转录组的深度测序对基因活性和选择性剪接的全球观点。科学。2008;321:956–960.[公共医学][谷歌学者]
2Johnson JM,Castle J,Garrett Engele P等。用外显子连接微阵列对人类选择性前信使核糖核酸剪接的全基因组调查。科学。2003;302:2141–2144.[公共医学][谷歌学者]
三。Wang ET,Sandberg R,Luo S,等。人类组织转录体中的替代亚型调控。自然。2008;456:470–476. [PMC免费文章][公共医学][谷歌学者]
4Chen M,Manley JL。选择性剪接调控机制:来自分子和基因组学方法的见解。自然修订版分子细胞生物学。2009;10:741–754. [PMC免费文章][公共医学][谷歌学者]
5Bookout AL,Jeong Y,Downes M,et AL.核受体表达的解剖学特征揭示了分级转录网络。单元格。2006;126:789–799. [PMC免费文章][公共医学][谷歌学者]
6德普兰克B、杜普伊D、维达尔M、瓦尔胡特AJ。网关兼容酵母单杂交系统。基因组研究。2004;14:2093–2101. [PMC免费文章][公共医学][谷歌学者]
7Reece-Hoyes JS、Deplancke B、Shingles J等。秀丽隐杆线虫调节转录因子简编:转录调控网络绘图资源。基因组生物学。2005;6:R110。 [PMC免费文章][公共医学][谷歌学者]
8Taneri B、Snyder B、Novoradovsky A等。小鼠TF的选择性剪接影响其DNA结合域结构,并具有组织特异性。基因组生物学。2004;5:R75。 [PMC免费文章][公共医学][谷歌学者]
9Rozen S,Skaletsky H.Primer3,面向普通用户和生物学家程序员。方法分子生物学。2000;132:365–386.[公共医学][谷歌学者]
10Untergasser A、Nijveen H、Rao X等人。Primer3Plus,Primer3的增强web界面。核酸研究。2007;35:W71–W74。 [PMC免费文章][公共医学][谷歌学者]
11Altschul S、Gish W、Miller W等。基本局部对齐搜索工具。分子生物学杂志。1990;215:403–410.[公共医学][谷歌学者]
12Brosseau JP、Lucier JF、Lapointe E等。剪接亚型的高通量量化。RNA。2010;16:442–449. [PMC免费文章][公共医学][谷歌学者]
13.马歇尔·OJ。PerlPrimer:用于标准、亚硫酸氢盐和实时PCR的跨平台、图形化引物设计。生物信息学。2004;20:2471–2472.[公共医学][谷歌学者]
14Arvidsson S、Kwasniewski M、Riano-Pathon D等。QuantPrime——一种用于定量PCR的可靠高通量引物设计的灵活工具。BMC生物信息学。2008;9:465. [PMC免费文章][公共医学][谷歌学者]
15You FM,Huo N,Gu YQ,等。BatchPrimer3:用于PCR和测序引物设计的高通量web应用程序。BMC生物信息学。2008;9:253. [PMC免费文章][公共医学][谷歌学者]
16国家癌症研究所。定量PCR引物数据库. http://lpgws.nci.nih.gov/cgi-bin/PrimerViewer网站(2011年9月6日,上次访问日期)
17Pattyn F、Robbrecht P、De Paepe A等。RTPrimerDB:实时PCR引物和探针数据库,2006年主要更新。核酸研究。2006;34:D684–D688。 [PMC免费文章][公共医学][谷歌学者]
18Wang X,Seed B.用于定量基因表达分析的PCR引物库。核酸研究。2003;31:e154。 [PMC免费文章][公共医学][谷歌学者]
19Cui W,Taub DD,Gardner K.qPrimerDepot:定量实时PCR引物数据库。核酸研究。2007;35:D805–D809。 [PMC免费文章][公共医学][谷歌学者]
20Curwen V、Eyras E、Andrews TD等,《集成自动基因注释系统》。基因组研究。2004;14:942–950. [PMC免费文章][公共医学][谷歌学者]
21Haider S、Ballester B、Smedley D等。生物商业中心门户——统一访问生物数据。核酸研究。2009;37:W23–W27。 [PMC免费文章][公共医学][谷歌学者]
22.Wheelan SJ、Church DM、Ostell JM。Spidey:mRNA-基因组比对工具。基因组研究。2001;11:1952–1957. [PMC免费文章][公共医学][谷歌学者]
23Skinner ME、Uzilov AV、Stein LD等。JBrowse:下一代基因组浏览器。基因组研究。2009;19:1630–1638. [PMC免费文章][公共医学][谷歌学者]
24Vaquerizas JM、Kummerfeld SK、Teichmann SA等。人类转录因子普查:功能、表达和进化。Nat.Rev.基因。2009;10:252–263.[公共医学][谷歌学者]
25后生动物基因调控网络表征的实验进展。简介。功能。基因组学。蛋白质组学。2009;8:12–27.[公共医学][谷歌学者]
26Nielsen R,Pedersen TÃs,Hagenbeek D,et al.PPAR的全基因组分析:RXR和RNA聚合酶II的占用揭示了脂肪生成过程中不同代谢途径的时间激活和RXR二聚体组成的变化。基因开发。2008;22:2953–2967. [PMC免费文章][公共医学][谷歌学者]
27Spandidos A,Wang X,Wang H,等。PrimerBank:用于基因表达检测和量化的人类和小鼠PCR引物对资源。核酸研究。2010;38:D792–9。 [PMC免费文章][公共医学][谷歌学者]
28Green H,Kehinde O。一种建立的前二糖细胞系及其在培养中的分化。二、。影响脂肪转化的因素。单元格。1975;5:19–27.[公共医学][谷歌学者]
29D'haene B,Hellemans J.qPCR数据分析过程中质量控制的重要性。国际药物光盘。2010:18–24. [谷歌学者]
30Vandesompele J、De Preter K、Pattyn F等。通过多个内部控制基因的几何平均对实时定量RT-PCR数据进行精确归一化。基因组生物学。2002;:研究0034。 [PMC免费文章][公共医学][谷歌学者]
31Lefever S、Hellemans J、Pattyn F等。RDML:实时定量PCR数据的结构化语言和报告指南。核酸研究。2009;37:2065–2069. [PMC免费文章][公共医学][谷歌学者]
32Hellemans J、Mortier G、De Paepe A等。qBase相对定量框架和软件,用于实时定量PCR数据的管理和自动分析。基因组生物学。2007;8:R19。 [PMC免费文章][公共医学][谷歌学者]
33Berger MF、Badis G、Gehrke AR等。高分辨率序列偏好分析揭示的同源域DNA结合变异。单元格。2008;133:1266–1276. [PMC免费文章][公共医学][谷歌学者]
34Tadepaly HD,Burger G,Aubry M.哺乳动物C2H2-锌指基因和亚家族的进化:物种特异性复制和簇、基因和效应域的丢失。BMC Evol公司。生物。2008;8:176. [PMC免费文章][公共医学][谷歌学者]
35Tichopad A,Dzidic A,Pfaffl M.通过提高引物连锁扩增效率提高定量实时RT-PCR的再现性。生物技术。莱特。2003;24:2053–2056. [谷歌学者]
36Wrobel G,Kokocinski F,Lichter P.AutoPrime:为表达序列选择引物。基因组生物学。2004;5:第11页。 [谷歌学者]
37Fredslund J,Lange M.Primique:一个家族中每个序列的特异PCR引物的自动设计。BMC生物信息学。2007;8:369. [PMC免费文章][公共医学][谷歌学者]
38Allawi HT,Santa Lucia J.,Jr.DNA内部G.T错配的热力学和核磁共振。生物化学。1997;36:10581–10594.[公共医学][谷歌学者]
39圣卢西亚J.,Jr.对聚合物、哑铃和寡核苷酸DNA近邻热力学的统一观点。程序。美国国家科学院。科学。美国。1998;95:1460–1465. [PMC免费文章][公共医学][谷歌学者]

文章来自数据库:《生物数据库与治疗杂志》由以下人员提供牛津大学出版社