跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
核酸研究。2010年7月1日;38(Web服务器问题):W96–W102。
2010年5月19日在线发布。 doi(操作界面):10.1093/nar/gkq418
预防性维修识别码:PMC2896202型
PMID:20484371

ToppCluster:用于生物系统比较富集聚类和基于网络的解剖的多基因列表特征分析器

摘要

ToppCluster是一个web服务器应用程序,它利用强大的富集分析和底层数据环境对多个基因列表进行比较分析。它生成热图或连接网络,揭示多个基因列表共享或特定的功能特征。ToppCluster使用超几何测试获得列表特定的特征丰富P(P)-为当前17类人类同源基因注释提供了值,并提供了用户可选择的截止值和多种测试校正方法来控制错误发现。每个可命名的基因列表代表一列输入到结果矩阵中的数据,该矩阵的行是过度表示的特征,每个列表中包含单个细胞P(P)-值和每个特征对应的基因。ToppCluster为用户提供了表格输出、层次聚类和热图生成的选择,或者能够从功能丰富矩阵中交互选择特征,将其转换为XGMML或GEXF网络格式文档,分别用于Cytoscape或Gephi应用程序。例如,在这里,我们证明了ToppCluster能够识别列表特异性表型和调控元件特征(两者都是顺式-元素和3′UTR microRNA结合位点)。ToppCluster的功能使其能够识别专门的生物功能以及基于生物学的生物状态解剖的调控网络和系统。ToppCluster可以在以下位置自由访问:http://toppcluster.cchmc.org.

简介

分析大规模生物数据(如基因表达数据)的主要问题之一是对已识别基因簇的功能含义的解释。与单个基因相关并在不同基因组间共享的各种功能注释和分子特征的可用性通常有助于识别与生物状态、过程或反应相关的关键生物特性,并可提供有用的生物学见解。典型的注释包括基因本体论、生物化学途径、蛋白质-蛋白质相互作用、蛋白质域信息以及在某些情况下的基因-疾病关联。存在多种工具用于单基因列表中功能注释的过度表达分析,如DAVID(1),法蒂戈(2),g:探查器()参考文献4和最近的参考文献5中提供了大量功能分析工具和所用方法的详细回顾。最近对此类分析的方法,尤其是涉及基于微阵列的基因表达数据的方法,采用了基因集富集方法。自从引入基因集富集分析以来(6),这些技术在单个基因列表的功能特征分析中非常成功,例如在可变或类似调控基因列表中的基因表达数据集中。然而,随着我们在不断增加的分子和生物实体及属性知识背景下检测复杂相关生物现象的能力的增强,一个关键的目标必须是我们还必须提高识别成分的能力,负责系统功能和监管机制的活动和交互,例如在WGCNA等应用中率先采用(7)和ARACNE(8). 同样,根据当前知识对数据进行有效和高效的可视化对于催化新的假设至关重要。

在这里,我们提供了一个直观有效的工具来分析和可视化与任何数量的基因集相关的共享和特定特征。我们提供了一个工作流程和工具套件,能够以这样一种方式对多个基因列表进行联合分析,以保持基因列表之间的关系,并提供能够表示多个基因之间特定或共享的基因功能和特征簇的二次可分析数据文档和可视化列表。例如,多基因列表分析方法可以比较时间序列基因表达实验或反映不同组织类型或细胞类型相对分化的基因列表中随时间而不同的功能性过度表达。目前,还没有现有的工具能够一起研究多个基因列表,并提供包含丰富注释集的功能模块图。最近的工具(如高通量GoMiner)显示了该领域的进展(9)和GOEAST(10); 然而,这些工具目前仅支持基于基因本体论的集合丰富,对调控机制、蛋白质-蛋白质相互作用、表型、疾病、小分子和其他类型的关系不敏感,这些关系可以进行有用的推断。PageMan(寻呼机)(11)是一个创新的应用程序,允许一次分析多个微阵列表达谱簇,并基于对组织特定用户生成的本体映射文件的集合丰富,实现直观的热图可视化。

大多数基因集富集工具使用超几何分布作为统计模型,以获得一个功能项在基因列表中偶然多次出现的概率。这里,ToppCluster通过在ToppGene中建立的基因集富集功能使用相同的方法(12)以评估多个输入基因列表中的显著特征富集。接下来,我们利用热图或网络,这两种在基因组学中已经成熟的可视化工具,来生成基因簇的功能图。热图非常适合通过颜色强度值显示大型数据集(13). 通过将功能项的重要性表示为热图上颜色的强度,我们展示了一种非常简单但有效的方法,可以同时可视化多个基因集的生物功能主题。此外,我们还提供了以各种格式导出结果以进行进一步分析的功能,包括TreeView集群树(13,14)、细胞景观(15)和Gephi(16)兼容网络。ToppCluster是一个开放的、可自由访问的web应用程序服务器,位于http://toppcluster.cchmc.org/为了证明其有效性,我们使用了组织特异性基因表达和调控(TiGER)数据库中的基因列表(17)作为ToppCluster的输入,以生成组织特定或组织间共享的功能图。我们表明,ToppCluster可用于识别细胞器特异性表型关联、生物过程和其mRNAs是microRNAs(miRs)靶标的基因,以及其启动子包含的基因顺式-已知转录因子的元素。我们的目标是为研究人员提供一个基础,以跨大型数据集汇集各种知识和特征属性连接,从而获得更深入的能力来建模负责系统功能的路径和机制,并阐明其数据与高维人类的功能相关性基因相关知识。

方法

系统工作流程

ToppCluster的主要目标是在涉及多个基因集的数据集中识别生物主题。一个典型的例子是时间序列微阵列实验。ToppCluster的主要优势在于能够共同分析多个基因列表,并以便于比较和对比分析的形式描述结果。

图1显示了ToppCluster管道的示意图。输入包括来自各种实验的多个基因列表,例如,涉及不同的组织、时间点、细胞类型、微小RNA靶点等。P(P)-值截断和选择的校正方法[邦费罗尼、错误发现率(FDR)或无]用作过滤器。用户可以选择要包含在输出中的一个或多个注释类型。ToppGene套件的富集功能(12)由ToppCluster用于派生过度表示的注释。ToppGene包含17种基于人类基因的注释类型,包括基因本体-生物过程、分子功能、细胞成分、小鼠表型、人类表型、通路、转录因子结合位点、预测的微RNA靶点、PubMed联合引用、蛋白质域、蛋白质-蛋白质相互作用、细胞带、基因共表达、,表达相关性(“计算”),药物/化学和疾病。ToppGene中这些注释的数据源链接可以在ToppCluster网站的“链接”部分找到。有关注释类型和数量的更多详细信息,请参阅ToppCluster主页上“ToppGene”标题下的“Database Info”部分。确定输入参数后,在ToppGene中计算基因相关特征的丰富程度(12)基于超几何分布检验。初始输出是一个结果矩阵,其中包含与每个输入基因列表相关的列,以及表示任何基因列表的过度表示特征的行。每个命名基因列表的一列是一个显著性值,等于P(P)-值,每个基因列表的另一列是以逗号分隔的具有该功能的基因列表(见下文)。如果给定的特征与多个基因列表输入有显著关联,则可能存在相同的显著性得分,但与该特征相关的基因列表完全不同。生成的功能富集矩阵可以分层聚类,作为热图进行可视化和分析,也可以转换为与Cytoscape兼容的XGMML网络格式或与Gephi兼容的GEXF网络格式。如果选择了heatmap生成选项,则功能丰富矩阵将进行二维层次聚类(见下文),其中首先根据相似的分数对行和列进行重新排序。在表格格式中,来自特定基因列表的对显著性得分有贡献的基因在邻接表中提供。第三方软件可用于导入和可视化热图或网络。网络也可以作为静态图像获得。

保存图片、插图等的外部文件。对象名称为gkq418f1.jpg

ToppCluster管道的示意图。多个基因表由用户命名并通过ToppCluster界面提交。截至2010年4月,共有17种不同类别的注释。用户可以选择要包含的类别P(P)-值截止,一种错误发现的纠正方法和输出类型。对每个基因列表进行功能富集分析,并将结果整理成单个矩阵。显著性P(P)-值被对数转换(−log10)为分数,与每个丰富特征相交的每个列表的基因被放置在一个单独的列中。结果以选定的输出格式交付。

数据输入和接口

ToppCluster以两种方式之一接受输入:(i)作为可连续添加和命名的单独基因列表,或(ii)使用“替代条目”方法,作为两列列表,基因位于第一列,基因列表的名称位于第二列。目前接受的输入仅限于人类基因。17个注释源中的一个或任意一个可以用于特征富集分析。每个特征分析都可以根据P(P)-值截断、多重测试校正方法或每个注释类型存在的最小和最大基因数。例如,将丰富限制在关联基因较少的本体论上,可以更加关注特定类别的基因特征或功能。有多个选项可用于格式化和交付结果。用户可以选择以逗号分隔值、制表符分隔值或HTML表格格式的表格格式获取结果。还可以获得各种可视化格式的结果——使用R生成的PDF文件中的标准热图(18) (网址:http://www.R-project.org),树视图(13,14)集群数据树(CDT)热映射文件,GenePattern(19)GCT格式,Cytoscape(15)XGMML可导入网络格式,Gephi(16)可导入的GEXF网络格式或使用PNG选项作为预先布局的网络图像。

生成富集数据图

每个标记的基因列表都被输入ToppGene(12)web服务。然后将所选类别的每个基因列表的功能富集结果编译并连接成表格格式。在这里,我们使用了一种新的方法来表示基因列表中功能项的重要性。我们取的是P(P)-与术语对应的值,从而获得零以上的“显著性得分”。我们将任何大于10的值四舍五入到10。因此,与基因列表相对应的功能项的显著性得分在0到10之间。如果选择了heatmap选项,则使用欧几里德距离测度对矩阵进行二维层次聚类,并通过R进行平均链接(18).

可视化

ToppCluster结果可以图形化地作为热图或网络来查看。基于ToppCluster heatmap的输出可以通过两种方式获得:作为PDF格式文件中的heatmap图像,或作为与TreeView兼容的一组文件(13,14)软件。树视图(13,14)可用于打开集群数据文件以生成交互式heatmap视图。随后可以从TreeView保存热图图像(13,14).

ToppCluster结果也可以导出为Cytoscape(15)支持的网络文件类型[XGMML;选择“Import”、“network(multiple file types)”.]、Gephi支持的网络文档(GEXF)或静态图像(PNG)。交互式HTML输出格式允许用户从要包含在网络中的结果中选择感兴趣的功能。在此之后,用户可以选择网络的类型、布局和文件格式。网络可以以两种截然不同的方式显示:“基因水平”选项生成包括基因在内的整个网络,而“抽象”选项则从网络中排除基因,通过包含特定基因列表的边缘关系,仅将丰富的术语保留为与输入基因列表相关的节点。在这个选项中,网络显示通过加权边连接到丰富项的输入基因列表;边缘权重设置为丰富项的显著性得分,基因列表作为注释字段从边缘属性浏览器的Cytoscape数据面板窗口中提供。

实施

ToppCluster是一个用Java实现的分布式系统,它在使用Sun Glassfish Enterprise Server环境的Linux服务器集群上运行。ToppCluster通过Java消息服务(JMS)将数据传递给ToppGene。JMS自动将所有基因列表富集作业分发到可用的ToppGene富集分析节点。TreeView集群数据文件和PDF热图是使用嵌入式R生成的(18)在CCHMC计算集群上作为计划作业运行的脚本(http://bmi.cchmc.org/resources/clusters). 使用JAVA JUNG生成网络图像(20)用于分析和可视化网络数据的库。ToppCluster使用jQuery AJAX库实现基于HTML的动态用户界面。

TOPPCLUSTER的效用

我们用一个简单的例子——一组组织特异性基因列表——来证明ToppCluster的功效。TiGER组织特异性基因列表(17)数据库中选择了在心脏、肌肉、肝脏、肾脏和胰腺中表达最高的基因。从这些结果中,我们试图根据组织特异性基因的共享和特异性疾病表型以及潜在的调控机制关系来确定和划分这些基因列表。然后使用P(P)-值截断0.05和FDR校正方法。所选特征为小鼠表型、microRNA和转录因子结合位点。重要的是,没有对microRNA应用错误发现校正方法,因为其作用的假设不是基于全基因组相对富集,而是关于microRNA是否表达以及可能针对哪些基因的布尔真-假问题。首先,使用“抽象”网络选项生成包含所有丰富术语关系的Cytoscape兼容网络文件。图2A显示了使用Spring Embedded Layout函数和基于重要性的边缘权重后从Cytoscape导出的网络图像。图中标记了一些共享和特异的表型、microRNA和过度表达的转录因子。

保存图片、插图等的外部文件。对象名为gkq418f2.jpg

(A类)一个“抽象”网络,显示与心脏、肾脏、肝脏、肌肉和胰腺五个组织特异性基因簇相关的丰富的小鼠表型术语、microRNA和转录因子。(B类)肾脏和肝脏特异性基因列表之间共享的丰富小鼠表型术语、microRNAs和转录因子的解剖基因水平视图。MP,小鼠表型;转录因子结合位点TFBS;小RNA,microRNA。

从抽象网络的观点来看,存在明显的功能分离。值得注意的是,肝脏基因列表显示了具有特定表型的基因集的高度显著丰富,如异常肝脏/胆道形态、循环胆固醇降低和异常凝血。心脏和骨骼肌列表具有一般的心肌收缩性和形态学表型,但在表型方面有所不同,包括脉冲传导系统异常、心跳不规则和心脏心房扩张,以及肌肉质量减少、肌肉发育异常和骨骼肌肌无力。心脏和肌肉表达的转录因子心肌细胞增强因子-2(MEF-2)也在这两者之间共享(21)和血清反应因子(22)但miR-29a、b、c和miR-100靶基因显著富集。与此相一致,miR-29被证明是心脏纤维化的关键抑制因子(23). 肾脏基因与肾脏结构和功能的异常以及转运蛋白相关的特定功能(如排泄和离子转运)具有广泛的相关性。转录因子Pou3f3的缺失会导致多种肾脏表型,它与OCT类转录因子结合位点结合,这些位点在肾脏基因中过度表达。肾脏基因列表还丰富了PBX1的启动子转录因子结合位点,PBX1也调节肾脏发生和尿路分支(24). 与现有知识一致,肝细胞核因子HNF1和HNF4在肝和肾基因之间共享(25,26). 肝脏特异性基因富含鸡卵清蛋白上游启动子转录因子(COUP-TF)。尽管该转录因子通常在发育过程中广泛表达,但发现其与肝细胞核因子-4(HNF-4)的结合位点高度相似。COUP-TF在几乎所有组织中的表达,以及它作为肝脏特异性基因黄嘌呤转碳淀粉酶(OTC)的阻遏物的事实,导致了它可能在其他组织中作为肝脏特异性基因的阻遏物的理论(27). 胰腺基因表现为胰岛紊乱、胰腺发育异常和胰岛素分泌异常等表型。肾脏基因与肝脏基因共享循环氨基酸、胆固醇、脂质和矿物质水平表型。胰腺特异性基因显示转录因子GATA1富集,已知GATA1参与包括胰腺在内的多个内分泌器官中基因的细胞特异性调节(28). 同样令人感兴趣的是microRNA miR-190,它对胰腺基因具有特异性。已发现miR-190在胰腺癌组织和细胞系中显著上调(29).

为了对其中一些术语进行基因水平的剖析,我们选择了肝脏和肾脏基因之间共享的表型和转录因子。使用“基因水平”网络选项,我们生成了一个细胞景观兼容网络,仅显示两组共享的基因、表型和转录因子,如所示图2B.ToppCluster允许用户选择要包含在网络中的感兴趣的术语。当调查人员只想进一步探索输出中的一些丰富术语时,这将特别有用。此功能用于生成图3,其中选择了富含多个类别的术语,并生成了基因水平的网络。

保存图片、插图等的外部文件。对象名称为gkq418f3.jpg

基因级网络显示用户从基因本体论、小鼠表型、共表达、microRNA和转录因子中为肾脏和肝脏特异性基因列表选择的丰富术语。

上述用例虽然概括了现有知识,但显示了ToppCluster梳理多个基因簇之间共享和特定功能及调控元素的能力。

包含输入基因列表的Excel文件、Cytoscape网络会话(CYS)文件和网络数据文本文件可在“补充”部分ToppCluster主页的。也可以使用对应于图2使用TreeView和TreeView格式群集数据文件生成的。

限制

如审查中所述(5),从多个基因列表进行交叉比较富集分析的问题之一是,基因列表的大小影响FDR校正富集P(P)-值。这可能会使比较P(P)-当基因列表的大小差异很大时,它们之间的值。可能需要一种算法来抵消这些差异,使这些比较更加准确。此外,使用虚假发现的具体假设和关系假设P(P)-在特定基因表中某些类别特征丰富性的显著性测试中,值校正是一个复杂的问题。某些情况下可能需要考虑在不使用错误发现的情况下获得的分析结果P(P)-值修正。考虑miRs在调控网络中的潜在参与当然是这样的,其中首要考虑的可能是对可能靶向关键基因的miRs是否真的表达的知识进行分解。因此,本手稿范围之外的一个关键考虑因素是,正在寻找的因果或关系模型是什么,以及在检测决定复杂系统功能的一组基因之间的相关关系时,何时提供敏感性与特异性是合适的?这些考虑因素可能会大大影响错误发现方法的最佳选择和适当的统计截断。此外,由有偏见的基因分析方法形成的列表在ToppGene中没有修正,因为我们的参考集目前不可修正(4). 然而,对于包含相似数量基因的列表,列表之间的差异显著性结果应该相对抵抗这种影响。

结论

现有的基因集富集分析工具涵盖了广泛的注释,并有助于分析从大规模实验中确定的感兴趣的基因列表(30). 然而,本文提出并由ToppCluster web服务器实现的一个新概念是,为了梳理出一组协同作用或合作基因在一个上下文中的高度重要关系,将其与来自其他生物状态的基因进行比较是非常有价值的。ToppCluster通过对多个基因集进行比较共同分析来实现这一点。在本报告中,我们展示了ToppCluster提供的发现实用性和潜力,以确定与人类组织特异性基因表达基因集相关的生物过程和假定调控机制,这些基因集表现出丰富的疾病和表型影响。我们设想,ToppCluster支持的分析、预测和发现工作流将为研究人员提供一个有价值的工具,帮助他们剖析复杂的生物过程,以磨练特定的基因、通路和调控机制,从而预测和进一步实验系统功能、功能障碍和治疗剂效应。在我们看来,可视化多个基因列表之间的功能关系的能力为形成关于负责确定生物状态(包括发育、稳态和疾病病理学)的潜在生物机制的作用和相互作用的新假设提供了新的机会。

基金

国家卫生研究院/国家糖尿病、消化和肾脏疾病研究所(NIH/NIDDK)1U01 DK70219(泌尿生殖发育分子解剖学项目小鼠图谱);PHS Grant P30 DK078392(辛辛那提消化健康中心);U54 RR025216(CTSA:辛辛那提临床和转化科学中心);和U01DE020049 NIDCR(FACEBASE联盟)。开放获取费用的资金来源:美国国立卫生研究院拨款。

利益冲突声明。未声明。

参考文献

1Dennis G.,Jr、Sherman B.T.、Hosack D.A.、Yang J.、Gao W.、Lane H.C.、Lempicki R.A.DAVID:注释、可视化和集成发现数据库。基因组生物学。2003;4:第3页。[公共医学][谷歌学者]
2Al-Shahrour F.、Diaz-Uriarte R.、Dopazo J.FatiGO:一种网络工具,用于发现基因本体术语与基因组之间的重要关联。生物信息学。2004;20:578–580.[公共医学][谷歌学者]
三。Reimand J.、Kull M.、Peterson H.、Hansen J.、Vilo J.g:Profiler——一个基于网络的工具集,用于对大规模实验中的基因列表进行功能分析。核酸研究。2007;35:W193–W200。 [PMC免费文章][公共医学][谷歌学者]
4Khatri P.,Draghici S.基因表达数据的本体论分析:当前工具、局限性和开放性问题。生物信息学。2005;21:3587–3595. [PMC免费文章][公共医学][谷歌学者]
5Huang da W.,Sherman B.T.,Lempicki R.A.生物信息学富集工具:大型基因列表综合功能分析的途径。核酸研究。2009;37:1–13. [PMC免费文章][公共医学][谷歌学者]
6Subramanian A.、Tamayo P.、Mootha V.K.、Mukherjee S.、Ebert B.L.、Gillette M.A.、Paulovich A.、Pomeroy S.L.、Golub T.R.、Lander E.S.等。基因集富集分析:解释全基因组表达谱的基于知识的方法。程序。美国国家科学院。科学。美国。2005;102:15545–15550. [PMC免费文章][公共医学][谷歌学者]
7Langfelder P.,Horvath S.WGCNA:加权相关网络分析的R包。BMC生物信息。2008;9:559. [PMC免费文章][公共医学][谷歌学者]
8Margolin A.A.、Nemenman I.、Basso K.、Wiggins C.、Stolovitzky G.、Dalla Favera R.、Califano A.ARACNE:哺乳动物细胞环境中基因调控网络重建的算法。BMC生物信息。2006;7(补充1):S7。 [PMC免费文章][公共医学][谷歌学者]
9Zeeberg B.R.、Qin H.、Narasimhan S.、Sunshine M.、Cao H.、Kane D.W.、Reimers M.、Stephens R.M.、Bryant D.、Burt S.K.等人。高通量GoMiner,一种“产业实力”的综合基因本体工具,用于解释多微阵列实验,并应用于常见变量免疫缺陷(CVID)的研究BMC生物信息。2005;6:168. [PMC免费文章][公共医学][谷歌学者]
10Zheng Q.,Wang X.J.GOEAST:用于基因本体丰富分析的基于web的软件工具包。核酸研究。2008;36:W358–W363。 [PMC免费文章][公共医学][谷歌学者]
11Usadel B.、Nagel A.、Steinhauser D.、Gibon Y.、Blasing O.E.、Redestig H.、Sreenivasulu N.、Krall L.、Hannah M.A.、Poree F.等。PageMan:一种交互式本体工具,用于生成、显示和注释分析实验的概览图。BMC生物信息。2006;7:535. [PMC免费文章][公共医学][谷歌学者]
12Chen J.,Xu H.,Aronow B.J.,Jegga A.G.使用小鼠表型改进人类疾病候选基因优先级。BMC生物信息。2007;8:392. [PMC免费文章][公共医学][谷歌学者]
13Eisen M.B.、Spellman P.T.、Brown P.O.、Botstein D.全基因组表达模式的聚类分析和显示。程序。美国国家科学院。科学。美国。1998;95:14863–14868. [PMC免费文章][公共医学][谷歌学者]
14Saldanha A.J.Java Treeview–微阵列数据的可扩展可视化。生物信息学。2004;20:3246–3248.[公共医学][谷歌学者]
15Shannon P.、Markiel A.、Ozier O.、Baliga N.S.、Wang J.T.、Ramage D.、Amin N.、Schwikowski B.、Ideker T.细胞景观:生物分子相互作用网络集成模型的软件环境。基因组研究。2003;13:2498–2504. [PMC免费文章][公共医学][谷歌学者]
16Bastian M.、Heymann S.、Jacomy M.Gephi:一个用于探索和操纵网络的开源软件;AAAI网络日志和社交媒体国际会议;加利福尼亚州:圣何塞;2009[谷歌学者]
17Liu X.,Yu X.、Zack D.J.、Zhu H.、Qian J.TiGER:组织特异性基因表达和调控数据库。BMC生物信息。2008;9:271. [PMC免费文章][公共医学][谷歌学者]
18R开发核心团队。R统计计算基金会。维也纳:奥地利;2007.R:统计计算语言和环境。[谷歌学者]
19Reich M.、Liefeld T.、Gould J.、Lerner J.、Tamayo P.、Mesirov J.P.基因模式2.0。自然遗传学。2006;38:500–501.[公共医学][谷歌学者]
20.Madadhain J.、Fisher D.、Smyth P.、White S.、Boey Y.使用JUNG分析和可视化网络数据。J.Stat.软件。2005;10:1–35. [谷歌学者]
21Naya F.J.,Olson E.MEF2:控制骨骼肌生长和分化的信号通路的转录靶点。货币。操作。单元格。生物。1999;11:683–688.[公共医学][谷歌学者]
22Miano J.M.血清反应因子:在不同的基因表达程序之间切换。分子细胞杂志。心脏病。2003;35:577–593.[公共医学][谷歌学者]
23van Rooij E.、Sutherland L.B.、Thatcher J.E.、DiMaio J.M.、Naseem R.H.、Marshall W.S.、Hill J.A.、Olson E.N.心肌梗死后微RNA的失调揭示了miR-29在心脏纤维化中的作用。程序。美国国家科学院。科学。美国。2008;105:13027–13032. [PMC免费文章][公共医学][谷歌学者]
24Schnabel C.A.、Godin R.E.、Cleary M.L.Pbx1调节发育中肾脏的肾发生和输尿管分支。开发生物。2003;254:262–276.[公共医学][谷歌学者]
25Pontoglio M.肝细胞核因子1,一种处于葡萄糖稳态十字路口的转录因子。《美国肾脏学会杂志》。2000;11(补充16):S140–S143。[公共医学][谷歌学者]
26Taraviras S.、Monaghan A.P.、Schutz G.、Kelsey G.小鼠HNF-4基因的特征及其在小鼠胚胎发生过程中的表达。机械。开发。1994;48:67–79.[公共医学][谷歌学者]
27Kimura A.,Nishiyori A.,Murakami T.,Tsukamoto T.,Hata S.,Osumi T..,Okamura R.,Mori M.,Takiguchi M.鸡肉卵清蛋白上游启动子转录因子(COUP-TF)以对抗肝细胞核因子-4(HNF-4)的方式抑制鸟氨酸转羧化酶基因启动子的转录生物学杂志。化学。1993;268:11125–11133.[公共医学][谷歌学者]
28Viger R.S.、Guittt S.M.、Anttonen M.、Wilson D.B.、Heikinheimo M.转录因子GATA家族在内分泌发育、功能和疾病中的作用。分子内分泌。2008;22:781–798. [PMC免费文章][公共医学][谷歌学者]
29Zhang Y.,Li M.,Wang H.,Fisher W.E.,Lin P.H.,Yao Q.,Chen C.实时PCR分析胰腺癌细胞株和手术标本中95个microRNA的谱分析。世界外科杂志。2009;33:698–709. [PMC免费文章][公共医学][谷歌学者]
30.Kann M.G.翻译生物信息学进展:疾病基因搜索的计算方法。简介。生物信息。11:96–110. [PMC免费文章][公共医学][谷歌学者]

来自的文章核酸研究由以下人员提供牛津大学出版社