跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府网站。

Https公司

网站是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2008年12月29日9:559。
doi:10.1186/1471-2105-9-559。

WGCNA:加权相关网络分析的R包

附属公司

WGCNA:加权相关网络分析的R包

彼得·朗菲尔德等。 BMC生物信息学. .

摘要

背景:相关网络在生物信息学应用中的应用越来越多。例如,加权基因共表达网络分析是一种系统生物学方法,用于描述微阵列样本中基因之间的相关模式。加权相关网络分析(WGCNA)可用于发现高度相关基因的簇(模块),使用模块特征基因或模块内枢纽基因总结此类簇,将模块相互关联并与外部样本性状关联(使用特征基因网络方法),以及用于计算模块成员关系度量。相关网络促进了基于网络的基因筛选方法,可用于识别候选生物标记物或治疗靶点。这些方法已成功应用于各种生物学背景,例如癌症、小鼠遗传学、酵母遗传学和大脑成像数据分析。虽然相关网络方法的部分内容已在单独的出版物中进行了描述,但需要提供用户友好、全面和一致的软件实现以及附带的教程。

结果:WGCNA R软件包是R函数的综合集合,用于执行加权相关网络分析的各个方面。该软件包包括网络构建、模块检测、基因选择、拓扑特性计算、数据模拟、可视化以及与外部软件的接口等功能。除了R包之外,我们还提供了R软件教程。虽然方法开发是由基因表达数据推动的,但底层数据挖掘方法可以应用于各种不同的环境。

结论:WGCNA软件包为加权相关网络分析提供了R函数,例如基因表达数据的共表达网络分析。R包及其源代码和其他资料可在以下网站免费获得:http://www.genetics.ucla.edu/labs/horvath/CoexpressionNetwork/Rpackages/WGCNA。

PubMed免责声明

数字

图1
图1
WGCNA方法概述本流程图简要概述了加权基因共表达网络分析的主要步骤。
图2
图2
网络可视化图A.全网络连通性分布的对数图。这个x个-轴表示整个网络连通性的对数,-轴对应频率分布的对数。在该图中,分布大致遵循一条直线,这被称为近似无标度拓扑。B.经典多维标度的结果。在这个图中,模块往往形成单独的“手指”。模块内枢纽基因位于指尖。C.网络热图图。层次聚类树状图中的分支对应于模块。彩色编码模块成员身份显示在树状图下方和右侧的颜色栏中。在热图中,高度的共表达互联性由逐渐饱和的黄色和红色表示。模块对应于高度互联的基因块。具有高模块内连接的基因位于模块分支的顶端,因为它们与模块中的其他基因显示出最高的互连性。
图3
图3
模块和特征基因网络图A.模块间平均基因重要性的条形图。在这个例子中,我们使用基于trait的基因重要性,方程式2。模块中的平均基因显著性越高,模块与相关临床特征的相关性越显著。B.基因显著性散点图(-轴)与模块成员资格(x个-轴)在最重要的模块中(绿色模块,见面板A)。在与感兴趣特征相关的模块中,模块成员数高的基因通常也具有较高的基因重要性。C.模块特征基因(用颜色标记)和微阵列样本特征的层次聚类树状图D.特征基因网络中邻接物的热图图,包括特征热图中的每一行和每一列对应一个模块特征基因(用颜色标记)或特征(用). 在热图中,绿色表示低邻接(负相关),而红色表示高邻接(正相关)。
图4
图4
雌性小鼠肝脏表达数据的WGCNA分析示例A.通过平均连锁层次聚类获得的基因树状图。树状图下方的颜色行显示了由动态树切割确定的模块分配。B.基因网络中拓扑重叠的热图图。在热图中,每行和每列对应一个基因,浅色表示拓扑重叠较低,逐渐变深的红色表示拓扑重叠较高。对角线上较暗的正方形对应于模块。基因树状图和模块分配显示在左侧和顶部。C.模块特征基因的层次聚类,总结聚类分析中发现的模块。树状图的分支(元模块)将正相关的特征基因组合在一起。D.特征基因网络中邻接的热图图,包括性状权重。热图中的每一行和每一列对应一个模块特征基因(用颜色标记)或重量。在热图中,绿色表示低邻接(负相关),而红色表示高邻接(正相关)。沿着对角线的红色方块是元模块。E.棕色模块中重量(GS,方程2)与模块成员关系(MM,方程6)的基因显著性散点图。GS和MM表现出非常显著的相关性,这意味着棕色模块的中心基因也往往与体重高度相关。F.棕色模块中30个连接最紧密的基因的网络。在这个网络中,我们只显示一个连接对应的拓扑重叠高于0.08的阈值。

类似文章

引用人

工具书类

    1. 费希尔RA。关于从小样本推导出的相关系数的“可能误差”。Metron公司。1915年;1:1–32.
    1. Zhou X,Kao MC,Wong W.通过基因表达数据的最短路径分析进行传递功能注释。美国国家科学院院刊,2002年;99:12783–12788.-项目管理咨询公司-公共医学
    1. Steffen M、Petti A、Aach J、D'haeseler P、Church G。信号转导网络的自动建模。BMC生物信息学。2002;3:34.-项目管理咨询公司-公共医学
    1. Stuart JM,Segal E,Koller D,Kim SK。全球发现保护基因模块的基因共表达网络。科学。2003;302:249–255.-公共医学
    1. Zhang B,Horvath S.加权基因共表达网络分析的一般框架。统计应用基因分子生物学。2005;4:第17条。-公共医学

出版物类型