示例数据集检索
在使用之前绘图扩展()
函数,我们需要下载Sestak和Domazet-Loso,2015年的示例数据集。
下载植物地层图
属于D。雷里奥:
#下载Danio rerio的植物地层图
#来自Sestak和Domazet-Loso,2015
下载.file(网址= "http://mbe.oxfordjournals.org/content/suppl/2014/11/17/msu319.DC1/表S3-2.xlsx",
目标文件= “MBE_2015a_Drerio_PhyloMap.xlsx” )
阅读*.xlsx文件
文件存储植物地层图
属于斑马鱼并将其格式化用于与一起使用我的TAI
:
#安装readxl包
安装.包(“readxl”)
#加载包readxl
图书馆(读取xl)
#读取excel文件
DrerioPhyloMap。MBEa公司 <- 读取excel(“MBE_2015a_Drerio_PhyloMap.xlsx”,张= 1,跳过= 4)
#与myTAI一起使用的植物地层图格式
Drerio.Phylo地图 <- DrerioPhyloMap。MBEa公司[,1:2]
#看看最终的格式
头(Drerio.Phylo地图)
Phylostrata ZFIN_ID公司1 1 ZDB-GENE-000208-132 1 ZDB-GENE-000208-173 1 ZDB-GENE-000208-184 1 ZDB-GENE-000208-235 1 ZDB-GENE-000209-3号6 1 ZDB-基因-000209-4
现在,Drerio.Phylo地图
存储植物地层图
属于斑马鱼所使用的作为背景集,使用绘图扩展()
.
富集分析
现在绘图扩展()
函数可视化结束-代表性不足叶绿藻门
大脑特异性基因与存储在植物地层图
属于斑马鱼.
#阅读Sestak和Domazet-Loso 2015年的表达数据(器官特异性基因)
Drerio.Organ特定表达式 <- 读取excel(“MBE_2015a_Drerio_PhyloMap.xlsx”,张= 2,跳过= 三)
#只选择大脑特定基因
德雷里奥。基因 <- 独特的(na.省略(Drerio.Organ特定表达式[,“大脑”]))
#可视化注释为脑特异性的基因的丰富层次
情节丰富(Drerio.PhyloMap公司,
测试集= 德雷里奥。布莱恩。基因,
测量= “log-foldchange”,
仅使用.map= 真的,
图例名称= “PS”)
在这里,第一个参数要么是一个标准表达式集
对象(如果use.only.map=错误
:default)或植物地层图
或散度图
(英寸案例use.only.map=真
; 看见引言详细信息)。第二个论点测试集
指定还存储在相应的表达式集
或地层图/分流图
用于浓缩应量化和可视化。
可视化过量或不足基因的几率或对数在测试集
以下程序是执行:
\(N_{ij}\)表示j组和PS衍生的基因\(i),使用\(i)=1, .. , n\)以及在哪里\(j=1)表示背景集和\(j)=2\)表示测试集
\(N_{i.}\)表示总数PS中的基因数量\(i)
\(N_{.j}\)表示总数组内基因数\(j)
\(N_{..}\)是总数所有组中的基因\(j)和所有PS\(i)
\(f{ij}\)=\(N_{ij}\)/\(N_{..}\)和\(g{ij}\)=\(f{ij}\)/\(f{.j}\)表示相对频率在组之间
\(f{i.}\)表示介于组和\(f{ij}\)
结果是折叠更改值(赔率;measure=“foldchange”
)表示为\(C_2=g_{i2}/f_{i.}\)它是可视化的高于和低于零或日志折叠更改价值(log-odds;measure=“log-foldchange”
),其中\(日志2\)(C)=\(log_2\)(\(g{i2}\)) -\(日志2\)(\(f{i.}\))它是对称可视化的零度以上和零度以下绘图扩展()
类似地,\(C_1=g_{i1}/f_{i.}\)但不是由该函数可视化。
在内部,绘图扩展()
执行Fisher's精确测试每个叶层
或分流地层
分别量化重要性对应词的过度或不足表达叶绿藻门
或分流地层
在测试集
与整体相比表达式集
.绘图扩展()
可视化显著富集(过量或不足)叶绿藻门
或分流地层
具有星号“*”。
符号:
- '*'=P值\(\leq\)0.05
- “**”=P值\(\leq\)0.005
- “***”=P值\(\leq\)0.0005
用户会注意到,在执行绘图扩展()
函数、p值和富集矩阵(存储\(C_1\)和\(C_2\))将返回。
情节丰富(Drerio.Phylo地图,
测试集= 德雷里奥。布莱恩。基因,
测量= “log-foldchange”,
仅使用.map= 真的,
图例名称= “PS”)
价值$pPS1 PS2 PS3 PS4 PS5 PS68.283490e-01 8.362880e-05 6.778981e-02 1.373816e-02 7.946309e-13 6.017041e-01PS7 PS8 PS9 PS10 PS11 PS122.185021e-03 2.281194e-03 8.943147e-01 5.699612e-01 4.717058e-02 9.367759e-01PS13 PS143.929949e-03 1.593834e-05$enrichment.max矩阵BG_设置测试_设置PS1-0.001132832 0.007668216PS2 0.023733936-0.172380714PS3-0.040879607 0.250587496PS4-0.048920465 0.294399729PS5-0.114888949 0.603817643PS6 0.008678915-0.060350168PS7-0.062948352 0.367240944PS8 0.115630474至1.206210187PS9-0.007353969 0.048964218磅PS10-0.031971192 0.200141519PS11 0.039742253-0.303363314PS12-0.002418079 0.016311853PS13 0.101449988-0.984621732号PS14 0.098211044-0.938724783
如果用户只对Fisher检验的p值感兴趣和浓缩矩阵,而不显示条形图,它们可以指定plot.bars=错误
参数仅检索数值结果。
#指定plot.bars=FALSE以仅检索数字结果
浓缩结果 <- 情节丰富(Drerio.Phylo地图,
测试集= 德雷里奥。布莱恩。基因,
测量= “log-foldchange”,
仅使用.map= 真的,
图例名称= “PS”,
绘图条= 错误的)
#获取p-值,量化各层的富集程度
浓缩结果$p.值
PS1 PS2 PS3 PS4 PS5 PS68.283490e-01 8.362880e-05 6.778981e-02 1.373816e-02 7.946309e-13 6.017041e-01PS7 PS8 PS9 PS10 PS11 PS122.185021e-03 2.281194e-03 8.943147e-01 5.699612e-01 4.717058e-02 9.367759e-01PS13 PS143.929949e-03 1.593834e-05
#存储C_1和C_2的存取富集矩阵
浓缩结果$丰富矩阵
BG_设置测试_设置PS1-0.001132832 0.007668216PS2 0.023733936-0.172380714PS3-0.040879607 0.250587496PS4-0.048920465 0.294399729磅PS5-0.114888949 0.603817643PS6 0.008678915-0.060350168PS7-0.062948352 0.367240944PS8 0.115630474至1.206210187PS9-0.007353969 0.048964218PS10-0.031971192 2014年10月15日PS11 0.039742253-0.303363314PS12-0.002418079 0.016311853PS13 0.101449988-0.984621732号PS14 0.098211044-0.938724783
定义背景集
内部进行的费希尔试验绘图扩展()
假设输入中存储的所有基因表达式集
或植物地层图
/散度图
已使用定义构建测试统计的背景集。然而,由于在大多数情况下测试集
是的子集输入表达式集
或植物地层图
/散度图
一也可以指定完成.bg
参数删除所有测试集
执行费希尔测试和可视化。
以下两个示例允许用户在以下情况下比较结果保留所有基因作为背景集与删除选项比较测试集
背景集中的基因。
#complete.bg=TRUE(默认)->在背景集中保留test.set基因
绘图富集(Drerio.Phylo地图,
测试集= 德雷里奥。布莱恩。基因,
测量= “log-foldchange”,
完成.bg= 真的,
使用.only.map= 真的,
图例名称= “PS”)
#complete.bg=FALSE->从背景集中删除test.set基因
情节丰富(Drerio.Phylo地图,
测试集= 德雷里奥。布莱恩。基因,
测量= “log-foldchange”,
完成.bg= 错误的,
仅使用.map= 真的,
图例名称= “PS”)
用户会注意到,尽管一些p值发生了变化结果并没有改变。然而,在边界线案例中,结果可能影响是否有叶绿藻门
或分流地层
表示为显著富集或不是。因此,在保留或移除时,请始终注意解释这个测试集
因为这两个选项是有效的,有优点和缺点,并且依赖于有效的解释。