用例#1:共享公共基因的功能注释进化史
进化转录组学旨在预测转录组生物过程中的进化保守性级别。然而,发现基因共享常见的进化史可以揭示生物过程可能一开始就进化了。
在这个用例
我们将把功能和用获得的生物学注释生物标记
用浓缩液获得的基因绘图扩展().
第1步
对于下面的示例,我们将使用数据集进行扩展在中找到的分析绘图扩展().
安装并加载我的TAI包裹:
#安装myTAI
安装.包(“我的TAI”)
#加载myTAI
图书馆(我的TAI)
下载植物地层图
属于D。雷里奥:
#下载Danio rerio的植物地层图
#来自Sestak和Domazet-Loso,2015
数据集来自补充文件3
这个的出版物:https://academicial.oup.com/mbe/article/32/2/299/1058654#77837069
下载后补充文件3
,你会发现文件表S3-2.xlsx
可用于以下用途生物标记
功能。
阅读*.xlsx文件
文件存储植物地层图
属于斑马鱼并将其格式化用于与一起使用我的TAI
:
#安装readxl软件包
安装.包(“readxl”)
#加载包readxl
图书馆(读xl)
#读取excel文件
DrerioPhyloMap。MBEa公司<- 读取excel(“表S3-2.xlsx”,薄板= 1,跳过= 4)
#与myTAI一起使用的植物地层图格式
Drerio.Phylo地图<-DrerioPhylon地图。MBEa[,1:2]
#看看最终的格式
头(Drerio.PhyloMap)
Phylostrata ZFIN_ID公司1 1 ZDB-GENE-000208-132 1 ZDB-GENE-000208-173 1 ZDB-GENE-000208-184 1 ZDB-GENE-000208-235 1 ZDB-GENE-000209-3号6 1 ZDB-GENE-000209-4号
现在,Drerio.Phylo地图
存储植物地层图
属于斑马鱼所使用的作为背景集,使用绘图扩展()
从我的TAI
.
富集分析
现在绘图扩展()
函数可视化结束-代表性不足叶绿藻门
大脑特异性基因与存储在植物地层图
属于斑马鱼.
图书馆(读xl)
#阅读Sestak和Domazet-Loso 2015年的表达数据(器官特异性基因)
Drerio.Organ特定表达式<- 读取excel(“表S3-2.xlsx”,薄板= 2,跳过= 三)
#只选择大脑特异性基因
德雷里奥。布莱恩。基因<- 未列出的(独特的(na.省略(Drerio.OrganSpecificExpression[,“大脑”])))
#可视化注释为脑特异性的基因的丰富层次
情节丰富(Drerio.PhyloMap、,
测试集=德雷里奥。布莱恩。基因,
测量= “折叠更改”,
仅使用.map= 真的,
图例名称= “PS”)
用户会发现,例如,来自PS5的大脑基因显著富集。
现在我们可以使用选择基因集()
函数来自我的TAI
.请请注意选择基因集()
只能与一起使用仅限于门地层图(仅use.map.=真
参数)因为myTAI版本>0.3.0。
脑基因<- 选择基因集(表达式集=Drerio.Phylo地图,
基因集=德雷里奥。布莱恩。基因,
使用.only.map= 真的)
#仅选择源于PS5的大脑基因
脑基因。第5部分<-脑基因[哪一个(BrainGenes[,“珊瑚虫”]== 5), ]
#看看结果
头(BrainGenes.PS5)
Phylostrata ZFIN_ID公司14851 5 ZDB-GENE-000210-614852 5 ZDB-GENE-000210-714853 5 ZDB-GENE-000328-4号14856 5 ZDB-GENE-000411-114857 5 ZDB-GENE-000427-4号14860 5 ZDB-GENE-000526-1
现在用户可以执行生物制品()
函数以获取起源于PS5的大脑基因的功能注释。
为此,首先需要找到相应的基因id,如ZDB-GENE-000210-6
.
#查找zfin.org id的筛选器
组织过滤器(“达尼奥·雷里奥”,主题= “zfin_id”)
名称描述数据集52带有zfin id的zfin_id drerio_gene_ensembl53带有zfin成绩单名称drerio_gene_ensembl的zfin_id_transcript_name103 zfin_id zfin id[例如ZDB-GENE-060825-136]drerio_GENE_ensembl274 with_zfin_id with zfin id drerio_gene_vega286 zfin_id zfin id[例如ZDB-GENE-121214-212]drerio_GENE_vega366带有zfin id的_zfin_id drerio_gene_ensembl367,带zfin_id_transcript_name,带zfin成绩单名称drerio_gene_ensembl417 zfin_id zfin id[例如ZDB-GENE-00825-136]drerio_GENE_ensembl588 with_zfin_id with zfin id drerio_gene_vega600 zfin_id zfin id[例如ZDB-GENE-121214-212]drerio_GENE_vega680带有zfin id的_zfin_id drerio_gene_ensembl681,带zfin_id_transcript_name,带zfin成绩单名称drerio_gene_ensembl731 zfin_id zfin id[例如ZDB-GENE-00825-136]drerio_GENE_ensembl902 with_zfin_id with zfin id drerio_gene_vega914 zfin_id zfin id[例如ZDB-GENE-121214-212]drerio_GENE_vega市场52 ENSEMBL_MART_ENSEMBL53 ENSEMBL_MART_ENSEMBL103 ENSEMBL_MART_ENSEMBL公司274 ENSEMBL_MART_ENSEMBL公司286 ENSEMBL_MART_ENSEMBL公司366 ENSEMBL_MART_ENSEMBL公司367 ENSEMBL_MART_ENSEMBL公司417 ENSEMBL_MART_ENSEMBL588 ENSEMBL_MART_ENSEMBL600 ENSEMBL_MART_ENSEMBL680 ENSEMBL_MART_ENSEMBL681 ENSEMBL_MART_ENSEMBL公司731 ENSEMBL_MART_ENSEMBL902 ENSEMBL_MART_ENSEMBL914 ENSEMBL_MART_ENSEMBL
现在用户可以检索相应的GO属性D。雷里奥具有组织属性
.
#D.rerio的find-go属性项
组织属性(“丹尼尔·雷里奥”,主题= “开始”)
名称描述33 go_id go术语加入36 go_linkage_type go术语证据代码38个goslim_goa_accession goslim goa加入39 goslim_goa_description goslim goa描述516 ggorilla_homologe_ensembl_gene大猩猩集合基因ID517 ggorilla_homologic_canomic_transcript_protein标准蛋白或转录ID518 ggorilla_homolog_ensembl_pepteptideGorilla ensembl蛋白质ID519 ggorilla_homologe_chromose大猩猩染色体名称520 ggorilla_homologe_chromostart大猩猩染色体起始(bp)521 ggorilla同源染色体末端大猩猩染色体末端(bp)522 ggorilla_Homology_orthology_type同源类型523 ggorilla_homolog_subtype祖先524 ggorilla_homology_orthology_confidence矫形置信度[0低,1高]525 ggorilla_homologe_perc_id%查询基因的身份526 ggorilla_homology_perc_id_r1%与大猩猩基因的同源性527 ggorilla _同源_dn dn528 ggorilla _同源_ ds ds1240 go_id go id1241快速入门快速入门ID1370 go_id go术语加入1373 go_linkage_type go术语证据代码1375 goslim_goa_accession goslim goa加入1376 goslim_goa_description goslim goa描述1853 ggorilla_homologe_ensembl_gene大猩猩集合基因ID1854 ggorilla_homologic_canomic_transcript_protein标准蛋白或转录ID1855 ggorilla_homologe_ensembl_peptide大猩猩集合蛋白质ID1856 ggorilla_homologe_chromose大猩猩染色体名称1857 ggorilla_homologe_chromostart大猩猩染色体起始(bp)1858 ggorilla同源染色体末端大猩猩染色体末端(bp)1859 ggorilla_Homology_orthology_type同源类型1860 ggorilla_同源_子型祖先1861 ggorilla_homology_orthology_confidence矫形置信度[0低,1高]1862 ggorilla_homologe_perc_id%查询基因的身份1863 ggorilla_homolog_perc_id_r1%关于大猩猩基因的身份1864 ggorilla _同源_ dn dn1865 ggorilla _同源_ ds ds2577 go_id go id2578快速入门快速入门ID2707 go_id go术语加入2710 go_linkage_type go术语证据代码2712 goslim_goa_accession goslim goa加入2713 goslim_goa_description goslim goa描述3190 ggorilla_homologe_ensembl_gene大猩猩集合基因ID3191 ggorilla_homologic_canomic_transcript_protein标准蛋白或转录ID3192 ggorilla_homolog_ensembl_pepteptideGorilla ensembl蛋白质ID3193 ggorilla_homologe_chromose大猩猩染色体名称3194 ggorilla_homologe_chromostart大猩猩染色体起始(bp)3195 ggorilla_homologe_chrome_end大猩猩染色体末端(bp)3196 ggorilla_Homology_orthology_type同源类型3197 ggorilla_homolog_subtype祖先3198 ggorilla_homology_orthology_confidence矫形置信度[0低,1高]3199 ggorilla_homology_perc_id%查询基因的身份3200 ggorilla_homology_perc_id_r1%与大猩猩基因的同源性3201 ggorilla _同源_ dn dn3202 ggorilla _同源_ ds ds3914 go_id go id3915快速入门快速入门ID数据集集市33 drerio_gene_ensembl ensembl_MART_ensembl36 drerio_gene_ensembl ensembl_MART_ensembl38 drerio_gene_ensembl ensembl_MART_ensembl39 drerio_gene_ensembl ensembl_MART_ensembl516 drerio_gene_ensembl ensembl_MART_ensembl517 drerio_gene_ensembl ensembl_MART_ensembl518 drerio_gene_ensembl ensembl_MART_ensembl519 drerio_gene_ensembl ensembl_MART_ensembl520 drerio_gene_ensembl ensembl_MART_ensembl521 drerio_gene_ensembl ensembl_MART_ensembl522 drerio_gene_ensembl ensembl_MART_ensembl523 drerio_gene_ensembl ensembl_MART_ensembl524 drerio_gene_ensembl ensembl_MART_ensembl525 drerio_gene_ensembl ensembl_MART_ensembl编号526 drerio_gene_ensembl ensembl_MART_ensembl527 drerio_gene_ensembl ensembl_MART_ensembl528 drerio_gene_ensembl ensembl_MART_ensembl1240年drerio_gene_vega ENSEMBL_MART_ENSEMBL1241 drerio_gene_vega ENSEMBL_MART_ENSEMBL1370年drerio_gene_ensembl ensembl_MART_ensembl1373 drerio_gene_ensembl ensembl_MART_ensembl1375年drerio_gene_ensembl ensembl_MART_ensembl1376年drerio_gene_ensembl ensembl_MART_ensembl1853年drerio_gene_ensembl ensembl_MART_ensembl1854 drerio_gene_ensembl ensembl_MART_ensembl编号1855年drerio_gene_ensembl ensembl_MART_ensembl1856年drerio_gene_ensembl ensembl_MART_ensembl1857年drerio_gene_ensembl ensembl_MART_ensembl1858年drerio_gene_ensembl ensembl_MART_ensembl1859 drerio_gene_ensembl ensembl_MART_ensembl公司1860年drerio_gene_ensembl ensembl_MART_ensembl1861年drerio_gene_ensembl ensembl_MART_ensembl1862年drerio_gene_ensembl ensembl_MART_ensembl1863年drerio_gene_ensembl ensembl_MART_ensembl1864年drerio_gene_ensembl ensembl_MART_ensembl1865年drerio_gene_ensembl ensembl_MART_ensembl2577 drerio_gene_vega ENSEMBL_MART_ENSEMBL2578 drerio_gene_vega ENSEMBL_MART_ENSEMBL2707 drerio_gene_ensembl ensembl_MART_ensembl2710 drerio_gene_ensembl ensembl_MART_ensembl2712 drerio_gene_ensembl ensembl_MART_ensembl2713 drerio_gene_ensembl ensembl_MART_ensembl3190 drerio_gene_ensembl ensembl_MART_ensembl3191 drerio_gene_ensembl ensembl_MART_ensembl3192 drerio_gene_ensembl ensembl_MART_ensembl3193 drerio_gene_ensembl ensembl_MART_ensembl3194 drerio_gene_ensembl ensembl_MART_ensembl3195 drerio_gene_ensembl ensembl_MART_ensembl3196 drerio_gene_ensembl ensembl_MART_ensembl3197 drerio_gene_ensembl ensembl_MART_ensembl3198 drerio_gene_ensembl ensembl_MART_ensembl3199 drerio_gene_ensembl ensembl_MART_ensembl编号3200 drerio_gene_ensembl ensembl_MART_ensembl3201 drerio_gene_ensembl ensembl_MART_ensembl公司3202 drerio_gene_ensembl ensembl_MART_ensembl3914 drerio_gene_vega ENSEMBL_MART_ENSEMBL3915 drerio_gene_vega ENSEMBL_MART_ENSEMBL
现在用户可以指定过滤器zfin_id
和属性go_id(_I)
检索相应基因id的GO项(请注意,这需要一些时间)。
#检索源于PS5的雷氏梭菌脑基因的GO项
政府_预算。脑基因<- 生物标记(基因= 未列出的(BrainGenes.PS5[,“ZFIN_ID”]),
市场= “ENSEMBL_MART_ENSEMBL”,
数据集= “drerio_gene_ensembl”,
属性= “go_id”,
过滤器= “zfin_id”)
头(GO_tbl.脑基因)
zfin_id go_id1 ZDB-GENE-000210-6编号:00600372 ZDB-GENE-000210-6编号:00469833 ZDB-GENE-000210-7 GO:00469834 ZDB-GENE-000328-4编号:00072755 ZDB-GENE-000328-4编号:00071666 ZDB-GENE-000328-4编号:0035567