Ensemb BioMart示例

2023-12-02

用例#1:共享公共基因的功能注释进化史

进化转录组学旨在预测转录组生物过程中的进化保守性级别。然而,发现基因共享常见的进化史可以揭示生物过程可能一开始就进化了。

在这个用例我们将把功能和用获得的生物学注释生物标记用浓缩液获得的基因绘图扩展().

第1步

对于下面的示例,我们将使用数据集进行扩展在中找到的分析绘图扩展().

安装并加载我的TAI包裹:

#安装myTAI
安装.包(“我的TAI”)

#加载myTAI
图书馆(我的TAI)

下载植物地层图属于D。雷里奥:

#下载Danio rerio的植物地层图
#来自Sestak和Domazet-Loso,2015

数据集来自补充文件3这个的出版物:https://academicial.oup.com/mbe/article/32/2/299/1058654#77837069

下载后补充文件3,你会发现文件表S3-2.xlsx可用于以下用途生物标记功能。

阅读*.xlsx文件文件存储植物地层图属于斑马鱼并将其格式化用于与一起使用我的TAI:

#安装readxl软件包
安装.包(“readxl”)

#加载包readxl
图书馆(读xl)

#读取excel文件
DrerioPhyloMap。MBEa公司<- 读取excel(“表S3-2.xlsx”,薄板= 1,跳过= 4)

#与myTAI一起使用的植物地层图格式
Drerio.Phylo地图<-DrerioPhylon地图。MBEa[,1:2]

#看看最终的格式
(Drerio.PhyloMap)
Phylostrata ZFIN_ID公司1 1 ZDB-GENE-000208-132 1 ZDB-GENE-000208-173 1 ZDB-GENE-000208-184 1 ZDB-GENE-000208-235 1 ZDB-GENE-000209-3号6 1 ZDB-GENE-000209-4号

现在,Drerio.Phylo地图存储植物地层图属于斑马鱼所使用的作为背景集,使用绘图扩展()我的TAI.

富集分析

现在绘图扩展()函数可视化结束-代表性不足叶绿藻门大脑特异性基因与存储在植物地层图属于斑马鱼.

图书馆(读xl)

#阅读Sestak和Domazet-Loso 2015年的表达数据(器官特异性基因)
Drerio.Organ特定表达式<- 读取excel(“表S3-2.xlsx”,薄板= 2,跳过= )

#只选择大脑特异性基因
德雷里奥。布莱恩。基因<- 未列出的(独特的(na.省略(Drerio.OrganSpecificExpression[,“大脑”])))

#可视化注释为脑特异性的基因的丰富层次
情节丰富(Drerio.PhyloMap、,
               测试集=德雷里奥。布莱恩。基因,
               测量= “折叠更改”,
               仅使用.map= 真的,
               图例名称= “PS”)

用户会发现,例如,来自PS5的大脑基因显著富集。

现在我们可以使用选择基因集()函数来自我的TAI.请请注意选择基因集()只能与一起使用仅限于门地层图(仅use.map.=真参数)因为myTAI版本>0.3.0。

脑基因<- 选择基因集(表达式集=Drerio.Phylo地图,
                            基因集=德雷里奥。布莱恩。基因,
                            使用.only.map= 真的)

#仅选择源于PS5的大脑基因
脑基因。第5部分<-脑基因[哪一个(BrainGenes[,“珊瑚虫”]== 5), ]

#看看结果
(BrainGenes.PS5)
Phylostrata ZFIN_ID公司14851 5 ZDB-GENE-000210-614852 5 ZDB-GENE-000210-714853 5 ZDB-GENE-000328-4号14856 5 ZDB-GENE-000411-114857 5 ZDB-GENE-000427-4号14860 5 ZDB-GENE-000526-1

现在用户可以执行生物制品()函数以获取起源于PS5的大脑基因的功能注释。

为此,首先需要找到相应的基因id,如ZDB-GENE-000210-6.

#查找zfin.org id的筛选器
组织过滤器(“达尼奥·雷里奥”,主题= “zfin_id”)
名称描述数据集52带有zfin id的zfin_id drerio_gene_ensembl53带有zfin成绩单名称drerio_gene_ensembl的zfin_id_transcript_name103 zfin_id zfin id[例如ZDB-GENE-060825-136]drerio_GENE_ensembl274 with_zfin_id with zfin id drerio_gene_vega286 zfin_id zfin id[例如ZDB-GENE-121214-212]drerio_GENE_vega366带有zfin id的_zfin_id drerio_gene_ensembl367,带zfin_id_transcript_name,带zfin成绩单名称drerio_gene_ensembl417 zfin_id zfin id[例如ZDB-GENE-00825-136]drerio_GENE_ensembl588 with_zfin_id with zfin id drerio_gene_vega600 zfin_id zfin id[例如ZDB-GENE-121214-212]drerio_GENE_vega680带有zfin id的_zfin_id drerio_gene_ensembl681,带zfin_id_transcript_name,带zfin成绩单名称drerio_gene_ensembl731 zfin_id zfin id[例如ZDB-GENE-00825-136]drerio_GENE_ensembl902 with_zfin_id with zfin id drerio_gene_vega914 zfin_id zfin id[例如ZDB-GENE-121214-212]drerio_GENE_vega市场52 ENSEMBL_MART_ENSEMBL53 ENSEMBL_MART_ENSEMBL103 ENSEMBL_MART_ENSEMBL公司274 ENSEMBL_MART_ENSEMBL公司286 ENSEMBL_MART_ENSEMBL公司366 ENSEMBL_MART_ENSEMBL公司367 ENSEMBL_MART_ENSEMBL公司417 ENSEMBL_MART_ENSEMBL588 ENSEMBL_MART_ENSEMBL600 ENSEMBL_MART_ENSEMBL680 ENSEMBL_MART_ENSEMBL681 ENSEMBL_MART_ENSEMBL公司731 ENSEMBL_MART_ENSEMBL902 ENSEMBL_MART_ENSEMBL914 ENSEMBL_MART_ENSEMBL

现在用户可以检索相应的GO属性D。雷里奥具有组织属性.

#D.rerio的find-go属性项
组织属性(“丹尼尔·雷里奥”,主题= “开始”)
名称描述33 go_id go术语加入36 go_linkage_type go术语证据代码38个goslim_goa_accession goslim goa加入39 goslim_goa_description goslim goa描述516 ggorilla_homologe_ensembl_gene大猩猩集合基因ID517 ggorilla_homologic_canomic_transcript_protein标准蛋白或转录ID518 ggorilla_homolog_ensembl_pepteptideGorilla ensembl蛋白质ID519 ggorilla_homologe_chromose大猩猩染色体名称520 ggorilla_homologe_chromostart大猩猩染色体起始(bp)521 ggorilla同源染色体末端大猩猩染色体末端(bp)522 ggorilla_Homology_orthology_type同源类型523 ggorilla_homolog_subtype祖先524 ggorilla_homology_orthology_confidence矫形置信度[0低,1高]525 ggorilla_homologe_perc_id%查询基因的身份526 ggorilla_homology_perc_id_r1%与大猩猩基因的同源性527 ggorilla _同源_dn dn528 ggorilla _同源_ ds ds1240 go_id go id1241快速入门快速入门ID1370 go_id go术语加入1373 go_linkage_type go术语证据代码1375 goslim_goa_accession goslim goa加入1376 goslim_goa_description goslim goa描述1853 ggorilla_homologe_ensembl_gene大猩猩集合基因ID1854 ggorilla_homologic_canomic_transcript_protein标准蛋白或转录ID1855 ggorilla_homologe_ensembl_peptide大猩猩集合蛋白质ID1856 ggorilla_homologe_chromose大猩猩染色体名称1857 ggorilla_homologe_chromostart大猩猩染色体起始(bp)1858 ggorilla同源染色体末端大猩猩染色体末端(bp)1859 ggorilla_Homology_orthology_type同源类型1860 ggorilla_同源_子型祖先1861 ggorilla_homology_orthology_confidence矫形置信度[0低,1高]1862 ggorilla_homologe_perc_id%查询基因的身份1863 ggorilla_homolog_perc_id_r1%关于大猩猩基因的身份1864 ggorilla _同源_ dn dn1865 ggorilla _同源_ ds ds2577 go_id go id2578快速入门快速入门ID2707 go_id go术语加入2710 go_linkage_type go术语证据代码2712 goslim_goa_accession goslim goa加入2713 goslim_goa_description goslim goa描述3190 ggorilla_homologe_ensembl_gene大猩猩集合基因ID3191 ggorilla_homologic_canomic_transcript_protein标准蛋白或转录ID3192 ggorilla_homolog_ensembl_pepteptideGorilla ensembl蛋白质ID3193 ggorilla_homologe_chromose大猩猩染色体名称3194 ggorilla_homologe_chromostart大猩猩染色体起始(bp)3195 ggorilla_homologe_chrome_end大猩猩染色体末端(bp)3196 ggorilla_Homology_orthology_type同源类型3197 ggorilla_homolog_subtype祖先3198 ggorilla_homology_orthology_confidence矫形置信度[0低,1高]3199 ggorilla_homology_perc_id%查询基因的身份3200 ggorilla_homology_perc_id_r1%与大猩猩基因的同源性3201 ggorilla _同源_ dn dn3202 ggorilla _同源_ ds ds3914 go_id go id3915快速入门快速入门ID数据集集市33 drerio_gene_ensembl ensembl_MART_ensembl36 drerio_gene_ensembl ensembl_MART_ensembl38 drerio_gene_ensembl ensembl_MART_ensembl39 drerio_gene_ensembl ensembl_MART_ensembl516 drerio_gene_ensembl ensembl_MART_ensembl517 drerio_gene_ensembl ensembl_MART_ensembl518 drerio_gene_ensembl ensembl_MART_ensembl519 drerio_gene_ensembl ensembl_MART_ensembl520 drerio_gene_ensembl ensembl_MART_ensembl521 drerio_gene_ensembl ensembl_MART_ensembl522 drerio_gene_ensembl ensembl_MART_ensembl523 drerio_gene_ensembl ensembl_MART_ensembl524 drerio_gene_ensembl ensembl_MART_ensembl525 drerio_gene_ensembl ensembl_MART_ensembl编号526 drerio_gene_ensembl ensembl_MART_ensembl527 drerio_gene_ensembl ensembl_MART_ensembl528 drerio_gene_ensembl ensembl_MART_ensembl1240年drerio_gene_vega ENSEMBL_MART_ENSEMBL1241 drerio_gene_vega ENSEMBL_MART_ENSEMBL1370年drerio_gene_ensembl ensembl_MART_ensembl1373 drerio_gene_ensembl ensembl_MART_ensembl1375年drerio_gene_ensembl ensembl_MART_ensembl1376年drerio_gene_ensembl ensembl_MART_ensembl1853年drerio_gene_ensembl ensembl_MART_ensembl1854 drerio_gene_ensembl ensembl_MART_ensembl编号1855年drerio_gene_ensembl ensembl_MART_ensembl1856年drerio_gene_ensembl ensembl_MART_ensembl1857年drerio_gene_ensembl ensembl_MART_ensembl1858年drerio_gene_ensembl ensembl_MART_ensembl1859 drerio_gene_ensembl ensembl_MART_ensembl公司1860年drerio_gene_ensembl ensembl_MART_ensembl1861年drerio_gene_ensembl ensembl_MART_ensembl1862年drerio_gene_ensembl ensembl_MART_ensembl1863年drerio_gene_ensembl ensembl_MART_ensembl1864年drerio_gene_ensembl ensembl_MART_ensembl1865年drerio_gene_ensembl ensembl_MART_ensembl2577 drerio_gene_vega ENSEMBL_MART_ENSEMBL2578 drerio_gene_vega ENSEMBL_MART_ENSEMBL2707 drerio_gene_ensembl ensembl_MART_ensembl2710 drerio_gene_ensembl ensembl_MART_ensembl2712 drerio_gene_ensembl ensembl_MART_ensembl2713 drerio_gene_ensembl ensembl_MART_ensembl3190 drerio_gene_ensembl ensembl_MART_ensembl3191 drerio_gene_ensembl ensembl_MART_ensembl3192 drerio_gene_ensembl ensembl_MART_ensembl3193 drerio_gene_ensembl ensembl_MART_ensembl3194 drerio_gene_ensembl ensembl_MART_ensembl3195 drerio_gene_ensembl ensembl_MART_ensembl3196 drerio_gene_ensembl ensembl_MART_ensembl3197 drerio_gene_ensembl ensembl_MART_ensembl3198 drerio_gene_ensembl ensembl_MART_ensembl3199 drerio_gene_ensembl ensembl_MART_ensembl编号3200 drerio_gene_ensembl ensembl_MART_ensembl3201 drerio_gene_ensembl ensembl_MART_ensembl公司3202 drerio_gene_ensembl ensembl_MART_ensembl3914 drerio_gene_vega ENSEMBL_MART_ENSEMBL3915 drerio_gene_vega ENSEMBL_MART_ENSEMBL

现在用户可以指定过滤器zfin_id和属性go_id(_I)检索相应基因id的GO项(请注意,这需要一些时间)。

#检索源于PS5的雷氏梭菌脑基因的GO项
政府_预算。脑基因<- 生物标记(基因= 未列出的(BrainGenes.PS5[,“ZFIN_ID”]),
                             市场= “ENSEMBL_MART_ENSEMBL”,
                             数据集= “drerio_gene_ensembl”,
                             属性= “go_id”,
                             过滤器= “zfin_id”)

(GO_tbl.脑基因)
zfin_id go_id1 ZDB-GENE-000210-6编号:00600372 ZDB-GENE-000210-6编号:00469833 ZDB-GENE-000210-7 GO:00469834 ZDB-GENE-000328-4编号:00072755 ZDB-GENE-000328-4编号:00071666 ZDB-GENE-000328-4编号:0035567