跳到内容

drostlab/myTAI公司

存储库文件导航

我的TAI

rstudio镜像下载 rstudio镜像下载 纸张链接 用bioconda安装 访问者

进化转录组学与R

动机

在过去的几年中,各种研究旨在从进化发展的角度揭示形态创新和变异的分子基础。这些研究通常依赖转录组数据来建立驱动表型可塑性背后复杂生物过程的分子模式。

虽然转录组信息是研究感兴趣的生物过程(分子表型)的分子机制的一个有用的开始,但它们很少捕获怎样这些表达模式最初出现于什么程度它们可能受到限制,从而忽略了对整个表达转录物库有贡献的基因的进化历史和发育限制。

为了克服这个限制我的TAI程序包引入了术语下总结的程序进化转录组学将基因年龄信息整合到经典的基因表达分析中。基因年龄推断可以使用执行各种现有软件,但我们建议使用GenEra公司正射图,因为它们解决了基因年龄推断(请参阅此处的详细讨论). 此外,用户可以轻松检索预先计算的基因年龄信息通过我们的数据包体液图.

进化转录组学研究可以作为筛选的第一种方法生物信息学在感兴趣的生物过程中可能存在进化和发展约束。这是通过量化转录组保护模式及其在生物过程中的潜在基因集来实现的。中实现的探索性分析功能我的TAI为用户提供一个标准化、自动化和统计完善的框架,以检测和分析任何感兴趣的转录组数据集中的进化约束模式。

提供的详细文件在这里

引用

使用时请引用以下论文我的TAI用于您自己的研究。这将使我能够继续开发这个软件工具,并激励我在未来几年扩展其功能和可用性。提前致谢!

Drost等人。myTAI:R的进化转录组学.生物信息学2018, 34 (9), 1589-1590.数字对象标识代码:10.1093

依赖项

我的TAI正在使用开放式多媒体播放器要并行运行cpp代码,可能需要安装其他软件。

雨衣:

brew安装llvm libomp光盘/usr/local/libln-s/usr/local/opt/libomp/lib/libomp.dylib/库comp.dylib

Linux:

  1. 检查是否有支持OpenMP的编译器:打开终端并运行命令gcc—版本g++--版本检查是否安装了GNU编译器集合(GCC)。OpenMP支持通常包含在GCC中。

    如果没有安装GCC,可以使用发行版的包管理器进行安装。例如,在Ubuntu上,可以使用sudo apt-get install build-essential安装GCC。

  2. 安装libomp库:打开终端并运行适用于包管理器的命令:

    在基于Ubuntu或Debian的系统上:sudo apt-get安装libomp-devsudo apt安装libomp-dev

    在Fedora或CentOS系统上:sudo-dnf安装libomp-devel

    在Arch Linux上:sudo pacman-S libomp

窗户:

在Windows上,最常见的OpenMP实现由Microsoft Visual C++(MSVC)编译器提供,默认情况下,该编译器包含OpenMP支持。因此,如果您使用MSVC作为C++编译器,那么您应该在没有任何附加安装的情况下支持OpenMP。

安装

用户可以安装我的TAICRAN(起重机):

#从CRAN安装myTAI 0.9.3安装.包("我的TAI",依赖项 = 真的)#安装包含最新功能的开发人员版本
开发工具::安装github("drostlab/myTAI公司")

短包装说明

使用我的TAI,任何现有或新生成的转录组数据集都可以与进化信息相结合(查找此处显示详细信息)检索有关转录组进化保护的新见解。

为了进行大规模的进化转录组学研究我的TAI该软件包实现了量化、统计评估和分析功能,允许研究人员通过确定转录组数据中进化保护或变异的阶段或周期来研究生物过程的进化。

我们希望我的TAI将成为执行进化转录组学研究的社区标准工具,我们很乐意根据要求添加所需的功能。

科学背景

如今,诸如形态突变、疾病或发育过程等现象主要是使用转录组学方法在分子水平上进行研究的。转录组表示生物过程中特定阶段存在的可量化转录的总数。在疾病或发育(缺陷)研究中,转录组通常在几个时间点进行测量。在旨在量化因生物刺激、非生物刺激或疾病导致的转录组差异的治疗研究中,通常对治疗/疾病转录组与非治疗/非疾病转录组进行比较。无论是哪种情况,通过比较转录组随时间的变化还是不同治疗方法之间的变化,我们可以确定基因和基因调控机制,这些可能与控制研究的生物过程有关。虽然经典的转录组学研究是基于既定的方法论,但对于此类转录组的进化和保护机制知之甚少。然而,理解转录组随时间变化的进化机制可能会给我们提供一个新的视角,让我们了解疾病是如何首先出现的,或者发育转录组的变化是如何触发形态变化的。

进化转录组学旨在捕捉和量化在感兴趣的生物过程的特定阶段对转录组有贡献的基因的进化保守性。由此产生的时间守恒模式然后能够检测发育阶段或其他生物过程进化上是保守的(Drost等人,2018年). 通过转录组指数(例如。转录组年龄指数或转录组差异指数)旨在量化平均进化年龄Barrera-Redondo等人,2022年或序列守恒Drost等人,2015年在特定阶段参与转录组的基因。一般来说,进化转录组学可以作为一种方法来量化转录组在特定发育阶段的进化保守性,并研究生物过程中的转录组是如何由于进化历史中的事件而受到限制或引导的(多洛定律)(Drost等人,2017年).

请注意,由于myTAI依赖于基因年龄推断,并且在过去几年中,关于基因年龄推断的最佳方法存在广泛的争论,请跟着我的关于基因年龄推断文献的最新讨论。使用GenEra公司,我们解决了以前提出的所有问题,并鼓励用户运行GenEra公司当旨在进一步推断基因年龄时我的TAI分析。

新闻

包的当前状态以及每个版本的功能我的TAI可以在中找到新闻第节。

教程

以下教程将提供用例和详细解释如何使用我的TAI以及如何解释使用该软件工具生成的结果。

例子

加载示例数据

图书馆(我的TAI)#包含拟南芥胚胎发育7个阶段的示例数据集数据("PhyloExpressionSet示例")#将绝对表达式级别转换为log2表达式级别
Expr示例 <-tf公司(PhyloExpressionSet示例,日志2)

使用TAI量化转录组保护

#可视化全球转录组年龄指数模式绘图签名(Expr示例)

绘图签名

量化每个基因年龄类别的表达水平分布

#绘制每个年龄(=PS)类别的表达水平分布
#和每个发展阶段绘图类别表达式(Expr示例,"PS(聚苯乙烯)")

绘图类别表达式

量化个体基因年龄类别的平均表达

#按老年人划分的各年龄组的平均表达图(PS1-3)
#与年轻(PS4-12)基因绘图方式(Expr示例, = 列表(1:,4:12))

plotMeans表示

量化由老基因和年轻基因分离的每个年龄组的相对平均表达

#绘制按年龄划分的各年龄组的相对平均表达(PS1-3)
#与年轻(PS4-12)基因绘图RE(Expr示例, = 列表(1:,4:12))

绘图RE

#绘制基因表达分布之间的显著差异
#老(=第1组)与年轻(=第2组)基因的比较绘图组差异(表达式集 = Expr示例,        = 列表(组_1 = 1:,组2 = 4:12),图例名称    = "PS(聚苯乙烯)",绘图类型     = "箱形图")

开始使用我的TAI

用户还可以阅读中的教程(R工作室) :

#获取myTAI包的源代码图书馆(我的TAI)#查找myTAI包中提供的所有教程(小插曲)
#这将打开您的web浏览器浏览幻影("我的TAI")#或作为单个教程

#开放教程:植物学和myTAI简介渐晕("介绍",包裹 = "我的TAI")#开放教程:Phylotranscryptomics的中间概念渐晕("中级",包裹 = "我的TAI")#开放教程:Phylotranscryptomics的高级概念渐晕("高级",包裹 = "我的TAI")#开放教程:年龄丰富分析渐晕("丰富",包裹 = "我的TAI")#开放教程:使用myTAI进行基因表达分析渐晕("表达式",包裹 = "我的TAI")#开放教程:使用myTAI进行分类信息检索渐晕("分类学",包裹 = "我的TAI")#开放教程:讨论基因组植物地层学渐晕("植物地层学",包裹 = "我的TAI")

我的TAI框架用户可以找到:

系统发育转录组学测量:

  • TAI():计算转录组年龄指数(TAI)的函数
  • TDI():计算转录组差异指数(TDI)的函数
  • TPI():计算转录组多态性指数(TPI)的函数
  • REMatrix()公司:用于计算所有门层或分流层的相对表达剖面的函数
  • RE():将平均表达式级别转换为相对表达式级别的函数
  • pTAI():计算植物层对全球TAI的贡献
  • pTDI():计算发散层对全球TDI的贡献
  • pMatrix():计算部分TAI或TDI值
  • p斯特拉塔():计算部分地层值

可视化和分析工具:

  • 绘图签名():绘制转录组进化特征的主要可视化功能
  • 绘图模式():基本图形功能用于绘制转录组的进化签名
  • 绘图贡献():绘制累计转录组指数
  • 绘图相关性():用于绘制层系值和分流层值之间的相关性的函数
  • 绘图仪():用于绘制相对表达式配置文件的函数
  • PlotBarRE():将藻层或分流层类的平均相对表达水平绘制为条形图的函数
  • PlotMeans():绘制年龄类别平均表达谱的函数
  • 绘图中值():用于绘制年龄类别的中位数表达曲线的函数
  • 绘图变量():用于绘制年龄类别的表达式方差配置文件的函数
  • 绘图分布():绘制相应年龄类别内基因频率分布的功能
  • 绘图类别表达式():将每个年龄或分歧类别的表达水平绘制为Barplot或Violinplot
  • 绘图扩展():绘制给定基因集的叶层或分流层富集图
  • PlotGeneSet():绘制基因集的表达谱
  • 绘图组差异():绘制PS或DS组的基因表达分布之间的显著差异
  • 绘制所选年龄分布():绘制一组选定基因的PS或DS分布

统计框架和测试统计:

  • 扁平线测试():执行扁平线测试量化观测数据的统计显著性系统转录组学模式(与frat线的显著偏差=进化信号)
  • 减少沙漏测试():执行还原沙漏试验从统计学上评估了门穿性沙漏模式的存在(沙漏模型)
  • 早期保守测试():执行还原性早期保存试验它从统计学上评估了一种单调递增的藻型转录模式的存在(早期保守性模型)
  • 最新保守测试():执行还原性后期保存测试它从统计学上评估了存在单调递减的门转录模式(早期发散模型)
  • 反转沙漏测试():执行反向沙漏试验统计评估反向沙漏模式(低-高-低)的存在
  • 成对测试():执行两两差异测试统计评估两个对照(例如男性与女性样本)之间TAI(或TDI)的差异。
  • 强化测试():基于Fisher检验的给定基因集的叶层或分流层富集
  • bootMatrix()(引导矩阵):计算测试统计的排列矩阵

所有功能还包括可视化分析工具,以量化测试统计的优点。

差异基因表达分析

  • 差异基因():实施流行的差异基因表达分析方法
  • 折叠副本():在表达式集中合并复制
  • 组合重要性():计算每个重复组合的统计显著性
  • 快递():筛选基因表达矩阵中的表达水平(定义表达基因)
  • 选择基因集():选择ExpressionSet中的基因子集
  • 绘图复制质量():绘制生物复制品的质量图
  • 组差异():量化PS或DS组基因表达分布之间的显著差异

分类信息检索

  • 分类学():检索任何感兴趣生物体的分类信息

用于更好的可用性和附加分析的次要功能

  • 匹配映射():将地层图或散度图与表达式矩阵匹配
  • tf():转换基因表达水平
  • tfPS():变换地层标高
  • tf稳定性():在不同变换下执行置换测试
  • 年龄.apply():年龄类别特定应用功能
  • ecScore():计算早期保守测试的沙漏分数
  • lcScore():计算最近保守测试的沙漏分数
  • 配对分数():计算成对测试的成对测试分数
  • 地理平均值():几何平均值
  • harm.mean():调和平均值
  • 省略矩阵():计算忽略给定基因的TAI或TDI配置文件
  • rhScore():计算减少沙漏测试的沙漏分数
  • reversehourglassScore():计算反向沙漏测试的反向沙漏分数

成功使用的研究我的TAI量化转录组保护:

  • 后生动物双相生命周期的进化转录组学支持后生动物幼虫的单一插入起源J Wang,L Zhang,S Lian,Z Qin,X Zhu,X Dai,Z Huang等人-自然生态与进化, 2020

  • 普遍收敛进化和极端表型定义了蛋白质稳态的伴侣需求Y Draceni、S Pechmann-美国国家科学院院刊, 2019

  • 重建玉米和高粱的转录个体发生支持花序发育的逆沙漏模型S Leiboff、S Hake-当代生物学, 2019

  • 动物的单细胞亲属通过肌动球蛋白依赖性细胞化产生一层极化细胞O Dudin、A Ondracka、X Grau-Bové、AAB Haraldsen等人-电子生活, 2019

  • 动植物胚胎发生中主动维持藻型转录沙漏模式的证据HG Drost、A Gabel、I Grosse、M Quint-分子生物学与进化, 2015

  • 三种螺旋体发育动物的基因表达不支持沙漏模型L Wu、KE Ferger、JD Lambert-分子生物学与进化, 2019

  • 秀丽隐杆线虫个体细胞类型的转录组年龄F Ma、C Zheng-美国国家科学院院刊, 2023

  • 多倍体小麦及其二倍体祖先在胚胎发生和籽粒发育过程中的转录景观D Xiang、TD Quilichini、Z Liu、P Gao、Y Pan等人-植物细胞, 2019

  • 枯草芽孢杆菌生物膜发育过程中的类胚特征M Futo、L Opašić、S Koska、N Chorak、TŠiroki、V Ravikumar、A Thorsell、M Lenuzzi、D Kifer、M Domazet-Lošo、K Vlahovićek、i Mijakovic、T Domazet-Roš-分子生物学与进化, 2021

  • 竹茎快速生长中新基因与近期全基因组重复的相互作用G Jin、P-F Ma、X Wu、L Gu、M Long、C Zhang、DZ Li-分子生物学与进化, 2021

  • 四种双耳动物模型物种基因组进化的发育限制J Liu,M Robinson雷查维-基因组生物学与进化, 2018

  • 黑腹果蝇胚胎解剖中的定位选择I Salvador-Martínez等人-分子生物学与进化, 2017

  • 真菌中多糖降解酶的分布和多样性R Berlemont公司-科学报告, 2017

  • 人类非编码RNA调节网络的起源和进化史M Sherafatian,SJ Mowla先生-生物信息学和计算生物学杂志, 2017

  • 用无标签质谱法阐明炎症性关节炎的内源性滑液蛋白质组和肽组SM Mahendran、EC Keystone、RJ Krawetz等人-临床蛋白质组学, 2019

  • 层位:一个层位地层学框架Z Arendsee、J Li、U Singh、A Seetharam等人-生物信息学, 2019

  • 普遍收敛进化和极端表型定义了蛋白质稳态的伴侣需求Y Draceni、S Pechmann-生物Rxiv, 2019

  • 环境DNA揭示湿地植物群落的景观镶嵌ME Shackleton、GN Rees、G Watson等人-全球生态与保护, 2019

  • 基于共生性的门地层学和基因起源分类算法Z Arendsee-2019年

  • 新基因在trochohore的高表达对trochozoans个体发育和进化的启示F Xu、T Domazet Lošo、D Fan、TL Dunwell、L Li等人-科学报告, 2016

  • 发育过程中人脑中催产素受体的表达模式J Rokiki、T Kaufmann、A-MG de Lange、D van der Meer、S Bahrami、AM Sartorius、UK Haukvik、NE Steen、E Schwarz、DJ Stein、T Nrland、OA Andreassen、LT Westlye、DS Quintana-神经心理药物, 2022

  • 真菌的体表转录沙漏模式:一个更新的模型Y Xie、HS Kwan、PL Chan、WJ Wu、J Chiou、J Chang生物Rxiv, 2022

  • 九头蛇生殖系和体干细胞谱系的古老分裂C西米亚·福吉萨瓦(C Nishimiya-Fujisawa)、H Petersen、TC-T Koubková-Yu、C野田佳彦(C Noda)、S Shigenobu、J Bageritz、T藤泽、O Simakov、S Kobayashi、TW Holstein-生物Rxiv, 2023

  • 褐藻中的转录组沙漏JS Lotharukpong、M Zheng、R Luthringer、H-G Drost、SM Coelho-生物Rxiv, 2024

讨论和错误报告

我很乐意了解更多关于概念和功能的潜在改进此软件包中提供。

此外,如果您发现一些错误或需要其他(更灵活的)部件功能请告知我:

https://github.com/drostlab/myTAI/issues网站

工具书类

Domazet-Lošo T.和Tautz D。基于系统发育的转录组年龄指数反映了个体发育差异模式.自然(2010) 468: 815-8.

Quint M、Drost HG等人。植物胚胎发生中的转录组沙漏.自然(2012) 490: 98-101.

Drost HG、Gabel A、Grosse I、Quint M。动植物胚胎发生中主动维持叶绿体转录沙漏模式的证据.分子生物学。进化。(2015) 32 (5): 1221-1231.

Drost HG、Bellstädt J、Oh’Maoili idigh DS、Silva AT、Gabel A、Weinholdt C、Ryan PT、Dekkers BJW、Bentsink L、Hilhorst H、Ligterink W、Wellmer F、Grosse I和Quint M。胚后沙漏图案标志着植物发育中的个体遗传转变.分子生物学。进化。(2016)doi:10.1093/molbev/msw039

确认

我想感谢几个人使这个项目成为可能。

首先,我要感谢伊沃·格罗斯和马塞尔·昆特为我提供了一个位置以及能够就埃沃·德沃研究的迷人主题开展工作的环境,以及促成此类项目的富有成果的讨论。

此外,我还要感谢亚历山大·加贝尔和扬·格劳的宝贵讨论关于如何改进本包中某些分析的一些方法学概念。

我还要感谢我过去的硕士生:莎拉·沙芬伯格、安妮·霍夫曼和塞巴斯蒂安·吴索他对这个包进行了深入的研究,帮助我改进了包环境的可用性和逻辑。