跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2016年7月27日;44(13):e117。
doi:10.1093/nar/gkw430。 Epub 2016年5月13日。

TSCAN:单细胞RNA-seq分析中的伪时间重建和评估

附属公司

TSCAN:单细胞RNA-seq分析中的伪时间重建和评估

志诚记等。 核酸研究. .

摘要

在分析单细胞RNA-seq数据时,根据转录体的渐变构建一条假时间路径来排序细胞是研究异质细胞群中基因表达动力学的一种有用方法。目前,可用于此任务的计算工具数量有限,并且缺乏用于比较不同工具的定量方法。单细胞分析工具(TSCAN)是一种软件工具,用于更好地支持单细胞RNA-seq分析中的硅伪时间重建。TSCAN使用基于聚类的最小生成树(MST)方法对单元进行排序。首先将细胞分组为簇,然后构建MST以连接簇中心。伪时间是通过将每个细胞投影到树上来获得的,细胞的有序序列可以用于研究基因表达沿伪时间的动态变化。在构造MST之前对单元进行聚类,降低了树空间的复杂性。这通常会改进单元排序。它还允许用户根据先验知识方便地调整排序。TSCAN具有图形用户界面(GUI),可支持数据可视化和用户交互。此外,还制定了定量措施,以客观评估和比较不同的伪时间重建方法。TSCAN位于https://github.com/zji90/TSCAN以及作为生物导体封装。

PubMed免责声明

数字

图1。
图1。
TSCAN概述。(A类B类)说明限制的玩具示例基于细胞的MST。此处,单元格(蓝色圆圈)放置在二维空间中真正的生物时间是自上而下的。连接单元格的MST不是唯一的。两者都有(A) 和(B)是可能的解决方案。(B) 更符合事实。然而,在事实上,随机测量噪声可能会使标有“*”的单元远离其他单元箭头和虚线所示的单元格。因此,(B)不再是MST。另一方面,(A)中的MST并不反映细胞的真实顺序。(C类)如果首先将相似的单元格分组,则可以找到真正的时间轴然后构建一个MST来连接集群中心。(D类)TSCAN首先构建了基于聚类的MST(由不同的以颜色为例;数字表示集群中心)。树可以有多路径(例如1-2-3-4或1-2-3-5)。TSCAN通过以下方式对每条路径上的单元进行排序将每个单元格投影到树边缘。(电子)本金的数量通过找到最佳分段线性拟合来确定要保留的分量两行(虚线)。
图2。
图2。
TSCAN图形用户界面。左侧面板包含功能菜单和工具设置参数。右侧面板显示数据和结果。顶部散点图显示为LPS数据构建的MST(参见结果)。单元格(点)的显示基于它们的前两个主要组成部分。细胞簇由不同的颜色。数字是集群中心。标记基因BCL3的表达水平为每个单元格。较大的标记大小意味着较高的表达。底部图显示了平均值每个树节点的BCL3表达式,在所有节点中标准化为零均值和单位标准偏差。
图3。
图3。
使用518在HSMM数据集中进行TSCAN分析先验的选择用于伪时间重建的基因。(A类)TSCAN报告的MST为显示在由前三台PC跨越的三维空间中公式图像. (B类)用户可以显示单元格和MST在选定的PC中(例如PC1和PC2)。(C类)ENO3的平均表达水平每个集群。(D类)各组SPHK1的平均表达水平。in(C)和(D)在所有集群中都是标准化的,具有零平均值和单位标准偏差。
图4。
图4。
在伪时间为基于518构建先验的选择的基因。(A类)POS得分。(B类)由平均值衡量的稳健性100个独立扰动的相似性得分。热图显示了每个扰动方案中的每个方法。细胞扰动:细胞级扰动。Expr公司扰动:表达级扰动。(C类)金本位平均等级基因。(D类)顶级差异中检测到的金标准基因数基因。
图5。
图5。
使用伪时间的所有基因对HSMM数据进行GUI和TSCAN分析的演示重建。(A类)TSCAN利用所有基因构建MST。(B类)用户可以在GUI中选择标记基因以可视化其表达。(C类)用户可以通过指定要包含的集群和来定义路径他们的订单(D类)SPHK1在每个聚类中的平均表达。(电子)每个簇中ENO3的平均表达。
图6。
图6。
在伪时间为使用所有基因构建。(A类)POS得分。(B类)稳健性由100个独立扰动的平均相似性得分测量。(C类)金标准基因的平均等级。(D类)数量在顶级差异基因中检测到金标准基因。
图7。
图7。
构建假时间的HSMM数据集中MEF2C和MYH2表达模式使用所有基因。每个细胞中每个基因的表达都是假时间轴上的细胞顺序。实心曲线是拟合的GAM函数。这个虚线是ENO3的GAM拟合,ENO3是用于确定路径的标记基因方向。
图8。
图8。
LPS数据集中不同方法的评估结果。(A类)POS得分。(B类)通过100的平均相似性得分衡量稳健性独立扰动。(C类)金标准基因的平均等级。(D类)顶级差异中检测到的金标准基因数基因。
图9。
图9。
LPS数据集中的STAT2表达模式。绘制每个单元格中的STAT2表达式作为伪时间轴上细胞顺序的函数。橙色曲线是拟合的GAM功能。
图10。
图10。
qNSC数据集中不同方法的评估结果。(A类)通过100个独立样本的平均相似性得分衡量稳健性扰动。(B类)金标准基因的平均等级。(C类)在顶级差异基因中检测到的金标准基因数。

类似文章

引用人

工具书类

    1. Tang F.、Barbacioru C.、Wang Y.、Nordman E.、Lee C.、Xu N.、Wang X.、Bodeau J.、Tuch B.B.、Siddiqui A.等,单个细胞的mRNA-Seq全转录组分析。自然方法。2009;6:377–382.-公共医学
    1. Tang F.、Barbacioru C.、Bao S.、Lee C.、Nordman E.、Wang X.、Lao K.、Surani M.A.通过单细胞RNA-Seq分析追踪胚胎干细胞从内细胞团的起源。细胞干细胞。2010;6:468–478.-项目管理咨询公司-公共医学
    1. Mortazavi A.、Williams B.A.、McCue K.、Schaeffer L.、Wold B.通过RNA-Seq对哺乳动物转录体进行定位和量化。自然方法。2008;5:621–628。-公共医学
    1. Wang Z.,Gerstein M.,Snyder M.RNA-Seq:转录组学的革命性工具。Nat.Rev.基因。2009;10:57–63.-项目管理咨询公司-公共医学
    1. Schena M.、Shalon D.、Davis R.W.、Brown P.O.使用互补DNA微阵列定量监测基因表达模式。科学。1995;270:467–470.-公共医学

出版物类型