摘要
最近,超高通量RNA测序(RNA-Seq)被发展成为一种分析基因表达的方法。通过获得数千万甚至数亿次转录序列的读取,RNA-Seq实验可以对任何感兴趣的样本中的基因(转录物)数量进行全面调查。本文介绍了一种用于从RNA-Seq数据估计亚型丰度的统计模型,该模型具有足够的灵活性,可以容纳单端和双端RNA-Seq-数据以及沿着转录本长度的取样偏差。基于对该模型最小充分统计量的推导,给出了该模型最大似然估计量的计算可行实现。此外,研究表明,与固定测序深度的单端测序相比,使用配对末端RNA-Seq可以提供更准确的亚型丰度估计。并进行了仿真研究。
引用
下载引文
朱莉娅·萨尔兹曼。
惠江。
王永红(Wing Hung Wong)。
“RNA-Seq数据的统计建模”
统计师。科学。
26
(1)
62 - 83,
2011年2月。
https://doi.org/10.1214/10-STS343
问询处
发布日期:2011年2月
首次在欧几里得项目中提供:2011年6月9日
数字对象标识符:10.1214/10-STS343
关键词:Fisher信息,等值线丰度估算,最小充分性,配对端RNA-Seq数据分析
权利:版权所有©2011数学统计研究所