跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
比较研究
.2005年6月29日:6:165。
doi:10.1186/1471-2105-6-165。

识别多个SAGE库中的差异表达:一种过度分散的对数线性模型方法

附属公司
比较研究

识别多个SAGE库中的差异表达:一种过度分散的对数线性模型方法

陆军等。 BMC生物信息学. .

摘要

背景:在涉及基因表达文库多序列分析的差异基因表达测试中,解释文库之间和文库内的变异至关重要。已经提出了几种方法,包括t检验、tw检验和过度分散逻辑回归方法。然而,这些测试的优点尚未得到充分评估。关于是否可以进一步改进,仍然存在疑问。

结果:本文介绍了一种分析SAGE的超离散对数线性模型方法;我们评估了它的性能,并与其他三种测试进行了比较:两样本t测试、tw测试和另一种基于过度离散logistic线性回归的测试。对模拟数据集和实际数据集的分析表明,对数线性和logistic过分散方法的性能通常优于t检验和tw检验;进一步发现,对数线性方法比logistic方法具有更好的性能,在一系列参数值和不同的数据分布上表现出相等或更高的统计能力。

结论:过度分散的对数线性模型为分析涉及多个库的SAGE实验提供了一个有吸引力且可靠的框架。为了方便起见,可以通过用户友好的web界面实现此方法,网址为http://www.cbcb.duke.edu/sage。

PubMed免责声明

数字

图1
图1
基于贝塔二项分布模拟数据的比较该图显示了四个测试的接收机工作特性曲线(ROC),这些测试应用于由具有不同过分散程度的贝塔二项分布生成的数据集(φ)(显示在每个图表的顶部)。对于特定的φ,模拟10000个观测值(标签);5000是根据以下假设生成的第页A类=第页B类剩下的来自第页B类=2第页A类,其中第页A类第页B类是两组的平均比例第页A类=0.0002(即50000中的10)。有关在其他条件下生成的图形,请参阅附加文件1。
图2
图2
基于负二项分布模拟数据的比较四项测试的ROC曲线基于负二项分布产生的数据集,该分布具有不同的过度分散程度(φ). 数据通过图1中使用的相同策略进行模拟,除了第页B类= 4第页A类注意,此处的过分散参数与图1中的参数(参数φ因为负二项式与β二项式没有直接关系)。有关在其他条件下生成的图形,请参见附加文件2。
图3
图3
比较第页-logit中的值-t吨测试和日志中的测试-t吨测试前100个标签中(根据第页-值)-t吨通过日志进行测试-t吨测试,82是共同的,这两个测试都留下了18个标签,而这些标签不在另一个测试识别的前100个标签中。这个第页-此处绘制了其余36个标签的两个测试值。圆圈代表logit排名前100位的18位-t吨测试和日志中的三角形-t吨测试。而logit标识的所有标签-t吨根据日志,测试的p值也相当低-t吨测试,日志标识的标签-t吨测试表明第页-符合logit的值-t吨测试。
图4
图4
标准化残差与估计比例的关系图。绘制了两组的标准化皮尔逊残差(y轴)与比例估计值(x轴)。标准化皮尔逊残差作为标准正态分布。这里显示了两个标签的模型拟合(在表5中的基因列表中);左边是使用过分散logistic模型拟合得出的结果,右边是使用过离散log-linear模型得出的结果。平均比例较低的组(正常)的残差方差较低,表明模型拟合较差。
图5
图5
过度分散估计的分布(公式图像). 估计值来自于与胰腺数据相匹配的过度分散的对数线性模型。图中未显示过度分散估计值为0的标签。

类似文章

引用人

工具书类

    1. Velculescu VE,Zhang L,Vogelstein B,Kinzler KW.基因表达的系列分析。[评论]科学。1995;270:484–487.-公共医学
    1. Zhang L,Zhou W,Velculescu VE,Kern SE,Hruban RH,Hamilton SR,Vogelstein B,Kinzler KW.正常和癌细胞的基因表达谱。科学。1997;276:1268–1272. doi:10.1126/science.276.5316.1268。-内政部-公共医学
    1. Riggins GJ,Strausberg RL.癌症基因组解剖项目的基因组和遗传资源。人类分子遗传学。2001;10:663–667. doi:10.1093/hmg/10.7.663。-内政部-公共医学
    1. Porter D、Lahti-Dominic J、Keshaviah A、Bae YK、Argani P、Marks J、Richardson A、Cooper A、Strausberg R、Riggins GJ、Schnitt S、Gabrielson E、Gelman R、Polyak K。乳腺导管原位癌的分子标记物。分子癌症研究:MCR。2003;1:362–375.-公共医学
    1. Audic S,Claverie JM。数字基因表达谱的意义。基因组研究。1997;7:986–995.-公共医学

出版物类型