摘要

本文报告了对Affymetrix基因芯片中高密度寡核苷酸阵列数据的探索性分析®旨在改进当前使用的基因表达测量方法的系统。我们的分析使用了三个数据集:一个由五个MGU74A小鼠基因芯片组成的小型实验研究®阵列,是基因逻辑和惠氏遗传研究所进行的一项涉及95 HG‐U95A人类基因芯片的广泛尖峰研究的部分数据®阵列;以及Gene Logic对75 HG‐U95A基因芯片进行的稀释研究的一部分®数组。我们展示了完美匹配和不匹配探针的一些常见特征(颗粒物毫米)这些数据的值,并检查方差-均值与探针水平数据的关系,这些数据来自被认为有缺陷的探针,因此仅传递噪声。我们解释了为什么需要使用探测电平强度将阵列标准化。然后我们检查颗粒物毫米使用峰值数据并评估三种常用的汇总度量:Affymetrix(i)平均差(AvDiff)和(ii)MAS 5.0信号,以及(iii)Li和Wong基于模型的乘法表达指数(MBEI)。探测级数据的探索性数据分析激发了一种新的汇总测量,即背景调整、归一化和对数变换的稳健多阵列平均值(RMA)颗粒物值。我们使用稀释研究数据评估了四种表达汇总指标,根据偏差、方差和(MBEI和RMA)模型拟合评估了它们的行为。最后,我们评估了算法使用峰值数据检测已知差异表达水平的能力。我们得出的结论是,使用RMA并使用线性模型将标准误差(SE)附加到该数量上并没有明显的负面影响,该模型消除了探针特定的亲和力。

此内容仅以PDF格式提供。