从稀疏基因组数据推断大规模协方差矩阵是生物信息学中普遍存在的问题。显然,广泛使用的标准协方差和相关估计量不适合此目的。作为统计效率高且计算速度快的替代方案,我们提出了一种新的收缩协方差估计量,该估计量利用Ledoit-Wolf(2003)引理来分析计算最佳收缩强度。随后,我们将这种改进的协方差估计量(它保证了最小均方误差,条件良好,即使是小样本也总是正定的)应用于推断大规模基因关联网络的问题。我们表明,与其他竞争方法相比,它在模拟和实际表达数据应用中的性能都非常好。
©2011 Walter de Gruyter GmbH&Co.KG,柏林/波士顿