lpc公司

lpc:用于测试特征显著性的套索主成分:“用套索主成分测试特征的显著性”。我们考虑在高维环境中测试特征重要性的问题。特别是,我们在微阵列实验中测试差异表达的基因。我们希望找出与某些类型的结果相关的基因,例如生存时间或癌症类型。我们提出了一种新的程序,称为Lassoed Principle Components(LPC),它建立在现有方法的基础上,可以提供相当大的改进。例如,在两类数据的情况下,一个标准的(尽管很简单)方法可能是计算每个基因的两个样本t统计量。LPC方法包括将这些传统的基因得分投影到基因表达数据协方差矩阵的特征向量上,然后应用l1惩罚来去除结果的噪声。我们提出了一个理论框架,在这个框架下,LPC是识别重要基因的逻辑选择,并且我们表明LPC在真实数据和模拟数据上都比传统方法显著降低了错误发现率。此外,这种灵活的程序可以应用于各种类型的数据,并且可以用来改进许多现有的重要特征识别方法。