×

复杂基因组数据网络依赖结构的小样本分析和推断。 (英语) Zbl 1109.62109号

慕尼黑:慕尼黑大学,Fakultät für Mathematik,Informatik und Statistik(Diss.)。108页。(2005).
摘要:目前的工作是关于遗传网络的建模和推断。关联和依赖结构在系统生物学中无处不在。当前的基因表达数据集包含大量变量,但样本很少(“小(n),大(p)”)。因此,图形模型的应用是一个需要显式正则化的不适定(逆)问题。在这篇论文中,我提出了几种新的协方差和(偏)相关估计。这些是基于通过引导聚合或收缩来减少方差的。新型收缩估计器利用了一个确定最佳收缩强度的分析公式,与标准估计器相比,它具有特别明显的优势:除了提高效率和准确性外,它总是正定且条件良好的。对于推断网络拓扑,特别关注基于条件独立概念的图形高斯模型(GGM)。介绍了一种模型选择过程,该过程使用了假发现率多重测试和零分布的自适应估计。所提出的小样本框架在计算上是高效的,并且与竞争方法相比,无论是在模拟中还是在实际表达式数据的应用中,都表现得非常好。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
92C40型 生物化学、分子生物学
05C90年 图论的应用
PDF格式BibTeX公司 XML格式引用