跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2013年10月15日;29(20):2610-6.
doi:10.1093/bioinformatics/btt425。 Epub 2013年8月28日。

贝叶斯共识聚类

附属公司

贝叶斯共识聚类

埃里克·F·洛克等。 生物信息学. .

摘要

动机:在生物医学研究中,越来越多的平台和技术被用于测量不同但相关的信息,基于多个数据源对一组对象进行聚类的任务出现在几个应用中。大多数当前的多源聚类方法要么独立地确定每个数据源的单独聚类,要么确定所有数据源的单个“联合”聚类。需要更灵活的方法来同时建模数据源的依赖性和异构性。

结果:我们提出了一个综合统计模型,该模型允许对每个数据源的对象进行单独的聚类。这些单独的集群松散地依附于总体共识集群,因此它们不是独立的。我们描述了一个计算可扩展的贝叶斯框架,用于同时估计一致性聚类和特定源聚类。我们证明,这种灵活的方法比所有数据源的联合聚类更健壮,比单独聚类每个数据源更强大。我们提出了一种应用程序,利用癌症基因组图谱中公开的数据对乳腺癌肿瘤样本进行亚型识别。

可利用性:带有说明和示例的R代码可在http://people.duke.edu/%7Eel113/software.html。

PubMed免责声明

数字

图1。
图1。
估计公式图像与100个随机生成模拟的真α相比。对于每个模拟,平均值公式图像以95%可信区间显示
图2。
图2。
100个模拟的源特定和总体聚类错误M(M)=2和M(M)=3个数据源,显示为联合聚类、单独聚类、依赖聚类、BCC和使用真α的BCC。LOESS曲线将聚类误差显示为每种方法的α函数
图3。
图3。
每个数据源的PCA图。采样点按整体簇着色;簇1是黑色的,簇2是红色的,簇3是蓝色的。符号表示特定于源的簇;簇1用实心圆圈表示,簇2用加号表示,簇3用星号表示

类似文章

引用人

工具书类

    1. 癌症基因组图谱网络。人类乳腺肿瘤的综合分子图谱。自然。2012;490:61–70.-项目管理咨询公司-公共医学
    1. 克利夫兰WS。稳健的局部加权回归和平滑散点图。J.Am.Stat.Assoc.1979年;74:829–836.
    1. Curtis C等。2000例乳腺肿瘤的基因组和转录组结构揭示了新的亚群。自然。2012;486:346–352.-项目管理咨询公司-公共医学
    1. 通过狄利克雷过程混合模型对表达式数据进行基于Dahl D.模型的聚类。英国剑桥:剑桥大学出版社;2006
    1. 段Q等。Metasignatures确定了乳腺癌的两个主要亚型。CPT药理学。系统。药理学。2013;3:e35。-项目管理咨询公司-公共医学

出版物类型