×

用copula函数聚类相关观测。 (英语) Zbl 1411.62165号

摘要:本文根据观测值的复杂生成过程来处理依赖于观测值的聚类问题。作者[J.Classif.29,No.1,50-75(2012;Zbl 1360.62250号)]介绍了CoClust,一种基于copula函数的聚类算法,该算法完成了任务,但计算量较大。此外,CoClust会自动将所有观测值分配给集群;因此,它不能丢弃可能不相关的观察结果。在本文中,我们介绍了CoClust的一个改进版本,它克服了这些问题,并且在许多方面都表现得更好。通过蒙特卡罗研究,我们研究了该算法的特点,并表明它相对于旧CoClust具有一致的改进。我们的建议的有效性也得到了对人类乳腺肿瘤样本实际数据集的应用的支持,该算法为其提供了有意义的生物学解释。新算法通过更新版本的R(右)包裹CoClust公司

MSC公司:

62小时30分 分类和区分;聚类分析(统计方面)
62H20个 关联度量(相关性、典型相关性等)
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Brechmann E,Schepsmeier U(2013)用c-和d-vine交配器建模依赖性:R包CDVine。J Stat Softw杂志52(3):1-27
[2] Cherubini U、Luciano E、Vecchiato W(2004)《金融学中的Copula方法》。奇切斯特·威利·Zbl 1163.62081号
[3] Clarke K(2007)非嵌套模型选择的简单无分布测试。政治分析15:347-363
[4] Di Lascio FML,Giannerini S(2012)基于copula的算法,用于发现相关观测的模式。J分类29(1):50-75·Zbl 1360.62250号
[5] Di Lascio FML,Giannerini S(2015)CoClust。R包版本0.3-1
[6] Di Lascio FML,Giannerini S,Reale A(2015)《探索复杂相依数据插补的连词》。统计方法应用24(1):159-175·Zbl 1441.62120号
[7] Dortet-Bernadet JL,Wicker N(2008)单位球面上基于模型的聚类,并使用基因表达谱进行了说明。生物统计学9(1):66-80·Zbl 1274.62761号
[8] Eisen MB,Spellman PT,Brown PO,Botstein D(1998),全基因组表达模式的聚类分析和显示。美国国家科学院院刊95:14863-14868
[9] Fraley C,Raftery A(1998年)有多少集群?哪种聚类方法?通过基于模型的聚类分析回答。计算J 41(8):578-588·Zbl 0920.68038号
[10] Hedenfalk I、Duggan D、Chen Y、Radmacher M、Bittner M、Simon R、Meltzer P、Gusterson B、Esteller M、kallioniemi OP、Wilfond B、Borg A、Dougherty E、Kononen J、Bubendorf L、Fehrle W、Pittaluga S、Gruvberger S、Loman N、Johansson O、Olsson H、Sauter G(2001)遗传性乳腺癌的基因表达谱。《新英格兰医学杂志》344(8):539-548
[11] Joe H,Xu J(1996)多元模型边际推理函数的估计方法。技术报告166,不列颠哥伦比亚大学统计系
[12] Nelsen RB(2006)交配动物简介。纽约州施普林格·Zbl 1152.62030
[13] Roverato A,Di Lascio FML(2011)Wilks’\[lambda\]λ差异性基因聚类测量:基于转录模块识别的方法。生物统计学67(4):1236-1248·Zbl 1274.62863号
[14] Sklar A(1959)《维度和边界划分函数》。巴黎国立大学出版社8:229-231·Zbl 0100.14202号
[15] Tamayo P、Slonim D、Mesirov J、Zhu Q、Kitareewan S、Dmitrovsky E、Lander E、Golub T(1999)《用自组织图解释基因表达模式:造血分化的方法和应用》。美国国家科学院院刊96(6):2907-2912
[16] Trivedi PK,Zimmer DM(2005)Copula建模:从业者简介。发现趋势经济1:1-111·兹比尔1195.91130
[17] Vuong Q(1989)模型选择和非嵌套假设的似然比检验。计量经济学57:307-333·Zbl 0701.62106号
[18] Yeung K,Fraley C,Murua A,Raftery A,Ruzzo W(2001)基因表达数据的基于模型的聚类和数据转换。生物信息学17(10):977-987
[19] Zimmer DM,Trivedi PK(2006)使用三变量连接函数来模拟样本选择和治疗效果:应用于家庭保健需求。《公共汽车经济统计》24:63-76
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。