×

兹马思-数学第一资源

用copula函数聚类相关观测值。(英语) Zbl 1411.62165
摘要:本文根据相关观测值的复杂生成过程,研究了相关观测值的聚类问题。作者[J。经典。29号,第1期,50–75页(2012年;Zbl 1360.62250)]介绍了一种基于copula函数的聚类算法CoClust,该算法实现了任务,但计算量大。此外,CoClust自动将所有观测值分配到簇中;因此,它不能丢弃可能不相关的观察结果。在本文中,我们介绍了一个改进版的CoClust,它既克服了这些问题,又在许多方面表现得更好。通过montecarlo的研究,我们研究了该算法的特点,并表明它与旧的CoClust相比有着一致的改进。我们的提议的有效性也被应用于人类乳腺肿瘤样本的实际数据集,该算法提供了有意义的生物学解释。新算法是通过R包裹共色.

理学硕士:
62小时30分 分类和区分;聚类分析(统计方面)
62小时 关联度量(相关、典型相关等)
第62页 统计学在生物学和医学科学中的应用;荟萃分析
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] 布莱希曼,E。;Schepsmeier,U.,《用c-和d-维恩copulas建模依赖性:R包CDVine,J Stat Softw,52,1-27,(2013年)
[2] Cherubini U,Luciano E,Vecchiato W(2004)《金融中的Copula方法》。威尔赫斯特,威尔赫斯特·Zbl 1163.62081
[3] Clarke,K.,《非嵌套模型选择的简单无分布测试》,Polit Anal,15347-363,(2007)
[4] 拉西奥,FML;Giannerini,S.,基于copula的发现相关观测模式的算法,J Classif,29,50-75,(2012)·Zbl 1360.62250
[5] Di Lascio FML,Giannerini S(2015)科勒斯特。R程序包版本0.3-1
[6] 拉西奥,FML;詹尼里尼,S。;Reale,A.,探索复杂相关数据插补的copula,Stat Methods Appl,24159-175,(2015年)·兹布1441.62120
[7] Dortett Bernadet,JL公司;Wicker,N.,基于单位球的模型聚类和使用基因表达谱的图解,生物统计学,9,66-80,(2008)·兹布1274.62761
[8] 艾森,MB;斯佩尔曼,PT;布朗,阿宝;Botstein,D.,全基因组表达模式的聚类分析和显示,美国科学院学报,9514863-14868,(1998)
[9] 弗雷利,C。;Raftery,A.,有多少簇?哪种聚类方法?基于模型聚类分析的答案,计算机J,41578-588,(1998)·Zbl 0920.68038
[10] 赫登福克,我。;达根,D。;陈,Y。;拉德马赫,M。;比特纳,M。;西蒙,R。;梅尔茨,P。;古斯特森,B。;埃斯特勒,M。;卡利奥涅米,作品;威尔方德,B。;博格,A。;多尔蒂,E。;科诺宁,J。;布本多夫,L。;费勒,W。;Pittaluga,S。;格鲁伯格,S。;北卡罗来纳州洛曼。;约翰森,O。;奥尔森,H。;Sauter,G.,遗传性乳腺癌的基因表达谱,英国医学杂志,344539-548,(2001)
[11] Joe H,Xu J(1996)多元模型边际推理函数的估计方法。技术报告166,不列颠哥伦比亚大学统计系
[12] Nelsen RB(2006)copulas简介。斯普林格,纽约·Zbl 1152.62030
[13] 罗夫拉托,A。;Lascio,FML,Wilks'(\lambda\)基因聚类的差异性度量:基于转录模块识别的方法,生物识别,671236-1248,(2011)·兹布1274.62863
[14] Sklar,A.,dimensions de répartitionán dimensions et leurs marges,巴黎国立大学出版社,8229-231年(1959年)·Zbl 0100.14202
[15] 塔马约,P。;斯隆尼姆,D。;梅西罗夫,J。;朱Q。;Kitareewan,S。;德米特罗夫斯基。;着陆器,E。;Golub,T.,用自组织图解释基因表达模式:造血分化的方法和应用,美国科学院学报,962907-2912,(1999)
[16] 特里维迪,PK;Zimmer,DM,Copula建模:从业者介绍,发现趋势经济学,1,1-111,(2005)·Zbl 1195.91130
[17] 《模型选择和非嵌套假设的似然比检验》,计量经济学,57307-333,(1989)·Zbl 0701.62106
[18] 杨,K。;弗雷利,C。;穆鲁阿,A。;拉夫特里,A。;Ruzzo,W.,基因表达数据的基于模型的聚类和数据转换,生物信息学,17977-987,(2001)
[19] 马克,齐默;Trivedi,PK,使用三变量copula来模拟样本选择和治疗效果:应用于家庭医疗保健需求,J Bus Econ Stat,24,63-76,(2006)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。