×

用于估计两个对称密度混合物的矩-距离混合方法。 (英语) Zbl 1392.62062号

摘要:在高维数据的聚类中,通常应用变量选择来获得样本的精确分组。对于两类问题,可以通过将混合分布拟合到每个变量来进行选择。我们提出了一种混合方法来估计两个对称密度的参数混合。该估计器将矩量法与最小距离法相结合。一项评估研究包括广泛的模拟和来自急性白血病患者的基因表达数据,该研究表明,在基于模型的聚类中,混合方法优于最大似然估计。混合估计具有灵活性,并且在不精确的模型假设下也表现良好,这表明它是稳健的并且适合于实际问题。

MSC公司:

第62页 统计排名和选择程序
10层62层 点估计
62层35 鲁棒性和自适应程序(参数推断)
62页第10页 统计学在生物学和医学中的应用;元分析
92D10型 遗传学和表观遗传学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Benaglia,T。;乔沃,D。;D.R.亨特。;Young,D.,Mixtools:分析有限混合模型的R包,《统计软件杂志》,32,6,1-29,(2009)
[2] Bordes,L。;莫特莱特,S。;Vandekerkhove,P.,双组分混合模型的半参数估计,《统计年鉴》,34,3,1204-1232,(2006)·Zbl 1112.62029号
[3] Brouwer,R.K.,《将rand、调整后的rand和jaccard指数扩展到模糊划分》,《智能信息系统杂志》,32,3,213-235,(2009)
[4] Celeux,G。;乔沃,D。;Diebolt,J.,《EM算法的随机版本:混合情况下的实验研究》,《统计计算与模拟杂志》,55,4,287-314,(1996)·Zbl 0907.62024号
[5] B.克拉克。;Heathcote,C.,k分量单变量正态混合的稳健估计,统计数学研究所年鉴,46,1,83-93,(1994)·Zbl 0802.62039号
[6] 卡特勒,A。;Cordero-Braña,O.I.,有限混合模型的最小Hellinger距离估计,美国统计协会杂志,91,436,1716-1723,(1996)·兹比尔0881.62035
[7] Dempster,A.P.,Laird,N.M.,Rubin,D.B.:通过em算法获得不完整数据的最大似然。英国皇家统计学会杂志。B系列(方法学),1-38(1977)·Zbl 0364.62022号
[8] Dudoit,S。;Fridlyand,J。;Speed,T.P.,《使用基因表达数据进行肿瘤分类的鉴别方法比较》,《美国统计协会杂志》,97,457,77-87,(2002)·Zbl 1073.62576号
[9] 范,J。;Lv,J.,《高维特征空间中变量选择的选择性综述》,中国统计局,20,1,101,(2010)·Zbl 1180.62080号
[10] Freyhult,E。;兰德福斯,M。;J·昂斯科。;T·R·Hvidsten。;Rydén,P.,微阵列类发现的挑战:标准化、基因选择和聚类的综合检查,BMC生物信息学,11,1503,(2010)
[11] 藤泽,H。;Eguchi,S.,正态混合模型中的稳健估计,《统计规划与推断杂志》,136,11,3989-4011,(2006)·Zbl 1104.62017年
[12] Gleason,J.R.,《理解伸长:被量表污染的正常家庭》,美国统计协会杂志,88,421,327-337,(1993)·Zbl 0775.62080号
[13] T.R.Golub。;斯隆,D.K。;Tamayo,P。;华德,C。;加森贝克,M。;梅西洛夫,J.P。;科勒,H。;Loh,M.L。;唐宁,J.R。;Caligiuri,M.A.,《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》,286,5439,531-537,(1999)
[14] 哈斯蒂,T。;Tibshirani,R。;弗里德曼,J。;富兰克林,J.,《统计学习的要素:数据挖掘、推理和预测》,《数学智能者》,第27、2、83-85页,(2005)
[15] Hathaway,R.J.:正态混合物分布的最大似然估计的约束公式。《统计年鉴》,795-800(1985)·Zbl 0576.62039号
[16] 霍奇,V.J。;Austin,J.,《异常值检测方法的调查》,《人工智能评论》,22,2,85-126,(2004)·Zbl 1101.68023号
[17] Hunter,D.R.,Wang,S.,Hettmansperger,T.P.:对称分布混合物的推断。《统计年鉴》,224-251(2007)·Zbl 1114.62035号
[18] Ju,J。;科拉奇克,E.D。;Gopal,S.,遥感中的高斯混合判别分析和亚像素土地覆盖特征,环境遥感,84,4,550-560,(2003)
[19] 麦克拉克伦,G。;Peel,D.,有限混合模型,(2004),John Wiley&Sons
[20] McLachlan,G.J.,Basford,K.E.:混合模型:推断和聚类应用。应用统计学(1988)·Zbl 0697.62050号
[21] Nelder,J.A。;Mead,R.,函数最小化的单纯形方法,《计算机杂志》,7,4,308-313,(1965)·Zbl 0229.65053号
[22] Pearson,K.:对进化数学理论的贡献。伦敦皇家学会哲学学报。A、 71-110(1894)·JFM 25.0347.02号
[23] R核心团队,R:统计计算的语言和环境,(2017),R统计计算基金会,奥地利维也纳
[24] 施拉特曼,P。;Böhning,D.,混合模型和疾病映射,《医学统计学》,第12、19、20、1943-1950页,(1993)
[25] 斯菲卡斯,G。;尼库,C。;Galatsanos,N.,IEEE国际图像处理会议,2007年。ICIP 2007,1,混合学生t分布的鲁棒图像分割,273,(2007),IEEE
[26] Titterington,D。;A.史密斯。;Makov,U.,《有限混合模型的统计分析》(1985),英国奇切斯特威利出版社·Zbl 0646.62013.中
[27] D.M.沃尔夫。;伦伯格,M.E。;Yau,C。;布德劳,A。;van’t Veer,L.J.,基因共表达模块作为乳腺癌多样性的临床相关标志,PloS ONE,9,2,88309,(2014)
[28] W.A.伍德沃德。;华盛顿州帕尔。;W.R.舒卡尼。;Lindsey,H.,混合比例的最小距离和最大似然估计的比较,美国统计协会杂志,79,387,590-598,(1984)·Zbl 0547.62017号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。