×

组成数据集中计数零点的贝叶斯乘法处理。 (英语) Zbl 07258982号

总结:成分计数数据是离散向量,表示属于几个互斥类别中任何一个类别的结果数。在向量元素的总和不感兴趣的情况下,基于对数比方法的合成技术是合适的。这种成分计数数据集可能包含零值,这些零值通常是由于样本量不够大造成的。也就是说,它们是指通过大量试验或不同的抽样设计观察到的未观察到的正值。因为对数比率转换需要具有正值的数据,所以对计数组成进行任何统计分析之前都必须正确替换零。在几个案例研究中,提出了一种贝叶斯乘法处理方法来解决这个零计数问题。这种处理涉及Dirichlet先验分布作为多项式分布的共轭分布和非零值的乘法修正。先验分布的不同参数化提供了不同的零替换结果,说明了其与单纯形向量空间结构的一致性。从理论和计算的角度评估了它们的性能。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aebischer,NJ,Robertson,PA,Kenward,RE(1993)《动物放射性追踪数据中栖息地使用的成分分析》。生态学,74(5),1313-25·doi:10.2307/1940062
[2] Agresti,A(2003)分类数据分析。《概率统计威利级数》,第710页。霍博肯第二版:约翰·威利父子公司·Zbl 1018.6202号
[3] Aitchison,J(1986)成分数据的统计分析。统计学和应用概率专著(2003年重印,由布莱克本出版社提供额外材料)。伦敦:查普曼霍尔有限公司,第416页·兹比尔0688.62004 ·doi:10.1007/978-94-009-4109-0
[4] Bernard,JM(2005)多项式数据的不精确Dirichlet模型简介。国际近似推理杂志,39(2-3),123-50·Zbl 1066.62003年 ·doi:10.1016/j.ijar.2004.10.002
[5] Butler,A,Glasbey,C(2008)零成分数据的潜在高斯模型。英国皇家统计学会期刊C辑应用统计学,57,505-20·doi:10.1111/j.1467-9876.2008.00627.x
[6] Davis,CS(1993)多项式随机变量的计算机生成。计算统计与数据分析,16,205-17·Zbl 0937.62543号 ·doi:10.1016/0167-9473(93)90115-A
[7] Eaton,ML(1983)多元统计。向量空间方法。纽约:John Wiley&Sons,第512页·Zbl 1160.62326号
[8] Egozcue,JJ(2009)对“关于哈克变异图;……”的回复J.A.Cortés著。数学地球科学,41829-34·Zbl 1178.86018号 ·doi:10.1007/s11004-009-9238-0
[9] Egozcue,JJ,Pawlowsky-Glahn,V(2006)《成分数据的简单几何》。在Buccianti,A,Mateu-Figueras,G,Pawlowsky-Glahn,V(eds),《地球科学中的成分数据分析:从理论到实践》,伦敦:地质学会,第145-160页·Zbl 1156.86307号 ·doi:10.1144/GSL。SP.2006.264.01.11
[10] Egozcue,JJ,Pawlowsky-Glahn,V,Mateu-Figueras,G,Barceló-Vidal,C(2003)成分数据分析的等距对数比变换。数学地质学,35(3),279-300·Zbl 1302.86024号 ·doi:10.1023/A:1023818214614
[11] Egozcue,JJ,Tolosana-Delgado,R,Ortego,MI(eds)(2011年)《CODAWORK’11:第四届成分数据分析研讨会论文集》。Sant Feliu De Guxols,5月10日至13日。ISBN978-84-87867-76-7(电子出版物)。
[12] Elston,DA,Illius,AW,Gordon,IJ(1996)使用对数比分析评估一系列选项中的偏好。生态学,77,2538-48·doi:10.2307/2265752
[13] Filzmoser,P,Hron,K,Templ,M(2012)成分数据的判别分析和稳健参数估计。计算统计学,27(4),585-604·Zbl 1304.65033号 ·doi:10.1007/s00180-011-0279-8
[14] Friedman,J,Alm,EJ(2012)从基因组调查数据推断相关网络。PLoS计算生物学,8(9),e1002687。doi:10.1371/journal.pcbi.1002687·doi:10.1371/journal.pcbi.1002687
[15] Graffelman,J(2011)使用对数比坐标对Hardy-Weinberg平衡进行统计推断。在Egozcue,J.J.、Tolosana-Delgado,R.、Ortego,M.I.(编辑),《第四届国际成分数据分析研讨会论文集》,第5页。
[16] Graffelman,J,Egozcue,JJ(2011)Hardy-Weinberg平衡:非参数组成方法,第15章。Pawlowsky-Glahn,V.,Buccianti,A.(编辑),《成分数据分析:理论与应用》,第208-17页。英国奇切斯特:John Wiley&Sons,Ltd·doi:10.1002/9781119976462.62ch15
[17] Hron,K,Templ,M,Filzmoser,P(2010)使用经典和稳健方法对成分数据的缺失值进行插补。计算统计与数据分析,54(12),3095-107·兹比尔1284.62049 ·doi:10.1016/j.csda.2009.11.023
[18] Martín-Fernández,JA,Barceló-Vidal,C,Pawlowsky-Glahn,V(2003)使用非参数插补处理成分数据集中的零和缺失值。数学地质学,35(3),253-78·Zbl 1302.86027号 ·doi:10.1023/A:1023866030544
[19] Martín-Fernández,JA,Palarea-Albaladejo,J,Olea,RA(2011)《处理零》,第4章。Pawlowsky-Glahn,V.,Buccianti,A.(编辑),《成分数据分析:理论与应用》,第47-62页。英国奇切斯特:John Wiley&Sons,Ltd·数字对象标识代码:10.1002/9781119976462.4h4
[20] Martín-Fernández,JA,Hron,K,Templ,M,Filzmoser,P,Palarea-Albaladejo,J(2012),基于模型的成分数据中四舍五入零的替换:经典和稳健方法。计算统计与数据分析,56(3),2688-704·Zbl 1255.62116号 ·doi:10.1016/j.csda.2012.02.012
[21] Mateu-Figueras,G,Pawlowsky-Glahn,V(2008)《地球化学中概率定律的关键方法》。数学地球科学,40(5),489-502·兹比尔1153.86338 ·doi:10.1007/s11004-008-9169-1
[22] Monti,GS,Mateu-Figueras,G,Pawlowsky-Glahn,V(2011)关于标度Dirichlet分布的注释。Pawlowsky-Glahn,V.,Buccianti,A.(编辑),《成分数据分析:理论与应用》,第128-38页。英国奇切斯特:John Wiley&Sons,Ltd·doi:10.1002/9781119976462.62ch10
[23] Palarea-Albaladejo,J,Martín-Fernández,JA,Gómez-García,J(2007)处理成分四舍五入零的参数方法。数学地质学,39625-45·Zbl 1130.86001号 ·数字对象标识代码:10.1007/s11004-007-9100-1
[24] Palarea-Albaladejo,J,Martín-Fernández,JA(2008)用于替换成分数据集中四舍五入零的改进EM alr-算法。计算机与地球科学,34(8),902-17·doi:10.1016/j.cageo.2007.09.015
[25] Palarea-Albaladejo,J,Martín-Fernández,JA,Soto,JA(2012)《处理成分数据模糊c-Means聚类的距离和变换》。分类杂志,29(2),144-69·Zbl 1360.62347号 ·文件编号:10.1007/s00357-012-9105-4
[26] Palarea-Albaladejo,J,Martín-Fernández,JA(2013)成分化学数据中低于检测限的值。《分析化学学报》,764,32-43·doi:10.1016/j.aca.2012.12.029
[27] Pawlowsky-Glahn,V,Buccianti,A,eds(2011)《成分数据分析:理论与应用》。奇切斯特:约翰·威利父子出版社,第378页·doi:10.1002/9781119976462
[28] Pawlowsky-Glahn,V,Egozcue,JJ(2002)BLU估计值和成分数据。数学地质学,34(3),259-74·Zbl 1031.86007号 ·doi:10.1023/A:1014890722372
[29] Pearson,K(1897)进化论的数学贡献。在器官测量中使用指数时可能出现的虚假相关性。伦敦皇家学会会刊,60489-502·JFM 28.0209.02号 ·doi:10.1098/rspl.1896.0076
[30] Pierotti,MER,Martín-Fernández,JA,Seehausen,O(2009)《雄性交配偏好空间中的个体变异映射:颜色多态性慈鲷的多重选择》。进化,63(9),2372-88·文件编号:10.1111/j.1558-5646.2009.00716.x
[31] R开发核心团队(2012)R:统计计算的语言和环境,奥地利维也纳:R统计计算基金会。http://www.r-project.org。
[32] Richardson,D(1997)《如何识别零》。符号计算杂志,24(6),627-45·Zbl 0917.11062号 ·doi:10.1006/jsco.1997.0157
[33] Rodrigues,PC,Lima,AT(2009)使用主成分分析法分析欧盟选举。统计论文,50895-904·Zbl 1247.91053号 ·doi:10.1007/s00362-009-0264-2
[34] Stewart,C,Field,C(2010)管理定量脂肪酸特征分析中的基本零。农业、生物和环境统计杂志,16(1),45-69·Zbl 1306.62237号 ·doi:10.1007/s13253-010-0040-8
[35] Templ,M,Hron,K,Filzmoser,P(2011)rob《成分:成分数据稳健统计分析的R包》,第25章。Pawlowsky Glahn,V.,Buccianti,A.(编辑),《成分数据分析:理论与应用》,第341-55页。英国奇切斯特:John Wiley&Sons,Ltd·doi:10.1002/9781119976462.4h25
[36] Walley,P(1996)从多项式数据推断:学习一袋大理石。英国皇家统计学会期刊B辑(方法学),58(1),3-57·Zbl 0834.62004号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。