×

使用贝叶斯WAND揭示排名数据中的子组结构。 (英语) Zbl 1452.62224号

摘要:排名数据出现在许多应用领域,从癌症上调基因的排名到学术统计期刊的排名。当评级机构没有报告所有实体的完整排名时,可能会出现复杂情况;例如,他们可能只会在看到部分或所有实体后报告排名靠前的实体。了解等级是否具有同等的信息量,以及某些实体是否被有效地判断为可交换,也很有用。揭示数据中的子组结构也可能有助于理解等级视图的分布。在本文中,我们提出了一个灵活的贝叶斯非参数模型,用于识别排序数据中的异质结构和排序可靠性。该模型是Plackett-Luce模型的加权自适应嵌套Dirichlet(WAND)过程混合,推理通过简单有效的Gibbs抽样方案进行后验抽样。后验分布中丰富的信息使我们能够推断出秩群之间和实体群(秩内群)之间结构的许多细节。我们的建模框架还促进了后验预测分布的灵活表示。这种灵活性非常重要,因为我们建议使用后验预测分布作为解决秩聚合问题以及识别模型拟合不足的基础。通过几个仿真研究和实际数据示例说明了该方法。

MSC公司:

2015年1月62日 贝叶斯推断
62F07型 统计排名和选择程序
62G05型 非参数估计
62立方厘米10 贝叶斯问题;贝叶斯过程的特征
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿尔沃,M。;Yu,P.L.H.,《排名数据的统计方法》(2014),纽约:Springer,纽约·Zbl 1341.62001号
[2] 伯纳多,J.M。;Smith,A.F.M.,贝叶斯理论(1994),奇切斯特:威利·Zbl 0796.6202号
[3] R.A.布拉德利。;Terry,M.E.,“不完全区组设计的秩分析:I.成对比较的方法”,《生物统计学》,第39期,第324-345页(1952年)·Zbl 0047.12903号 ·doi:10.2307/2334029
[4] 卡隆,F。;Doucet,A.,“广义Bradley-Terry模型的有效贝叶斯推断”,《计算与图形统计杂志》,第21期,第174-196页(2012年)·doi:10.1080/101816600.2012.638220
[5] 卡隆,F。;Teh,Y.W。;Murphy,T.B.,“大学学位课程偏好分析的贝叶斯非参数Plackett-Luce模型”,《应用统计年鉴》,第8期,第1145-1181页(2014年)·Zbl 1454.62153号 ·doi:10.1214/14-AOAS717
[6] Choulakian,V.,《全球均质混合成分和等级数据的局部异质性》,arXiv:1608.05058(2016)
[7] Dahl,D.B。;做,K.-A。;缪勒,P。;Vannucci,M.,基因表达和蛋白质组学的贝叶斯推断,通过Dirichlet过程混合模型对表达数据进行基于模型的聚类,201-218(2006),剑桥:剑桥大学出版社,剑桥·Zbl 1182.62050
[8] de Borda,J.C.,《斯克鲁丁河畔梅莫尔》(1781),巴黎:巴黎皇家科学史
[9] de Leeuw,J。;格林纳克,M。;Blasius,J.,《多重对应分析及相关方法》,非线性主成分分析,107-134(2006),伦敦:CRC出版社,伦敦
[10] de Leeuw,J。;Mair,P.,《R中最优缩放的Gifi方法:封装原生动物》,《统计软件杂志》,第31期,第1-20页(2009年)·doi:10.18637/jss.v031.i04
[11] 邓,K。;韩,S。;李克杰。;Liu,J.S.,“基于顺序的秩数据的贝叶斯聚合”,《美国统计协会杂志》,1091023-1039(2014)·Zbl 1368.62122号 ·doi:10.1080/01621459.2013.878660
[12] 医学博士埃斯科瓦尔。;West,M.,“使用混合的贝叶斯密度估计和推断”,《美国统计协会杂志》,90,577-588(1995)·兹比尔0826.62021 ·doi:10.1080/01621459.1995.10476550
[13] Everitt,B.S。;兰道,S。;Leese,M。;Stahl,D.,《聚类分析》(2011年),威利出版社:英国奇切斯特威利出版社·Zbl 1274.62003年
[14] Gelfand,A.E。;Sahu,S.K.,“广义线性模型的可辨识性、不恰当先验和吉布斯抽样”,美国统计协会杂志,,94247-253(1999)·Zbl 1072.62611号 ·doi:10.1080/01621459.1999.10473840
[15] Gelman,A。;Carlin,J.B。;斯特恩,H.S。;邓森,D.B。;Vehtari,A。;Rubin,D.B.,贝叶斯数据分析(2013),伦敦:CRC出版社,伦敦
[16] I.C.戈姆利。;Murphy,T.B.,“探索爱尔兰选区内的投票集团:混合建模方法”,《美国统计协会杂志》,第103期,第1014-1027页(2008年)·兹比尔1205.62198 ·doi:10.1198/0162145000001049
[17] I.C.戈姆利。;Murphy,T.B.,“等级数据的专家混合模型及其在选举研究中的应用”,《应用统计年鉴》,第21452-1477页(2008年)·Zbl 1454.62498号 ·doi:10.1214/08-AOAS178
[18] I.C.戈姆利。;Murphy,T.B.,“等级数据的成员等级模型”,贝叶斯分析,第4265-295页(2009年)·Zbl 1330.62024号 ·doi:10.1214/09-BA410
[19] 哈斯蒂,D.I。;利弗拉尼,S。;Richardson,S.,“从未知浓度参数的Dirichlet过程混合模型中取样:大数据实现中的混合问题”,统计与计算,25,1023-1037(2015)·兹比尔1332.62093 ·doi:10.1007/s11222-014-9471-3
[20] Hjort,N.L。;C.C.福尔摩斯。;缪勒,P。;Walker,S.G.,《贝叶斯非参数学》(2010),剑桥:剑桥大学出版社,剑桥·Zbl 1192.62080号
[21] Ishwaran,H。;James,L.F.,“断裂前吉布斯取样方法”,《美国统计协会杂志》,96,161-173(2001)·Zbl 1014.62006年 ·doi:10.1198/016214501750332758
[22] Lange,K.,Optimization,Springer Texts in Statistics(2013),纽约:Springer,New York·Zbl 1273.90002号
[23] 刘建伟。;Green,P.J.,“基于贝叶斯模型的聚类程序”,《计算与图形统计杂志》,第16期,第526-558页(2007年)·doi:10.1198/106186007X238855
[24] Luce,R.,《个人选择行为:理论分析》(1959年),纽约:威利出版社,纽约·Zbl 0093.31708号
[25] MacEachern,S.N。;Müller,P.,“Dirichlet过程模型混合估计”,《计算与图形统计杂志》,第7期,第223-238页(1998年)·doi:10.2307/1390815
[26] Mallows,C.L.,“非完全排名模型.I”,《生物特征》,第44期,第114-130页(1957年)·Zbl 0087.34001号 ·doi:10.1093/biomet/44.1-2.114
[27] Marden,J.I.,“嵌套正交对比法在分析等级数据中的应用”,《美国统计协会杂志》,第87期,第307-318页(1992年)·doi:10.1080/01621459.1992.10475210
[28] Marden,J.I.,《秩数据分析与建模》(1995),伦敦:Chapman and Hall,伦敦·Zbl 0853.62006号
[29] Medvedovic,M。;Sivaganesan,S.,“基于贝叶斯无限混合模型的基因表达谱聚类”,生物信息学,第18期,第1194-1206页(2002年)·doi:10.1093/bioinformatics/18.9.1194
[30] 莫利卡,C。;Tardella,L.,“通过排序数据的混合建模进行表位分析”,《医学统计学》,第33期,第3738-3758页(2014年)·doi:10.1002/sim.6224
[31] 莫利卡,C。;Tardella,L.,“部分排名数据的贝叶斯Plackett-Louce混合模型”,《心理测量学》,第1-17页(2016年)·Zbl 1402.62045号 ·doi:10.1007/s11336-016-9530-0
[32] 墨菲,T.B。;Martin,D.,“基于距离的排名数据模型的混合”,计算统计与数据分析,41645-655(2003)·Zbl 1429.62258号 ·doi:10.1016/S0167-9473(02)00165-2
[33] Neal,R.M.,“Dirichlet过程混合模型的马尔可夫链抽样方法”,《计算与图形统计杂志》,第9期,第249-265页(2000年)·doi:10.2307/1390653
[34] O.帕帕斯皮利奥普洛斯。;Roberts,G.O.,“Dirichlet过程层次模型的回顾性马尔可夫链蒙特卡罗方法”,《生物统计学》,第95期,第169-186页(2008年)·Zbl 1437.62576号 ·doi:10.1093/biomet/asm086
[35] Plackett,R.L.,“排列分析”,应用统计学,193-202(1975)·doi:10.2307/2346567
[36] 罗德里格斯,A。;邓森,D.B。;Gelfand,A.E.,“嵌套Dirichlet过程”,《美国统计协会杂志》,第103期,第1131-1154页(2008年)·Zbl 1205.62062号 ·doi:10.1198/0162145000000553
[37] Sethuraman,J.,《Dirichlet Priors的构造性定义》,《统计学》,第4639-650页(1994)·Zbl 0823.62007号
[38] 维泰利,V。;瑟伦森(Sørensen)。;克里斯皮诺,M。;弗里格西,A。;Arjas,E.,《马尔洛等级模型下的概率偏好学习》,《机器学习研究杂志》,第18期,第1-49页(2018年)·兹比尔1471.62268
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。