×

基于weaver算法的不完全多项式数据的最大似然估计。 (英语) Zbl 1406.62059号

摘要:在多项式模型中,样本空间被划分为不相交的单元并。在单元计数采样期间,分区通常是不可变的。本文通过放松常数分割假设,将多项式模型扩展到不完全多项式模型,以允许单元可变,并以集成方式对从非不相交单元收集的计数进行建模,从而推断公共潜在概率。不完全多项式似然由最精细划分的完全细胞概率参数化。其充分的统计数据包括作为指示矩阵观察到的可变细胞形成和所有细胞计数。由于细胞形成过程中存在外部强加的结构,它简化为特殊模型,包括Bradley-Terry模型、Plackett-Luce模型等。由于传统方法求解得分函数的零点是无效的,因此我们开发了一种新的方法来建立更简单的模型获得最大似然估计(MLE)的一组估计方程,该估计方程通过将每个分量拟合成不等式来寻求似然的所有乘法分量的同时最大化。因此,我们的估计相当于解决了一个实现不平等的平等条件系统。生成的MLE方程很简单,并立即需要一个定点迭代算法来求解,该算法称为weaver算法。weaver算法简短,易于并行实现。我们还导出了最大似然估计的渐近协方差,通过仿真验证了主要结果,并将weaver算法与基于将Plackett-Luce模型拟合到基准数据集的MM/EM算法进行了比较。

MSC公司:

62H17型 应急表
62F07型 统计排名和选择程序
65克10 数值优化和变分技术
62G07年 密度估计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agresti,A.:分类数据分析,第2版。威利,纽约(2003)·Zbl 0716.62001号
[2] 布拉德利,RA;Terry,ME,《不完全区组设计的秩分析:I.成对比较法》,Biometrika,39,324-345,(1952)·Zbl 0047.12903号 ·doi:10.2307/2334029
[3] 卡隆,F;Doucet,A,广义Bradley-Terry模型的有效贝叶斯推断,J.Compute。图表。《统计》,第21卷,第174-196页,(2012年)·doi:10.1080/10618600.2012.638220
[4] 陈,T;Fienberg,SE,《不完全分类数据的列联表分析》,《生物统计学》,32,133-144,(1976)·Zbl 0328.62039号 ·doi:10.2307/2529344
[5] 罗杰·康纳(RJ Connor);Mosimann,JE,比例独立性的概念和狄利克雷分布的推广,J.Am.Stat.Assoc.,64194-206,(1969)·Zbl 0179.24101号 ·网址:10.1080/01621459.1969.10500963
[6] Cox,D.A.,Little,J.,O’Shea,D.:理想、变种和算法:计算代数几何和交换代数导论,第3版。施普林格,纽约(2007年)·Zbl 1118.13001号 ·doi:10.1007/978-0-387-35651-8
[7] David,H.A.:成对比较方法,第2版。牛津大学出版社,牛津(1988)·Zbl 0665.62075号
[8] 戴维森,R;Farquhar,P,《配对比较方法参考书目》,《生物计量学》,32,241-252,(1976)·Zbl 0336.62067号
[9] 阿联酋登普斯特;新墨西哥州莱尔德;Rubin,DB,通过EM算法从不完整数据中获得最大似然,J.R.Stat.Soc.Ser。B(Methodol.),39,1-38,(1977)·Zbl 0364.62022号
[10] Diaconis,P.:In:Gupta,S.S.(编辑)《概率与统计中的群表示》,讲义——专题丛书,第11卷。加利福尼亚州海沃德数理统计研究所。https://projecteuclid.org/euclid.lnms/1215467407 (1988) ·Zbl 0695.60012号
[11] 吉咪·迪克;江,JM;Kadane,JB,删失分类数据的贝叶斯方法,美国统计协会,82,773-781,(1987)·Zbl 0637.62029号 ·doi:10.1080/01621459.1987.10478498
[12] Dwork,C.,Kumar,R.,Naor,M.,Sivakumar,D.:网络排名聚合方法。摘自:第十届万维网国际会议记录,第613-622页。ACM(2001)
[13] 福特,LRJ,从二进制比较中解决排名问题,美国数学。周一。,64, 28-33, (1957) ·Zbl 0089.15304号 ·doi:10.2307/2308513
[14] Gordon,L,大型有限总体中的连续抽样,Ann.Stat.,11,702-706,(1983)·Zbl 0521.62008号 ·doi:10.1214操作系统/1176346175
[15] IC Gormley;TB Murphy,《探索爱尔兰选民内部的投票集团:混合建模方法》,《美国统计协会期刊》,第103期,第1014-1027页,(2008年)·兹比尔1205.62198 ·doi:10.19198/0162114507000001049
[16] Guiver,J.,Snelson,E.:Plackett-Luce排名模型的贝叶斯推断。摘自:《第23届机器学习国际会议论文集》,第377-384页。ACM,匹兹堡(2009)
[17] 哈伯曼,SJ,《涉及间接观测的频率表产品模型》,《Ann.Stat.》,第5期,第1124-1147页,(1977年)·Zbl 0371.62150号 ·doi:10.1214/aos/1176344000
[18] Hankin,RKS,Dirichlet分布的推广,J.Stat.Softw。,33, 1-18, (2010) ·doi:10.18637/jss.v033.i11
[19] HO哈特利;霍金,RR,《不完整数据的分析》,生物统计学,27783-823,(1971)·doi:10.2307/2528820
[20] 哈斯蒂,T;Tibshirani,R,《两两耦合分类》,《Ann.Stat.》,26,451-471,(1998)·Zbl 0932.62071号 ·doi:10.1214/aos/1028144844
[21] WJ Heiser;Krzanowski,WJ(编辑),通过迭代优化的收敛计算:多维数据分析的理论和应用,157-189,(1995),牛津
[22] 黄,TK;翁,RC;Lin,CJ,广义Bradley-Terry模型和多类概率估计,J.Mach。学习。第785-115号决议(2006年)·Zbl 1222.68219号
[23] Hunter,DR,广义布莱德雷-特里模型的MM算法,《Ann.Stat.》,32,384-406,(2004)·Zbl 1105.62359号 ·doi:10.1214/aos/1079120141
[24] 亨特博士;Lange,K,《MM算法教程》,《美国统计》,58,30-37,(2004)·doi:10.1198/0003130042836
[25] Jech,T,《不完全锦标赛的排名:流行运动的数学家指南》,《美国数学》。周一。,90, 246-266, (1983) ·Zbl 0519.05034号 ·doi:10.1080/0029890.1983.11971205
[26] Kernighan,B.W.,Ritchie,D.M.:In:Ritchie和D.M.(编辑)C编程语言,第二版。Prentice Hall Professional Technical Reference,Upper Saddle River(1988年)
[27] 拉加里亚斯,J;Reeds,J;Wright,M;Wright,P,低维Nelder-Mead单纯形方法的收敛性,SIAM J.Optim。,9, 112-147, (1998) ·Zbl 1005.90056号 ·doi:10.1137/S1052623496303470
[28] Laird,N,混合分布的非参数最大似然估计,美国统计协会,73,805-811,(1978)·Zbl 0391.62029号 ·doi:10.1080/01621459.1978.10480103
[29] Lange,K.:《优化》,第二版。施普林格,纽约(2013)·Zbl 1273.90002号 ·doi:10.1007/978-14614-5838-8
[30] 兰格,K;周,H,MM几何和符号编程算法,数学。程序。,143, 339-356, (2014) ·Zbl 1286.90110号 ·doi:10.1007/s10107-012-0612-1
[31] 兰格,K;亨特博士;Yang,I,使用替代目标函数的优化转移,J.Compute。图表。统计,9,1-59,(2000)
[32] Loève,M.:概率论I,第4版。纽约州施普林格市(1977年)·Zbl 0359.60001号
[33] Loève,M.:《概率论II》,第4版。施普林格,纽约(1978年)·Zbl 0385.60001号 ·doi:10.1007/978-1-4612-6257-2
[34] 卢斯,R.D.:《个人选择行为:理论分析》。纽约威利(1959)·Zbl 0093.31708号
[35] Luce,RD,《二十年后的选择公理》,数学杂志。心理医生。,15, 215-223, (1977) ·Zbl 0357.92033号 ·doi:10.1016/0022-2496(77)90032-3
[36] Marden,J.I.:秩数据的分析和建模。查普曼和霍尔/CRC,博卡拉顿(1996)·Zbl 0853.62006号
[37] MathWorks:Matlab文档。统一资源定位地址https://www.mathworks.com/help/matlab/ref/profile.html (2017)
[38] McLachlan,G.,Krishnan,T.:EM算法和扩展,第2版。威利,纽约(2008)·Zbl 1165.62019号 ·doi:10.1002/9780470191613
[39] 内尔德,JA;Mead,R,函数最小化的单纯形方法,计算。J.,7308-313(1965)·Zbl 0229.65053号 ·doi:10.1093/comjnl/7.4.308
[40] Ng,K.W.,Tian,G.L.,Tang,M.L.:Dirichlet和相关分布:理论、方法和应用。威利,纽约(2011)·Zbl 1234.60006号 ·doi:10.1002/9781119995784
[41] NVIDIA:CUDA工具包文档v8.0。统一资源定位地址http://docs.nvidia.com/cuda/index.html (2017)
[42] Pistone,G.、Riccomagno,E.、Wynn,H.P.:代数统计学:统计学中的计算交换代数。查普曼和霍尔/CRC,博卡拉顿(2000)·Zbl 0960.62003号 ·doi:10.1201/9781420035766
[43] Plackett,RL,排列分析,应用。Stat.,24,193-202,(1975)·doi:10.2307/2346567
[44] 萨塔斯,S;特维斯基,A,《团结与征服:选择概率的乘法不等式》,《计量经济学》,44,79-89,(1976)·Zbl 0319.62073号 ·doi:10.2307/1911382
[45] Suppes,P.、Krantz,D.H.、Luce,R.D.、Tversky,A.:测量基础:几何、阈值和概率表示。纽约学术出版社(1971)·Zbl 0719.03003号
[46] Tanner,M.A.:统计推断工具:探索后验分布和似然函数的方法。施普林格,纽约(1996)·兹比尔0846.62001 ·doi:10.1007/978-1-4612-4024-2
[47] Thurstone,LL,心理物理分析,美国心理学杂志。,38, 368-389, (1927) ·数字对象标识代码:10.2307/1415006
[48] Turnbull,BW,具有任意分组、删减和截断数据的经验分布函数,J.R.Stat.Soc.Ser。B(Methodol.),38,290-295,(1976)·Zbl 0343.62033号
[49] 特维斯基,A,《方面消除:选择理论》,《心理学》。修订版,79,281-299,(1972)·doi:10.1037/h0032955
[50] Wu,CFJ,关于EM算法的收敛性,Ann.Stat.,11,95-103,(1983)·Zbl 0517.62035号 ·doi:10.1214/aos/1176346060
[51] 严,T;杨,Y;Xu,J,布莱德雷-特里模型中的稀疏配对比较,《中国统计》,221305-1318,(2012)·Zbl 06072109号 ·doi:10.5705/ss.2010.299
[52] 泽梅洛,E,Die berechnung der turnier-ergebnisse als ein maximump roblem der wahrscheinlichkeitsrechnunng,Mathematische Zeitschrift,29,436-460,(1929)·doi:10.1007/BF01180541
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。