×

用大数据集和大量参数估计异质种群的种群规模。 (英语) 兹比尔1507.62105

摘要:提出了一种广义偏线性回归模型,用于从时变异质种群的多个列表中估计特定时间的种群规模。我们面临的挑战是,在很长一段时间内,我们有数百万条记录和数百个参数。这对数据分析提出了挑战,主要是由于计算机内存的限制、计算收敛性和不可行性。本文提出了一种分析方法,用于对具有大量参数的大型数据集进行建模。基本思想是将最大似然估计量分别应用于每次观测的数据,然后通过加权平均将这些结果组合起来,使最终的估计量成为整个数据集(完整MLE)的最大似然估计器。导出了所提出估计量的渐近分布和推断。仿真研究表明,该方法与完全MLE具有完全相同的性能,但该方法在计算上是可行的,而完全MLE不可行,如果两种方法都有效,则计算成本比完全MLE低得多。该方法用于估计香港1977-2014年期间的药物滥用者人数。

MSC公司:

62-08 统计问题的计算方法
62页第10页 统计学在生物学和医学中的应用;元分析
62D05型 抽样理论、抽样调查
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Alho,J.M.,捕获-再捕获模型中的Logistic回归,生物统计学,46,623-635(1990)·Zbl 0709.62100号
[2] 赵,A。;Lee,S.-M.,通过样本覆盖率估计班级数量,J.Amer。统计师。协会,87,210-217(1992)·Zbl 0850.62145号
[3] Chen,K.,《重新捕获和移除研究的参数和半参数模型:似然方法》,J.R.Stat.Soc.Ser。《美国统计年鉴》。,63, 607-619 (2001) ·Zbl 0989.62069号
[4] 陈,X。;谢,M.,《分析超大数据的分而治之方法》,《统计学》。Sinica,24,1655-1684(2014)·Zbl 1480.62258号
[5] Claggett,B。;谢,M。;Tian,L.,《使用固定、未知、研究特定参数的荟萃分析》,J.Amer。统计师。协会,1091660-1671(2014)·Zbl 1368.62107号
[6] Cormack,R.M.,捕获-再捕获的对数线性模型,生物统计学,45,395-413(1989)·兹伯利0707.62244
[7] Cormack,R.M。;Jupp,P.E.,捕获再捕获实验的泊松和多项式模型推断,生物统计学,78,911-916(1991)·Zbl 0754.62084号
[8] 风扇,T.H。;Cheng,K.F.,《海量数据集回归分析的测试和变量选择》,Data Knowl。工程师,63,3,811-819(2007)
[9] Fienberg,S.E.,《封闭人口和不完整2k列联表的多重再捕获普查》,《生物统计学》,59,591-603(1972)·Zbl 0255.62048号
[10] 吉梅内兹,O。;克雷尼西亚努,C。;Barbraud,C。;Jenouvrier,S。;Morgan,B.J.,捕获-再捕获建模中的半参数回归,生物统计学,62,3,691-698(2006)·Zbl 1112.62126号
[11] Huggins,R.M.,《捕获实验的统计分析》,《生物统计学》,76,133-140(1989)·Zbl 0664.62115号
[12] Huggins,R.M。;Stoklosa,J。;罗奇,C。;Yip,P.S.F.,使用稀疏捕获-再捕获数据估计开放人群的规模,生物计量学,74280-288(2018)·Zbl 1415.62105号
[13] Huggins,R.M。;Yang,H.C。;赵,A。;Yip,P.S.F.,使用开放人群的本地样本覆盖率估计人口规模,J.Statist。计划。推理,113699-714(2003)·Zbl 1043.62095号
[14] Huggins,R.M。;Yip,P.S.F.,利用加权鞅方法从捕获-再捕获数据估计开放种群的规模,生物计量学,55387-395(1999)·Zbl 1059.62660号
[15] Huggins,R.M。;叶,P.S.F。;Stoklosa,J.,《重复多重列表中开放人群规模的非参数估计》,澳大利亚。N.Z.J.Stat.,58,1-13(2016)
[16] Hwang,W.H。;Huggins,R.M.,捕获-再捕获实验中捕获功能行为反应的半参数模型,澳大利亚。N.Z.J.Stat.,53,191-202(2011)·Zbl 1336.62014年
[17] 捕获-再捕获和多记录系统估计。I: 《历史与理论发展》,美国流行病学杂志。,142, 1047-1058 (1995)
[18] 捕获-再捕获和多记录系统估计。二: 《在人类疾病中的应用》,美国流行病学杂志。,142, 1059-1068 (1995)
[19] Lebreton,J.-D。;Burnham,K.P。;克洛伯特,J。;Anderson,D.R.,《使用标记动物建模生存和测试生物假设:案例研究的统一方法》,Ecol。专著,62,67-118(1992)
[20] Lehmann,E.L.,《大样本理论的要素》(1999),Springer:Springer New York·Zbl 0914.62001号
[21] Lin,N。;Xi,R.,聚合估计方程估计,统计界面,473-83(2011)·Zbl 1245.62026号
[22] 林海珍。;叶,P.S.F。;Chen,F.,估计开放总体多列表问题的总体规模,统计学家。Sinica,19,177-196(2009)·Zbl 1153.62307号
[23] Lin,D.Y。;Zeng,D.,关于在荟萃分析中使用汇总统计数据与个体水平数据的相对效率,Biometrika,97,321-332(2010)·Zbl 1205.62174号
[24] 刘博士。;Liu,R.Y。;谢,M。;何,X。;刘杰。;易卜拉欣,J.,《仅使用汇总统计的异质性研究的多元荟萃分析:效率和稳健性》,J.Amer。统计师。协会,110326-340(2014)·Zbl 1373.62135号
[25] 刘博士。;Yep,P.S。;Huggins,R.M.,使用重复多重列表的边际数据估计开放人群规模的非参数方法,奥斯汀。N.Z.J.Stat.,49,303-320(2007)·兹比尔1136.62330
[26] Pollock,K.,《捕获-再捕获建模中辅助变量的使用:概述》,J.Appl。统计,27,85-102(2002)·Zbl 1346.62152号
[27] Stoklosa,J。;Huggins,R.M.,《具有时间依赖性和异质性的封闭种群捕获-再捕获模型的稳健p-样条方法》,计算。统计师。数据分析。,56, 408-417 (2012) ·Zbl 1239.62011号
[28] Stoklosa,J。;Hwang,W.H。;叶,P.S.F。;Huggins,R.M.,《解释开放种群捕获-再捕获模型协变量中的污染和异常值》,J.Statist。计划。推理,176,52-63(2016)·Zbl 1341.62315号
[29] van der Vaart,A.W.,《渐近统计》(1998),剑桥大学出版社:剑桥大学出版社·Zbl 0910.62001号
[30] Yang,H.C。;Huggins,R.M.,使用局部估计方程估计开放人口的规模,统计。Sinica,13673-689(2003)·Zbl 1039.62108号
[31] Yang,H.C。;Huggins,R.M。;Clark,A.S.S.,《使用局部估计方程II估算开放人群的规模:部分参数方法》,《生物统计学》,59,365-374(2003)·Zbl 1210.62234号
[32] 叶,P.S.F。;Wan,E.C.Y。;Chan,K.S.,在任意去除的捕获-再捕获研究中估算种群规模的统一方法,J.Agric。生物与环境。Stat.,6183-194(2001)
[33] 曾博士。;Lin,D.Y.,《关于随机效应的元分析》,Biometrika,102281-294(2015)·Zbl 1452.62862号
[34] Zwane,E。;van der Heijden,P.,用协变量进行捕获-再捕获研究的半参数模型,计算。统计师。数据分析。,47, 729-743 (2004) ·Zbl 1429.62642号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。