克里格勒,布莱恩;伯克,理查德 洛杉矶无家可归者的小面积估计:成本敏感随机梯度提升的应用。(英语) Zbl 1202.62178 安。申请。斯达。 4,第3期,1234-1255(2010年). 摘要:在许多大都市地区,人们努力统计无家可归者,以确保适当提供社会服务。一些区域非常大,这使得空间采样成为一种可行的替代方法,而不是对整个地形进行计数。在采样区域观察到计数,但必须在未访问区域进行估算。随着插补过程的进行,低估和高估的代价可能不同。例如,如果在无家可归人数较多的地区进行精确估计是至关重要的,那么低估比高估损失函数更为严重。我们分析了2004-2005年洛杉矶县无家可归者研究的数据,使用了一种随机梯度增强的方法,这种方法可以不对称地对高估和低估进行加权。我们讨论我们的选择使用随机梯度升压超过其他函数估计程序。分析了不同成本函数的样本内拟合值和样本外插补值,以及响应与预测值之间的关系。本文简要讨论了这些结果的实际应用和政策含义。 引用于5文件 理学硕士: 62P25页 统计学在社会科学中的应用 65立方英尺 统计计算问题(MSC2010) 关键词:无家可归;助推;统计学习;成本;插补;分位数估计;小区域估算 软件:阿达;AdaBoost.MH版;AdaCost公司;藤蔓;gbev公司;gbm公司;mboost公司;quantreg公司 PDF格式 BibTeX公司 XML 引用 \text它{B.Kriegler}和\texdit{R.Berk},安。申请。Stat.4,No.3,1234--1255(2010年;Zbl 1202.62178) 全文: 内政部 参考文献: [1] 伯克,R.A.(2008年)。从回归角度进行统计学习。斯普林格,纽约。·Zbl 1258.62047 [2] Berk,R.A.和MacDonald,J.(2010年)。为无家可归者提供治安:减少无家可归者相关犯罪的努力评估。犯罪学与公共政策。 [3] Berk,R.A.,Brown,L.和Zhao,L.(2010年)。模型选择后的统计推断。定量犯罪学杂志。出现。可在·www.springerlink.com [4] Berk,R.A.,Kriegler,B.和Baek,J.H.(2006年)。预测危险的囚犯不当行为:集合统计程序的应用。定量犯罪学杂志22 131-145。 [5] Berk,R.A.,Kriegler,B.和Ylvisaker,D.(2008年)。计算洛杉矶县无家可归的人。概率与统计学:纪念大卫·A·弗里德曼的论文。数学教学。统计学家。收集。22127-141。艾姆斯,海滩,哦。·Zbl 1166.62381号·doi:10.1214/193940307000000428 [6] Binder,H.(2009年)。GAMBoost:基于似然boosting的广义加性模型。R版本1.1。可在·www.r-project.org [7] Bratton,W.和Knobler,P.(1998年)。转机:美国最高警察如何扭转犯罪流行。兰登豪斯,纽约。 [8] 布雷曼,L.(1996年)。装袋预测因子。机器学习26 123-140。·Zbl 0858.68080 [9] 布雷曼,L.(2001年)。随机森林。机器学习45 5-32。·Zbl 1007.68152号·doi:10.1023/账号:1010933404324 [10] Breiman,L.,Friedman,J.H.,Olshen,R.A.和Stone,C.J.(1984年)。分类和回归树。华兹华斯,蒙特利,加利福尼亚州·Zbl 0541.62042 [11] Bühlmann,P.和Hothorn,T.(2007年)。Boosting算法:正则化、预测和模型拟合。统计学家。科学。22477-505。·Zbl 1246.62163·doi:10.1214/07-STS242 [12] Bühlmann,P.和Yu,B.(2003年)。l2损失的助推:回归和分类。J、 阿默尔。统计学家。协会98 324-340。·Zbl 1041.62029·doi:10.1198/016214503000125 [13] Cordray,D.S.和Pion,G.M.(1991年)。数字背后是什么?计算无家可归者的定义问题。住房政策辩论2587-616。 [14] Cowen,D.D.(1991年)。通过多个服务联系人估算普查和调查少计人数。住房政策辩论2869-882。 [15] 卡普,M.(2006年)。ada:执行二进制响应的提升算法。R包2.0-1。可在·www.r-project.org [16] 卡普,M.,Michailidis,G.和Johnson,K.(2006年)。ada:随机激励的R包。统计软件杂志17。 [17] Fan,W.,Stolfo,S.J.,Zhang,J.和Chan,P.K.(1999年)。Adacost:错误分类成本敏感提升。机器学习:第十六届国际会议论文集97-105。布莱德,斯洛文尼亚。 [18] Freund,Y.和Schapire,R.(1997年)。在线学习的决策理论推广及其在boosting中的应用。J、 计算机。系统科学。55119-139。·Zbl 0880.68103·doi:10.1006/jcss.1997.1504 [19] 弗里德曼,J.H.(2001年)。贪心函数逼近:一个梯度提升机。安。统计学家。公元1189-1232年。·Zbl 1043.62034·doi:10.1214/aos/1013203451 [20] 弗里德曼,J.H.(2002年)。随机梯度增强。计算机。统计学家。数据分析。38367-378。·Zbl 1072.65502·doi:10.1016/S0167-9473(01)00065-2 [21] Friedman,J.H.,Hastie,T.和Tibshirani,R.(2000年)。统计回归的逻辑分析:加性回归。安。统计学家。28337-374。·Zbl 1106.62323·doi:10.1214/aos/1016218223·欧几里得:aos/1016218223 [22] Harcourt,B.E.(2005年)。洛杉矶贫民区治安:洛杉矶市中心的犯罪和房地产开发(实时实验)。2005年芝加哥大学法律论坛325-404。 [23] Hastie,T.,Tibshirani,R.和Friedman J.(2001年)。统计学习的要素。斯普林格,纽约。·Zbl 0973.62007 [24] Hothorn,T.(2009年)。mboost:基于模型的提升。R包1.1-2。可在·www.r-project.org [25] Hyndman,R.J.和Fan,Y.(1996年)。统计包中的样本分位数。阿默尔。统计学家。50 361-365。 [26] Koegel,P.,Burnam,A.和Farr,R.K.(1988年)。洛杉矶市中心无家可归者中特定精神疾病的患病率。普通精神病学档案45 1085-1092。 [27] Koenker,R.(2005年)。分位数回归。剑桥大学出版社,纽约。·Zbl 1111.62037 [28] Koenker,R.(2009年)。分位数回归。R包4.38。可在·www.r-project.org [29] Kushel,M.B.,Evans,J.L.,Perry,S.,Robertson,M.J.和Moss,A.R.(2003年)。无门可锁:无家可归者和边缘居住者的受害。拱门。实习生。医学。163 2492-2499。 [30] Leeb,H.和Pötscher,B.M.(2005年)。模型选择与推理:事实与虚构。经济。理论21 21-59。·Zbl 1085.62004·doi:10.1017/S0266466605050036 [31] Leeb,H.和Pötscher,B.M.(2006年)。可以估计后模型选择估计量的条件分布吗?安。统计学家。342554-2591。·Zbl 1106.62029·doi:10.1214/009053606000000821 [32] 洛佩兹,S.(2005年)。恶魔在贫民区获胜。洛杉矶时报,10月16日。 [33] Madigan,D.和Ridgeway,G.(2004年)。关于“最小角度回归”的讨论。统计学家。32465-469。·Zbl 1091.62054·doi:10.1214/009053604000000067 [34] Magnano,P.F.和Blasi,G.(2007年)。卡在滑道上。《洛杉矶时报》(评论版),10月29日。 [35] Mease,D.和Wyner,A.(2008年)。与统计观点相反的证据。J、 马赫。学习。第9号决议131-156。 [36] Mease,D.,Wyner,A.和Buja,A.(2007年)。带有抖动和过/欠采样的成本加权提升:JOUS boost。J、 马赫。学习。第8 409-439号决议。·Zbl 1222.68261 [37] 梅恩绍森,N.(2006年)。分位数回归森林。J、 马赫。学习。第7 983-999号决议。·Zbl 1222.68262·www.jmlr.org [38] Rao,J.N.K.(2003年)。小区域估计。威利,霍博肯,新泽西州。·Zbl 1026.62003 [39] Ridgeway,G.(2007年)。广义增强回归模型。R包1.6-3。可在·www.r-project.org [40] 罗西,P.H.(1989年)。穷困潦倒的美国:无家可归的起源。芝加哥大学出版社,芝加哥。 [41] 罗西,P.H.(1991年)。1990年代无家可归者研究策略。住房政策辩论22029-1055。 [42] Schapire,R.E.(1999年)。升压简介。第十六届国际人工智能联席会议论文集2 1401-1406。摩根考夫曼,旧金山,加利福尼亚州。 [43] Sexton,J.(2009)gbev:具有变量误差的梯度增强回归树。R包0.1.1。可在·www.r-project.org [44] Takeuchi,I.,Le,Q.V.,Sears,T.D.和Smola,A.J.(2006年)。非参数分位数回归。J、 马赫。学习。第7号决议1231-1264。·Zbl 1222.68316·www.jmlr.org [45] 丁建民(2000)。成本敏感boosting算法的比较研究。第十七届机器学习国际会议论文集983-990。摩根考夫曼,旧金山,加利福尼亚州。 [46] Wilson,J.Q.和Kelling,G.L.(1982年)。破碎的窗户:警察和邻居的安全。大西洋月刊3月29-38日。 [47] Wright,J.D.和Devine,J.A.(1992年)。统计无家可归者:人口普查局在美国五个城市的“夜晚”。评审365-364。 [48] 张琰、于乙(2005)。提前停止促进:收敛性和一致性。安。统计学家。33 1538-1579。·Zbl 1078.62038·doi:10.1214/009053605000000255 此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。