×

兹马思-数学第一资源

洛杉矶无家可归者的小面积估计:成本敏感随机梯度提升的应用。(英语) Zbl 1202.62178
摘要:在许多大都市地区,人们努力统计无家可归者,以确保适当提供社会服务。一些区域非常大,这使得空间采样成为一种可行的替代方法,而不是对整个地形进行计数。在采样区域观察到计数,但必须在未访问区域进行估算。随着插补过程的进行,低估和高估的代价可能不同。例如,如果在无家可归人数较多的地区进行精确估计是至关重要的,那么低估比高估损失函数更为严重。
我们分析了2004-2005年洛杉矶县无家可归者研究的数据,使用了一种随机梯度增强的方法,这种方法可以不对称地对高估和低估进行加权。我们讨论我们的选择使用随机梯度升压超过其他函数估计程序。分析了不同成本函数的样本内拟合值和样本外插补值,以及响应与预测值之间的关系。本文简要讨论了这些结果的实际应用和政策含义。

理学硕士:
62P25页 统计学在社会科学中的应用
65立方英尺 统计计算问题(MSC2010)
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] 伯克,R.A.(2008年)。从回归角度进行统计学习。斯普林格,纽约。·Zbl 1258.62047
[2] Berk,R.A.和MacDonald,J.(2010年)。为无家可归者提供治安:减少无家可归者相关犯罪的努力评估。犯罪学与公共政策。
[3] Berk,R.A.,Brown,L.和Zhao,L.(2010年)。模型选择后的统计推断。定量犯罪学杂志。出现。可在·www.springerlink.com
[4] Berk,R.A.,Kriegler,B.和Baek,J.H.(2006年)。预测危险的囚犯不当行为:集合统计程序的应用。定量犯罪学杂志22 131-145。
[5] Berk,R.A.,Kriegler,B.和Ylvisaker,D.(2008年)。计算洛杉矶县无家可归的人。概率与统计学:纪念大卫·A·弗里德曼的论文。数学教学。统计学家。收集。22127-141。艾姆斯,海滩,哦。·Zbl 1166.62381号·doi:10.1214/193940307000000428
[6] Binder,H.(2009年)。GAMBoost:基于似然boosting的广义加性模型。R版本1.1。可在·www.r-project.org
[7] Bratton,W.和Knobler,P.(1998年)。转机:美国最高警察如何扭转犯罪流行。兰登豪斯,纽约。
[8] 布雷曼,L.(1996年)。装袋预测因子。机器学习26 123-140。·Zbl 0858.68080
[9] 布雷曼,L.(2001年)。随机森林。机器学习45 5-32。·Zbl 1007.68152号·doi:10.1023/账号:1010933404324
[10] Breiman,L.,Friedman,J.H.,Olshen,R.A.和Stone,C.J.(1984年)。分类和回归树。华兹华斯,蒙特利,加利福尼亚州·Zbl 0541.62042
[11] Bühlmann,P.和Hothorn,T.(2007年)。Boosting算法:正则化、预测和模型拟合。统计学家。科学。22477-505。·Zbl 1246.62163·doi:10.1214/07-STS242
[12] Bühlmann,P.和Yu,B.(2003年)。l2损失的助推:回归和分类。J、 阿默尔。统计学家。协会98 324-340。·Zbl 1041.62029·doi:10.1198/016214503000125
[13] Cordray,D.S.和Pion,G.M.(1991年)。数字背后是什么?计算无家可归者的定义问题。住房政策辩论2587-616。
[14] Cowen,D.D.(1991年)。通过多个服务联系人估算普查和调查少计人数。住房政策辩论2869-882。
[15] 卡普,M.(2006年)。ada:执行二进制响应的提升算法。R包2.0-1。可在·www.r-project.org
[16] 卡普,M.,Michailidis,G.和Johnson,K.(2006年)。ada:随机激励的R包。统计软件杂志17。
[17] Fan,W.,Stolfo,S.J.,Zhang,J.和Chan,P.K.(1999年)。Adacost:错误分类成本敏感提升。机器学习:第十六届国际会议论文集97-105。布莱德,斯洛文尼亚。
[18] Freund,Y.和Schapire,R.(1997年)。在线学习的决策理论推广及其在boosting中的应用。J、 计算机。系统科学。55119-139。·Zbl 0880.68103·doi:10.1006/jcss.1997.1504
[19] 弗里德曼,J.H.(2001年)。贪心函数逼近:一个梯度提升机。安。统计学家。公元1189-1232年。·Zbl 1043.62034·doi:10.1214/aos/1013203451
[20] 弗里德曼,J.H.(2002年)。随机梯度增强。计算机。统计学家。数据分析。38367-378。·Zbl 1072.65502·doi:10.1016/S0167-9473(01)00065-2
[21] Friedman,J.H.,Hastie,T.和Tibshirani,R.(2000年)。统计回归的逻辑分析:加性回归。安。统计学家。28337-374。·Zbl 1106.62323·doi:10.1214/aos/1016218223·欧几里得:aos/1016218223
[22] Harcourt,B.E.(2005年)。洛杉矶贫民区治安:洛杉矶市中心的犯罪和房地产开发(实时实验)。2005年芝加哥大学法律论坛325-404。
[23] Hastie,T.,Tibshirani,R.和Friedman J.(2001年)。统计学习的要素。斯普林格,纽约。·Zbl 0973.62007
[24] Hothorn,T.(2009年)。mboost:基于模型的提升。R包1.1-2。可在·www.r-project.org
[25] Hyndman,R.J.和Fan,Y.(1996年)。统计包中的样本分位数。阿默尔。统计学家。50 361-365。
[26] Koegel,P.,Burnam,A.和Farr,R.K.(1988年)。洛杉矶市中心无家可归者中特定精神疾病的患病率。普通精神病学档案45 1085-1092。
[27] Koenker,R.(2005年)。分位数回归。剑桥大学出版社,纽约。·Zbl 1111.62037
[28] Koenker,R.(2009年)。分位数回归。R包4.38。可在·www.r-project.org
[29] Kushel,M.B.,Evans,J.L.,Perry,S.,Robertson,M.J.和Moss,A.R.(2003年)。无门可锁:无家可归者和边缘居住者的受害。拱门。实习生。医学。163 2492-2499。
[30] Leeb,H.和Pötscher,B.M.(2005年)。模型选择与推理:事实与虚构。经济。理论21 21-59。·Zbl 1085.62004·doi:10.1017/S0266466605050036
[31] Leeb,H.和Pötscher,B.M.(2006年)。可以估计后模型选择估计量的条件分布吗?安。统计学家。342554-2591。·Zbl 1106.62029·doi:10.1214/009053606000000821
[32] 洛佩兹,S.(2005年)。恶魔在贫民区获胜。洛杉矶时报,10月16日。
[33] Madigan,D.和Ridgeway,G.(2004年)。关于“最小角度回归”的讨论。统计学家。32465-469。·Zbl 1091.62054·doi:10.1214/009053604000000067
[34] Magnano,P.F.和Blasi,G.(2007年)。卡在滑道上。《洛杉矶时报》(评论版),10月29日。
[35] Mease,D.和Wyner,A.(2008年)。与统计观点相反的证据。J、 马赫。学习。第9号决议131-156。
[36] Mease,D.,Wyner,A.和Buja,A.(2007年)。带有抖动和过/欠采样的成本加权提升:JOUS boost。J、 马赫。学习。第8 409-439号决议。·Zbl 1222.68261
[37] 梅恩绍森,N.(2006年)。分位数回归森林。J、 马赫。学习。第7 983-999号决议。·Zbl 1222.68262·www.jmlr.org
[38] Rao,J.N.K.(2003年)。小区域估计。威利,霍博肯,新泽西州。·Zbl 1026.62003
[39] Ridgeway,G.(2007年)。广义增强回归模型。R包1.6-3。可在·www.r-project.org
[40] 罗西,P.H.(1989年)。穷困潦倒的美国:无家可归的起源。芝加哥大学出版社,芝加哥。
[41] 罗西,P.H.(1991年)。1990年代无家可归者研究策略。住房政策辩论22029-1055。
[42] Schapire,R.E.(1999年)。升压简介。第十六届国际人工智能联席会议论文集2 1401-1406。摩根考夫曼,旧金山,加利福尼亚州。
[43] Sexton,J.(2009)gbev:具有变量误差的梯度增强回归树。R包0.1.1。可在·www.r-project.org
[44] Takeuchi,I.,Le,Q.V.,Sears,T.D.和Smola,A.J.(2006年)。非参数分位数回归。J、 马赫。学习。第7号决议1231-1264。·Zbl 1222.68316·www.jmlr.org
[45] 丁建民(2000)。成本敏感boosting算法的比较研究。第十七届机器学习国际会议论文集983-990。摩根考夫曼,旧金山,加利福尼亚州。
[46] Wilson,J.Q.和Kelling,G.L.(1982年)。破碎的窗户:警察和邻居的安全。大西洋月刊3月29-38日。
[47] Wright,J.D.和Devine,J.A.(1992年)。统计无家可归者:人口普查局在美国五个城市的“夜晚”。评审365-364。
[48] 张琰、于乙(2005)。提前停止促进:收敛性和一致性。安。统计学家。33 1538-1579。·Zbl 1078.62038·doi:10.1214/009053605000000255
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。