×

使用核心方法对稀疏时空事件进行可扩展的高分辨率预测:NIJ“实时犯罪预测挑战”的成功解决方案。 (英语) Zbl 1435.62431号

摘要:我们提出了一种通用时空事件预测方法,该方法是我们为国家司法研究所(NIJ)实时犯罪预测挑战(国家司法研究院(2017))开发的。我们的方法是一个时空预测模型,该模型结合了可扩展的随机再生核-希尔伯特空间(RKHS)方法,用于在正则化监督学习框架中用自回归平滑核逼近高斯过程。虽然平滑核函数捕获了犯罪预测领域当前使用的两种主要方法,即核密度估计(KDE)和自激点过程(SEPP)模型,但该模型的RKHS成分可以理解为对流行的log-Gaussian-Cox过程模型的近似。为了进行推理,我们将时空点模式离散化,并使用泊松似然法和高效的基于梯度的优化方法学习对数密集度函数。使用交叉验证学习模型超参数,包括RKHS近似质量、空间和时间核长度尺度、自回归滞后数和平滑核的带宽以及单元形状、大小和旋转。对于稀疏事件,结果预测明显超过了基线KDE估计值和SEPP模型。

理学硕士:

62第25页 统计学在社会科学中的应用
62M10个 统计学中的时间序列、自相关、回归等(GARCH)
62M20型 随机过程推断和预测
62H11型 定向数据;空间统计学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Adams,R.P.、Murray,I.和MacKay,D.J.(2009年)。高斯过程强度泊松过程中的可追踪非参数贝叶斯推断。第26届国际机器学习年会论文集9-16。纽约ACM。
[2] Adepeju,M.、Rosser,G.和Cheng,T.(2016)。稀疏时空点过程热点预测的新评估指标——犯罪案例研究。国际地质杂志。信息科学。30 2133-2154.
[3] Berk,R.、Heidari,H.、Jabbari,S.、Kearns,M.和Roth,A.(2018年)。刑事司法风险评估中的公平:最新技术。社会学。方法研究0049124118782533。
[4] Bhatt,S.、Cameron,E.、Flaxman,S.R.、Weiss,D.J.、Smith,D.L.和Gething,P.W.(2017)。使用高斯过程叠加泛化提高疾病风险图的预测精度。J.R.Soc.接口14 20170520。
[5] Brix,A.和Diggle,P.J.(2001)。对数高斯Cox过程的时空预测。J.R.统计社会服务。B.统计方法。63 823-841. ·Zbl 0996.62076号 ·doi:10.1111/1467-9868.00315
[6] Caplan,J.M.、Kennedy,L.W.和Miller,J.(2011)。风险地形建模:经纪犯罪学理论和犯罪预测的GIS方法。法官问28 360-381。
[7] Chainey,S.P.(2013)。研究细胞大小和带宽大小对核密度估计犯罪热点图的影响,以预测犯罪的空间模式。牛市。地理。Soc.列日60 7-19。
[8] Chainey,S.和Ratcliffe,J.(2005)。地理信息系统和犯罪绘图。纽约威利。
[9] Chainey,S.、Tompson,L.和Uhlig,S.(2008)。热点映射在预测犯罪空间模式中的应用。安全。《期刊》第21卷第4-28页。
[10] Cohen,J.、Gorr,W.L.和Olligschlaeger,A.M.(2007)。领先指标和空间互动:主动部署警察的犯罪预测模型。地理。分析。39 105-127.
[11] Corbett Davies,S.、Pierson,E.、Feller,A.、Goel,S.和Huq,A.(2017)。算法决策和公平成本。第23届ACM SIGKDD知识发现和数据挖掘国际会议论文集797-806。纽约ACM。
[12] 坎宁安,J.P.、谢诺伊,K.V.和萨哈尼,M.(2008)。用于点过程强度估计的快速高斯过程方法。192-199年第25届国际机器学习会议论文集。纽约ACM。
[13] Diggle,P.J.、Moraga,P.、Rowlingson,B.和Taylor,B.M.(2013)。空间和时空log-Gaussian Cox过程:扩展地质统计学范式。统计师。科学。28 542-563. ·Zbl 1331.86027号 ·doi:10.1214/13-STS441
[14] Dressel,J.和Farid,H.(2018年)。预测累犯的准确性、公平性和局限性。科学。第4版,共5580页。
[15] Flaxman,S.R.(2014)。使用高斯过程预测犯罪率的一般方法。技术报告,宾夕法尼亚州匹兹堡卡内基梅隆大学亨氏信息系统与公共政策学院。
[16] Flaxman,S.、Wilson,A.、Neill,D.、Nickisch,H.和Smola,A.(2015)。非高斯概率高斯过程中的快速Kronecker推断。在机器学习国际会议607-616上。
[17] Flaxman,S.、Chirico,M.、Pereira,P.和Loefler,C.(2019a)。补充“用核心方法对稀疏时空事件进行可扩展的高分辨率预测:NIJ‘实时犯罪预测挑战’的成功解决方案”。DOI:10.1214/19-AOAS1284SUPA·Zbl 1435.62431号
[18] Flaxman,S.、Chirico,M.、Pereira,P.和Loefler,C.(2019b)。“使用核心方法对稀疏时空事件进行可扩展的高分辨率预测:NIJ‘实时犯罪预测挑战’的成功解决方案”的源代码。DOI:10.1214/19-AOAS1284SUPPB·Zbl 1435.62431号
[19] Friedman,J.、Hastie,T.和Tibshirani,R.(2010)。广义线性模型的坐标下降正则化路径。J.统计软件。33 1-22.
[20] Gerber,M.S.(2014)。使用推特和内核密度估计预测犯罪。Decis公司。支持系统。61 115-125.
[21] Gorr,W.L.(2009)。使用接收器操作特性曲线对异常报告进行预测准确度测量。国际期刊预测。25 48-61.
[22] Gorr,W.L.和Lee,Y.(2015)。临时犯罪热点预警系统。J.数量。克里米诺。31 25-47.
[23] Gorr,W.、Olligschlaeger,A.和Thompson,Y.(2003)。犯罪的短期预测。国际期刊预测。19 579-594.
[24] Groff,E.和Taniguchi,T.(2019年)。使用公民通知中断近重复住宅盗窃模式:微观近重复实验。《克里米诺实验杂志》。15 115-149.
[25] Guttorp,P.和Gneiting,T.(2005)。关于Whittle-Matérn相关家族。华盛顿州西雅图国家统计与环境技术报告系列研究中心·Zbl 1436.62013年
[26] Heaton,M.J.、Datta,A.、Finley,A.O.、Furrer,R.、Guinness,J.、Guhaniyogi,R.、Gerber,F.、Gramacy,R.B.、Hammerling,D.等人(2019)。一个案例研究大型空间数据分析方法之间的竞争。《农业杂志》。生物与环境。《美国联邦法律》第24卷第398-425页·Zbl 1426.62345号 ·doi:10.1007/s13253-018-00348-w
[27] Hennig,P.、Osborne,M.A.和Girolma,M.(2015)。概率数字和计算中的不确定性。程序。R.Soc.伦敦。序列号。数学。物理学。工程科学。471 20150142, 17. ·Zbl 1372.65010号 ·doi:10.1098/rspa.2015.0142
[28] 亨特,J.M.(2016)。犯罪热点会移动吗?探讨可修改区域单位问题和可修改时间单位问题对犯罪热点稳定性的影响。华盛顿特区美国大学博士论文。
[29] Johnson,S.D.、Bowers,K.J.、Birks,D.J.和Pease,K.(2009年)。ProMap犯罪预测图:准确性、分析单位和环境背景。《将犯罪置于适当位置》(D.Weisburd、W.Bernasco和G.Bruinsma编辑)165-192年。多德雷赫特·施普林格。
[30] Kang,H.-W.和Kang,H-B.(2017)。使用深度学习从多模态数据预测犯罪发生。公共科学图书馆ONE 12 e0176244。
[31] 莱文,N.(2004)。CrimeStat:用于分析犯罪事件地点的空间统计程序,3.0版。技术报告,Ned Levine and Associates/国家司法研究所,华盛顿特区。
[32] Liu,H.和Brown,D.E.(2003)。使用基于点对图的密度模型预测犯罪事件。Int.J.预测。19 603-622.
[33] Lloyd,C.、Gunter,T.、Osborne,M.和Roberts,S.(2015)。高斯过程调制泊松过程的变分推理。在1814-1822年国际机器学习会议上。
[34] Loefler,C.和Flaxman,S.(2018年)。枪支暴力会传染吗?时空测试。J.数量。克里米诺。34 999-1017.
[35] Lum,K.和Isaac,W.(2016年)。预测和服务?意义13 14-19。
[36] Makridakis,S.、Spiliotis,E.和Assimakopoulos,V.(2018年)。统计和机器学习预测方法:关注点和前进方向。公共图书馆综合服务13 e0194889。
[37] May,A.、Bagheri Garakani,A.、Lu,Z.等人(2019年)。语音识别的核近似方法。J.马赫。学习。决议20第59、36号文件·Zbl 1489.68244号
[38] Milton,P.、Coupland、H.Giorgi,E.和Bhatt,S.(2019年)。线性回归和核函数使空间分析变得容易。流行病。DOI:10.1016/j.epidem.2019.100362。
[39] Mitchell,S.、Potash,E.、Barocas,S.,D'Amour,A.和Lum,K.(2018年)。基于预测的决策和公平:一系列选择、假设和定义。可从arXiv:1811.07867获取。
[40] Mohler,G.(2013)。犯罪与安全数据中多源聚类的建模与估计。附录申请。《美国联邦法律大全》第7卷第1525-1539页·Zbl 1454.62504号 ·doi:10.1214/13-AOAS647
[41] Mohler,G.(2014)。芝加哥凶杀案和枪支犯罪预测的标记点过程热点地图。国际期刊预测。30 491-497.
[42] Mohler,G.和Porter,M.D.(2018年)。旋转网格,PAI最大化犯罪预测。统计分析。数据最小值11 227-236·Zbl 07260741号
[43] Mohler,G.O.、Short,M.B.、Brantingham,P.J.、Schoenberg,F.P.和Tita,G.E.(2011)。犯罪的自激点过程建模。J.Amer。统计师。协会106 100-108·Zbl 1396.62224号 ·doi:10.1198/jasa.2011.ap09546
[44] Mohler,G.O.、Short,M.B.、Malinowski,S.、Johnson,M.、Tita,G.E.、Bertozzi,A.L.和Brantingham,P.J.(2015)。预测性警务的随机对照现场试验。J.Amer。统计师。协会110 1399-1411。
[45] Möller,J.和Rasmussen,J.G.(2005)。霍克斯过程的完美模拟。申请中的预付款。普罗巴伯。37 629-646. ·Zbl 1074.60057号 ·doi:10.1239/ap/112748739
[46] Möller,J.、Syversveen,A.R.和Waagepetersen,R.P.(1998年)。对数高斯Cox过程。扫描。《美国联邦法律大全》第25卷第451-482页·Zbl 0931.60038号 ·doi:10.1111/1467-9469.00115
[47] O'Hagan,A.(1992年)。一些贝叶斯数值分析。贝叶斯统计,4(佩尼斯科拉,1991)345-363。牛津大学出版社,纽约。
[48] 国家司法研究所(2017)。实时犯罪预测挑战。可在http://www.nij.gov/funding/Pages/fy16-crime-forecasting-challenge.aspx。
[49] Ogata,Y.(1988年)。地震发生的统计模型和点过程的残差分析。J.Amer。统计师。协会83 9-27。
[50] Pease,K.等人(1998年)。重复受害:盘点90。英国内政部警察研究小组,伦敦。
[51] Perry,W.L.、McInnis,B.、Price,C.C.、Smith,S.C.和Hollywood,J.S.(2013)。预测性警务:犯罪预测在执法行动中的作用。技术报告,兰德公司,加利福尼亚州圣莫尼卡。
[52] Porter,M.D.和Reich,B.J.(2012年)。评估用于预测序列中下一个事件位置的时间加权核密度方法。GIS年鉴18 225-240。
[53] Rahimi,A.和Recht,B.(2007年)。大型内核机的随机特性。神经信息处理系统进展1177-1184。
[54] Rasmussen,C.E.和Williams,C.K.I.(2006)。机器学习的高斯过程。自适应计算和机器学习。麻省理工学院出版社,马萨诸塞州剑桥·Zbl 1177.68165号
[55] Rodrigues,A.和Diggle,P.J.(2012)。使用低秩模型对非均匀时空对数高斯-考克斯过程进行贝叶斯估计和预测,并应用于刑事监视。J.Amer。统计师。协会107 93-101·Zbl 1261.62086号 ·doi:10.1080/01621459.2011.644496
[56] Rosser,G.和Cheng,T.(2019年)。通过各向同性触发,利用自激点过程提高犯罪预测的鲁棒性和准确性。应用。空间分析。政策12 5-25。
[57] Rosser,G.、Davies,T.、Bowers,K.J.、Johnson,S.D.和Cheng,T.(2016)。预测犯罪地图:任意网格还是街道网络?J.数量。克里米诺。33 569-594.
[58] Rudin,C.和Ustun,B.(2018年)。优化的评分系统:为医疗和刑事司法提供机器学习方面的信任。接口48 449-466。
[59] Schölkopf,B.和Smola,A.J.(2002年)。使用内核学习:支持向量机、正则化、优化及其他。麻省理工学院出版社,马萨诸塞州剑桥。
[60] Schutt,H.G.(1922年)。伯克利先进的警察方法。国家。穆尼克。修订版11 80-85。
[61] Shirota,S.和Gelfand,A.E.(2017年)。空间和循环时间对数高斯-考克斯过程及其在犯罪事件数据中的应用。附录申请。统计11 481-503·Zbl 1416.62689号 ·doi:10.1214/16-AOAS960
[62] Snoek,J.、Larochelle,H.和Adams,R.P.(2012)。机器学习算法的实用贝叶斯优化。神经信息处理系统进展2951-2959。
[63] Sriperumbudur,B.K.,Fukumizu,K.和Lanckriet,G.R.G.(2011)。测度的普遍性、特征核和RKHS嵌入。J.马赫。学习。第12号决议2389-2410·Zbl 1280.68198号
[64] Sun,Y.、Li,B.和Genton,M.G.(2012)。大型数据集的地理统计。自然事件时空建模的进展和挑战55-77。施普林格,纽约。
[65] Taddy,M.A.(2010年)。动态空间泊松过程的自回归混合模型:用于跟踪暴力犯罪强度。J.Amer。统计师。协会105 1403-1417·兹比尔1388.62379 ·doi:10.1198/jasa.2010.ap09655
[66] Teh,Y.W.和Rao,V.(2011年)。高斯过程调制更新过程。神经信息处理系统进展2474-2482。
[67] Wang,X.、Gerber,M.S.和Brown,D.E.(2012)。使用从推特帖子中提取的事件进行自动犯罪预测。在社会计算行为文化建模和预测231-238。柏林施普林格。
[68] Weinberger,K.、Dasgupta,A.、Langford,J.、Smola,A.和Attenberg,J.(2009)。用于大规模多任务学习的特征哈希。第26届机器学习国际年会论文集。ICML’09 1113-1120。纽约ACM。
[69] Zou,H.和Hastie,T.(2005)。通过弹性网进行规则化和变量选择。J.R.统计社会服务。B.统计方法。67 301-320. ·Zbl 1069.62054号 ·数字对象标识代码:10.1111/j.1467-9868.2005.0050.x
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。