一种用于监控摄像机中现实世界暴力检测的CNN-RNN组合结构
摘要
1.简介
ResNet和ConvLSTM的组合用于监控摄像机的异常检测。 我们使用了UCF-Crime数据集,其中包括监控摄像机在13类异常事件中记录的自然场景。 为了更好地理解每个异常类别,我们通过将正常场景与异常场景分开,定义了UCF犯罪的两个修改数据集。
2.相关工程
2.1. 卷积神经网络
2.2。 循环神经网络
2.3. CNN+RNN
3.建议方法
3.1、。 预处理
3.2. ResNet50公司
3.3. ConvLSTM公司
3.4. 分类
3.5. ResNet+ConvLSTM
首先,每个输入视频被划分为 n个 框架。 然后,每帧和下一帧之间的差异进入预处理阶段,作为ResNet结构的初始部分,包括数据增强、去噪和规范化。 接下来,每两个帧的差异将转到我们的ResNet50结构。 它经过34层Batch-Normalization、卷积、池和全连接层,以提供1000个向量大小的合适特征提取。 随后,每个图像的输出将成为相关ConvLSTM的输入。 每个ConvLSTM层将提供两个输入:一个来自之前的ConvLSTM256个特征地图,另一个来自ResNet50处理的数据。 因此,这种结构对空间顺序数据,尤其是视频数据非常有用。 我们在模型中使用的ConvLSTM由256个大小为 和步幅1。 最后,最后一个ConvLSTM层的输出,其中包括来自大小为的前一阶段的所有信息 ,转到 MaxPooling层之后是一些完全连接的层,以提供所需的分类。
4.实验结果
4.1. 数据集
4.2. 实验设置
4.3. 评价
5.结论、局限性和未来工作
作者贡献
基金
数据可用性声明
利益冲突
定义
AUC:ROC(接收器工作特性;默认)或PR(精确回忆)曲线的AUC(曲线下面积)是二进制分类器的质量度量。 此类使用黎曼和近似AUC。 在度量累加阶段,预测按值累加在预定义的存储桶中。 然后通过插值每个桶的平均值来计算AUC。 这些桶定义了评估的操作点。 准确性 :计算预测等于标签的频率。 此度量创建两个局部变量,total和count,用于计算频率 比赛 此频率最终以二进制精度返回:一个幂等运算,只需将总数除以计数。 :计算依据 哪里 表示真阳性数, 假阳性数。 :计算依据 哪里 表示真阳性数, 假阴性的数量。 F1芯 :该 F1芯 是精确度和召回率的调和平均值。 其中,当接近1时,它显示的值更好,而0表示的值最差 F1芯 。此指标的计算依据为 和 值如下: 混淆矩阵:提供分类问题的预测结果摘要,并以矩阵形式显示,以描述正确和错误预测的数量。
工具书类
Hospedales,T。; 龚,S。; Xiang,T.使用动态主题模型进行视频行为挖掘。 国际期刊计算。 视觉。 2012 , 98 , 303–323. [ 谷歌学者 ] [ 交叉参考 ] 苏尔曼,N。; 萨诺基,T。; Goldgof,D。; Kasturi,R.人类视频监控性能的有效性如何? 《2008年IEEE第19届模式识别国际会议论文集》,ICPR,美国佛罗里达州坦帕,2008年12月8-11日; 第1-3页。 [ 谷歌学者 ] Nguyen,T.N。; Meunier,J.视频序列中的异常检测与外观-运动对应。 2019年IEEE/CVF国际计算机视觉会议记录,ICCV,韩国首尔,2019年10月27日-11月2日; 第1273-1283页。 [ 谷歌学者 ] 田,B。; 莫里斯,B.T。; 唐,M。; 刘,Y。; 姚,Y。; 郭台铭。; 沈,D。; Tang,S.《分层和网络车辆监控:一项调查》。 IEEE传输。 智力。 运输。 系统。 2017 , 18 , 25–48. [ 谷歌学者 ] [ 交叉参考 ] Yu,J。; Yow,K.C。; Jeon,M.异常事件检测中外观和运动的联合表示学习。 机器。 愿景应用。 2018 , 29 , 1157–1170. [ 谷歌学者 ] [ 交叉参考 ] Varadarajan,J。; Odobez,J.M.场景分析和异常检测的主题模型。 2009年9月27日至10月4日在日本京都举行的2009 IEEE第12届国际计算机视觉研讨会论文集,ICCV研讨会; 第1338-1345页。 [ 谷歌学者 ] Sodemann,A.A。; 医学博士Ross。; Borghetti,B.J.自动化监测中异常检测的综述。 IEEE传输。 系统。 天啊,赛博。 C部分(申请版本) 2012 , 42 , 1257–1272. [ 谷歌学者 ] [ 交叉参考 ] Zweng,A。; Kampel,M.使用多个特征在图像序列中进行意外的人类行为识别。 2010年8月23日至26日在土耳其伊斯坦布尔举行的2010年第20届国际模式识别会议记录; 第368-371页。 [ 谷歌学者 ] Jodoin,P.M。; Konrad,J。; Saligrama,V.为行为减法建模背景活动。 《2008年第二届ACM/IEEE分布式智能相机国际会议论文集》,意大利特伦托,2008年9月9日至11日; 第1-10页。 [ 谷歌学者 ] 董,Q。; Wu,Y。; Hu,Z.指向运动图像(PMI):一种新的运动表示及其在异常检测和行为识别中的应用。 IEEE传输。 电路系统。 视频技术。 2009 , 19 , 407–416. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Mecocci,A。; Pannozzo,M。; Fumarola,A.为高级实时视频监控自动检测异常行为事件。 2003年7月31日在瑞士卢加诺举行的第三届科学使用海底电缆及相关技术国际研讨会会议记录; 第187-192页。 [ 谷歌学者 ] H.P.李。; 胡志勇。; Wu,Y.H。; Wu,F.C.基于半监督学习方法的行为建模和异常检测。 阮健雪宝(软性杂志) 2007 , 18 , 527–537. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 姚,B。; 王,L。; Zhu,S.C.学习用于跟踪和异常检测的场景上下文模型。 2008年6月23日至28日,美国阿拉斯加州安克雷奇,IEEE计算机学会计算机视觉和模式识别研讨会会议记录; 第1-8页。 [ 谷歌学者 ] 尹,J。; 杨琼。; Pan,J.J.基于传感器的异常人类活动检测。 IEEE传输。 知识。 数据工程。 2008 , 20 , 1082–1090. [ 谷歌学者 ] [ 交叉参考 ] Benezeth,Y。; Jodoin,P.M。; Saligrama,V。; Rosenberger,C.基于时空共生的异常事件检测。 2009年6月20日至25日,美国佛罗里达州迈阿密,IEEE计算机视觉和模式识别会议论文集; 第2458–2465页。 [ 谷歌学者 ] Dong,N。; 贾,Z。; 邵,J。; 熊,Z。; 李,Z。; 刘,F。; 赵,J。; Peng,P.通过方向运动行为图检测交通异常。 2010年8月29日至9月1日在美国马萨诸塞州波士顿举行的2010年第七届IEEE高级视频和信号监控国际会议记录; 第80-84页。 [ 谷歌学者 ] 罗伊,C.C。; Xiang,T。; Gong,S.检测和辨别行为异常。 模式识别。 2011 , 44 , 117–132. [ 谷歌学者 ] [ 交叉参考 ] 张,J。; 刘,Z。检测视频中行人的异常运动。 《2008年信息与自动化国际会议论文集》,中国长沙,2008年6月20日至23日; 第81–85页。 [ 谷歌学者 ] 鲁夫,L。; Vandermeulen,R.A。; 哥尼茨,N。; 粘合剂A。; 穆勒,E。; 米勒,K.R。; Kloft,M.Deep半监督异常检测。 arXiv公司 2019 ,arXiv:1906.02694。 [ 谷歌学者 ] Tang,Y.P。; 王晓杰。; Lu,H.F.用于计算机视觉中电梯轿厢异常检测的智能视频分析技术。 2009年11月24日至26日在韩国首尔举行的2009年第四届计算机科学和融合信息技术国际会议记录; 第1252–1258页。 [ 谷歌学者 ] 冯,J。; 张,C。; Hao,P.使用自组织地图在线学习,用于人群场景中的异常检测。 2010年8月23日至26日,土耳其伊斯坦布尔,2010年第20届模式识别国际会议论文集; 第3599–3602页。 [ 谷歌学者 ] 谢里夫,M.H。; Uyaver,S。; Djeraba,C.使用Bhattacharyya距离度量进行人群行为监测。 在2010年5月5日至7日于美国纽约州布法罗举行的国际专题讨论会《图像中物体的计算建模》会议记录中; 施普林格:德国柏林/海德堡,2010年; 第311-323页。 [ 谷歌学者 ] 向,G。; Min,W.应用半监督聚类算法进行异常检测。 2010年10月15日至17日,中国青岛,2010年第三届信息处理国际研讨会论文集; 第43-45页。 [ 谷歌学者 ] Wang,J。; 内斯科维奇,P。; Cooper,法律公告:通过单个球体进行图案分类。 《第八届发现科学国际会议论文集》,新加坡,2005年10月8日至11日; 施普林格:柏林/海德堡,德国,2005年; 第241-252页。 [ 谷歌学者 ] 刘伟。; 罗,W。; Lian,D。; Gao,S.异常检测的未来帧预测——一个新的基线。 2018年6月18日至23日,美国犹他州盐湖城,CVPR,IEEE计算机视觉和模式识别会议记录; 第6536-6545页。 [ 谷歌学者 ] Ergen,T。; A.H.米尔扎。; Kozat,S.S.利用LSTM神经网络进行无监督和半监督异常检测。 arXiv公司 2017 ,arXiv:1710.09207。 [ 谷歌学者 ] 在线可用: https://visionlab.uncc.edu/download/summary/60-data/477-ucf-anomaly-detection-dataset (2018年1月12日访问)。 哥尼茨,N。; Kloft,M。; Rieck,K。; Brefeld,U。走向监督异常检测。 J.阿蒂夫。 智力。 物件。 2013 , 46 , 235–262. [ 谷歌学者 ] [ 交叉参考 ] Tran,D。; Boudev,L。; 弗格斯,R。; 托雷萨尼,L。; Paluri,M.使用三维卷积网络学习时空特征。 2015年12月7日至13日,在智利圣地亚哥举行的IEEE国际计算机视觉会议论文集; 第4489–4497页。 [ 谷歌学者 ] 西苏丹。; 陈,C。; Shah,M.监控视频中的现实世界异常检测。 2018年IEEE计算机视觉和模式识别会议记录,CVPR,美国犹他州盐湖城,2018年6月18-23日; 第6479–6488页。 [ 谷歌学者 ] Chalapathy,R。; Chawla,S.异常检测的深度学习:一项调查。 arXiv公司 2019 ,arXiv:1901.03407。 [ 谷歌学者 ] 克里日夫斯基,A。; Sutskever,I。; Hinton,G.E.用深度卷积神经网络进行Imagenet分类。 《神经信息处理系统进展会议录》,美国内华达州塔霍湖,2012年12月3日至6日; 第1097-1105页。 [ 谷歌学者 ] O.Gorokhov。; 彼得罗夫斯基,M。; Mashechkin,I.用于文本数据中无监督异常检测的卷积神经网络。 2017年10月30日至11月1日在中国桂林举行的第18届智能数据工程和自动学习国际会议论文集; 施普林格:瑞士查姆,2017年; 第500–507页。 [ 谷歌学者 ] Kim,Y.句子分类的卷积神经网络。 arXiv公司 2014 ,arXiv:1408.5882。 [ 谷歌学者 ] Varga,D.无参考图像质量评估的多池初始特征。 申请。 科学。 2020 , 10 , 2186. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Kawahara,J。; BenTaieb,A。; Hamarneh,G.皮肤损伤分类的深层特征。 2016年IEEE第13届国际生物医学成像研讨会(ISBI)会议记录,2016年4月13日至16日,捷克共和国布拉格; 第1397-1400页。 [ 谷歌学者 ] 白,X。; 杨,M。; 黄,T。; 窦,Z。; Yu,R。; Xu,Y.Deep-person:学习辨别性深层特征以重新识别人。 模式识别。 2020 , 98 , 107036. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Alzubaidi,L。; 张,J。; 胡迈迪,A.J。; Al-Dujali,A。; Duan,Y。; Al-Shamma,O。; 桑塔马利亚,J。; 法德尔,文学硕士。; 阿尔·阿米迪,M。; Farhan,L.深度学习回顾:概念、CNN架构、挑战、应用、未来方向。 J.大数据 2021 , 8 , 53. [ 谷歌学者 ] [ 交叉参考 ] 克里斯蒂安森,P。; 尼尔森,法律公告。; Steen,K.A.公司。; 约根森,R.N。; Karstoft,H.DeepAnomaly:结合背景减法和深度学习来检测农业领域中的障碍物和异常。 传感器 2016 , 16 , 1904. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Dong,L。; Zhang,Y。; 温,C。; Wu,H.基于形态学分析和深度学习的摄像机异常检测。 2016年IEEE数字信号处理(DSP)国际会议论文集,2016年10月16日至18日,中国北京; 第266-270页。 [ 谷歌学者 ] 徐,D。; 里奇,E。; 严,Y。; 宋,J。; Sebe,N.学习用于异常事件检测的外观和运动的深度表示。 arXiv公司 2015 ,arXiv:1510.01553。 [ 谷歌学者 ] 哈桑,M。; Choi,J。; Neumann,J。; Roy-Chowdhury,A.K。; 学习视频序列中的时间规律。 2016年6月27日至30日,美国内华达州拉斯维加斯,IEEE计算机视觉和模式识别会议记录; 第733–742页。 [ 谷歌学者 ] Nguyen,V。; Phung,D。; Pham,D.S。; 视频监控中异常检测的贝叶斯非参数方法。 数据科学年鉴。 2015 , 2 , 21–41. [ 谷歌学者 ] [ 交叉参考 ] Wang,H。; Schmid,C.改进轨迹的动作识别。 2013年12月1日至8日,澳大利亚悉尼,IEEE计算机视觉国际会议论文集; 第3551–3558页。 [ 谷歌学者 ] Yun,K。; Yoo,Y。; Choi,J.Y.检测异常交互的运动交互场。 机器。 视觉。 申请。 2017 , 28 , 157–171. [ 谷歌学者 ] [ 交叉参考 ] Fu,J。; Rui,Y.图像标注深度学习方法的进展。 APSIPA事务处理。 信号信息处理。 2017 , 6 ,E11。 [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] He,K。; 张,X。; Ren,S。; Sun,J.图像识别的深度残差学习。 2016年6月27日至30日,美国内华达州拉斯维加斯,IEEE计算机视觉和模式识别会议记录; 第770-778页。 [ 谷歌学者 ] 易卜拉希米·卡胡,S。; Michaelski,V。; Konda,K。; 梅米塞维奇,R。; Pal,C.视频中情感识别的递归神经网络。 2015年11月9日至13日在美国华盛顿州西雅图举行的2015年第17届ACM多式联运国际会议记录; 第467–474页。 [ 谷歌学者 ] 卡里姆,F。; 马朱姆达尔,S。; Darabi,H。; Chen,S.LSTM完全卷积网络用于时间序列分类。 IEEE接入 2017 , 6 , 1662–1669. [ 谷歌学者 ] [ 交叉参考 ] 梅德尔,J.R。; Savakis,A.使用预测卷积长短记忆网络检测视频中的异常。 arXiv公司 2016 ,arXiv:1612.00390。 [ 谷歌学者 ] Singh,A.使用长短期存储器(LSTM)对时间数据进行异常检测。 2017年瑞典斯德哥尔摩KTH皇家理工学院硕士论文。 [ 谷歌学者 ] 北斯利瓦斯塔瓦。; Mansimov,E。; Salakhudinov,R.使用lstms进行视频表征的无监督学习。 第32届机器学习国际会议(ICML)会议记录,2015年6月6日至11日,法国里尔; 第843-852页。 [ 谷歌学者 ] 张,H。; 郑毅。; Yu,Y.使用多个时空数据源检测城市异常。 程序。 Acm互动。 移动可穿戴无所不在技术。 2018 , 2 , 1–18. [ 谷歌学者 ] [ 交叉参考 ] 东,Z。; 秦,J。; Wang,Y.视频中人对人暴力检测的多流深度网络。 2016年11月5日至7日,中国成都,第七届中国模式识别会议论文集; 施普林格:新加坡,2016年; 第517–531页。 [ 谷歌学者 ] 周,S。; 沈伟(Shen,W.)。; 曾博士。; 方,M。; 魏毅。; Zhang,Z.用于拥挤场景中异常检测和定位的时空卷积神经网络。 信号处理。 图像通信。 2016 , 47 , 358–368. [ 谷歌学者 ] [ 交叉参考 ] Sudhakaran,S。; Lanz,O。学习使用卷积长短期记忆检测暴力视频。 2017年8月29日至9月1日在意大利莱切举行的2017年IEEE第14届先进视频和信号监控(AVSS)国际会议记录; 第1-6页。 [ 谷歌学者 ] 兴建,S.H.I。; 陈,Z。; Wang,H。; Yeung,D.Y。; Wong,W.K。; Woo,W.C.卷积LSTM网络:降水预报的机器学习方法。 《神经信息处理系统进展会议录》,加拿大魁北克省蒙特利尔,2015年12月7-12日; 第802-810页。 [ 谷歌学者 ] 邓,J。; Dong,W。; Socher,R。; 李,L.J。; 李凯。; Fei-Fei,L.Imagenet:大型分层图像数据库。 2009年IEEE计算机视觉和模式识别会议论文集,2009年6月20日至25日,美国佛罗里达州迈阿密; 第248-255页。 [ 谷歌学者 ] Alzubaidi,L。; 法德尔,文学硕士。; Al-Shamma,O。; 张,J。; 桑塔马利亚,J。; Duan,Y。; R Oleiwi,S.更好地理解医学成像的转移学习:一项案例研究。 申请。 科学。 2020 , 10 , 4523. [ 谷歌学者 ] [ 交叉参考 ] 马哈茂德,A。; 奥斯皮纳,A.G。; Bennamoun,M。; 安,S。; Sohel,F。; Boussaid,F。; 霍维,R。; R.B.费希尔。; Kendrick,G.A.使用深度残留特征对海带进行自动分级分类。 传感器 2020 , 20 , 447. [ 谷歌学者 ] [ 交叉参考 ] [ 公共医学 ] [ 绿色版本 ] 艾哈迈迪,S。; Rezghi,M.基于多重变换对的矩阵的广义低阶近似。 模式识别。 2020 , 108 , 107545. [ 谷歌学者 ] [ 交叉参考 ] Zapata-Impata,理学学士。; 吉尔·P。; Torres,F.使用ConvLSTM学习时空触觉特征,用于滑动检测方向。 传感器 2019 , 19 , 523. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 莫雷拉,D。; Barandas,M。; 罗查,T。; 阿尔维斯,P。; 桑托斯,R。; 莱昂纳多,R。; 维埃里亚,P。; Gamboa,H.使用智能手机惯性传感器进行室内定位的人类活动识别。 传感器 2021 , 21 , 6316. [ 谷歌学者 ] [ 交叉参考 ] 钟J.X。; 李,N。; W·孔。; 刘,S。; 李,T.H。; Li,G.图卷积标签噪声清洁器:训练一个用于异常检测的即插即用动作分类器。 2019年6月15日至20日在美国加利福尼亚州长滩举行的IEEE/CVF计算机视觉和模式识别(CVPR)会议记录; 第1237-1246页。 [ 谷歌学者 ] 卢,C。; 史J。; Jia,J.在matlab中以每秒150帧的速度检测异常事件。 2013年12月1日至8日,澳大利亚悉尼,IEEE计算机视觉国际会议论文集; 第2720–2727页。 [ 谷歌学者 ]