利用NoS R-CNN从单眼光学图像估计总建筑面积
摘要
1.简介
据我们所知,所提出的方法是第一种直接从单目光学卫星图像中估计实例总建筑面积的方法。 与现有的相关方法相比,我们的方法有三个关键创新: 在不同程度的端到端学习中,我们在统一的网络架构(即NoS R-CNN)中设计了三种由不同训练和推理策略生成的GFA估计方法。 基于我们的数据集的实验结果,报告并比较了这三种方法的性能。
2.方法和数据
2.1. 美国有线电视新闻网
2.2. 基于NoS R-CNN的GFA估计的三种方法
2.2.1. 基于掩码分支(MBB)的GFA估计
2.2.2. 基于BA分支的(BABB)GFA估计
2.2.3. 基于GFA分支(GBB)的GFA估计
2.2.4. 三种方法的训练/推理策略比较
2.3. 损失函数和实验实现细节
2.4. 数据集
3.结果
3.1. 建筑检测任务
3.2. GFA估算任务
3.3. MBB结果的进一步分析
由于使用MBB的GFA估计可以分为三个子任务,即建筑物检测、NoS估计和建筑物足迹分割,因此可以通过改进这三个子任务来提高GFA估计的性能。 任何有助于实例分割的方法都可以提高建筑物检测任务和足迹分割任务的性能,例如使用更新的更强大的基础网络或主干。 NoS估计的性能对GFA估计的性能至关重要,特别是对于具有较大BA的建筑物,其GFA的误差更容易被NoS预测的误差放大。 但是,从单目光学卫星图像中准确估计NoS还没有得到广泛的研究,仍然是一个悬而未决的问题。 我们认为,图像中建筑物的阴影有助于提高NoS估计的性能,但使用这些信息的有效方法还需要进一步研究。 由于土地资源的限制,快速城市化不仅在二维(2-D)上引起城市扩张,而且在三维(3-D)上也引起了城市扩张,特别是在中国[ 20 , 21 ]. 由于大规模三维数据采集的困难,大多数地理分析,如人口密度估计[ 22 , 23 , 24 ],热岛强度[ 25 , 26 ]和地质-环境容量[ 27 ]对于大规模来说,都是基于二维信息的。 虽然上述应用的结果可以从二维建筑覆盖分布中部分推断出来,但由于忽略了垂直方向的信息,一些误差是不可避免的,并且随着三维城市的快速扩张,误差将增加。尽管模型的能力需要进一步提高, 对于基于二维信息的应用,所提方法的结果可以在一定程度上减小误差。 例如,BA的GT和NoS的平均值可用于所有建筑实例来估计GFA,该方法仅使用二维信息来模拟方法,在我们的测试集上,二维信息的mIoU为0.566。 与上述方法相比,即使BA的GT未用于MBB,mIoU为0.683的MBB对于每个建筑实例平均减少了约20%的误差。
4.讨论
4.1. 三种GFA估算方法的比较
4.2. 两种BA估计方法的比较
4.3. 端到端时尚不是万能药
培训数据不足。 与端到端设计较少的模型相比,端到端的设计方法由于其数据驱动机制,通常依赖更多的训练数据来获得令人满意的性能。 虽然我们实验中使用的训练数据比之前的研究中使用的要多得多,但对于更端到端设计的模型来说,可能不足以充分发挥其优势。 模型设计不当。 据我们所知,本文是首次尝试使用深度卷积神经网络直接端到端估计实例化GFA,因此没有任何模型设计可供参考。 我们基本上遵循受Mask R-CNN启发的检测任务管道进行GFA/BA预测。 这种设计可能不适合GFA/BA估算任务。 或者,更端到端的模型设计在本质上不适合GFA/BA估算任务。
4.4. 美国有线电视新闻网(CNN)无法取代这项任务吗?
基于CNN的方法在BA、NoS和GFA估计任务中表现出比MLP和RF更好的性能。 这些结果表明,使用手持式特征(即MLP和RF)的传统方法可能不适用于这些困难的任务,因为单目光学卫星图像中关于NoS的信息有限,普通人甚至很难完成这些任务。 虽然基于CNN的方法看起来更麻烦,但由于其数据驱动机制,它们确实显示出不可替代的能力。
5.结论
作者贡献
基金
机构审查委员会声明
知情同意书
数据可用性声明
利益冲突
工具书类
Yang,N。; Tang,H.卫星图像的语义分割:与地理空间散列码集成的深度学习方法。 远程传感器。 2021 , 13 , 2723. [ 谷歌学者 ] [ 交叉参考 ] 黄,W。; Tang,H。; Xu,P.OEC-RNN:使用航空图像中的递归神经网络,对带有边角的屋顶进行面向对象的描绘。 IEEE传输。 地质科学。 远程传感器。 2021 , 60 , 5604912. [ 谷歌学者 ] [ 交叉参考 ] 纪,C。; Tang,H.使用改进的掩模R-CNN从单目卫星图像估计建筑物层数。 远程传感器。 2020 , 12 , 3833. [ 谷歌学者 ] [ 交叉参考 ] Frantz,D。; 舒格,F。; Okujeni,A。; 纳瓦奇,C。; 瓦格纳,W。; van der Linden,S。; Hostert,P.使用Sentinel-1和Sentinel-2时间序列绘制全国建筑高度图。 远程传感器环境。 2021 , 252 , 112128. [ 谷歌学者 ] [ 交叉参考 ] 曹毅。; Huang,X.一种使用城市地区高分辨率多视角图像进行建筑高度估算的深度学习方法:对42个中国城市的案例研究。 遥感环境。 2021 , 264 , 112590. [ 谷歌学者 ] [ 交叉参考 ] 王,C。; 马,J。; Liang,F.基于城市地区机载激光扫描数据的建筑面积比提取。 2010年7月25日至30日在美国夏威夷州火奴鲁鲁举行的2010年IEEE国际地球科学和遥感研讨会论文集; 第1182-1185页。 [ 谷歌学者 ] Roca Cladera,J。; 伯恩斯,M。; Alhaddad,B.E.卫星图像和激光雷达数据,用于有效描述居住城市土地使用分类中的结构和密度。 远程传感器垃圾邮件。 信息科学。 2013 , XL-4/W1型 , 71–75. [ 谷歌学者 ] 吴琼。; 陈,R。; 孙,H。; Cao,Y.使用高分辨率SAR图像检测城市建筑密度。 2011年联合城市遥感活动会议记录,德国慕尼黑,2011年4月11日至13日; 第45-48页。 [ 谷歌学者 ] 温,D。; 黄,X。; 张,A。; Ke,S.使用多视角卫星图像监测中国特大城市内城区的3D建筑变化和城市再发展模式。 远程传感器。 2019 , 11 , 763. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 彭,F。; 龚,J。; Wang,L。; Wu,H。; Yang,J.建筑高度对基于星载立体图像的三维城市密度估算的影响。 国际建筑协会。 照片。 远程传感器垃圾邮件。 信息科学。 2016 , 41 , 677–683. [ 谷歌学者 ] 张,X。; 陈,Z。; Yue,Y。; 齐,X。; Zhang,C.H.融合遥感和互联网数据计算城市容积率。 持续性 2019 , 11 , 3382. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] Zhang,X.基于无人机图像和U-Net算法的村级宅基地和建筑面积估算。 ISPRS国际地理信息杂志。 2020 , 9 , 403. [ 谷歌学者 ] [ 交叉参考 ] Duan,G。; 龚,H。; 刘,H。; Yi,Z。; Chen,B.利用高分辨率卫星图像建立改进的占地面积比。 J.印度社会遥感。 2018 , 46 , 275–286. [ 谷歌学者 ] [ 交叉参考 ] 吴义忠。; B·李。 基于QuickBird图像的城市建筑面积比估算。 先进材料研究 ; Trans-Tech出版有限公司:瑞士弗雷恩巴赫,2012年; 第450卷,第614-617页。 [ 谷歌学者 ] Yan,M。; Xu,L.高分辨率图像中夜间数据与建筑面积比之间的关系模型。 国际建筑协会。 照片。 远程传感器垃圾邮件。 信息科学。 2017 , 42 , 1419–1422. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 张,F。; 杜,B。; Zhang,L.,一种使用超高分辨率卫星图像和地理空间数据进行特大城市分析的多任务卷积神经网络。 arXiv公司 2017 ,arXiv:1702.07985。 [ 谷歌学者 ] He,K。; Gkioxari,G。; 多拉,P。; 吉希克,R.Mask R-cnn。 2017年3月13日至17日在日本东京举行的IEEE计算机视觉国际会议记录; 第2961-2969页。 [ 谷歌学者 ] 吉尔西克,R·法斯特。 2015年12月11日至18日在智利拉斯康德斯举行的IEEE计算机视觉国际会议记录; 第1440–1448页。 [ 谷歌学者 ] Sun,W。; 陈,B。; 用于光谱图像的基于最近邻扩散的泛锐化算法。 选择。 工程师。 2014 , 53 , 013107. [ 谷歌学者 ] [ 交叉参考 ] [ 绿色版本 ] 刘,M。; 马,J。; 周,R。; 李,C。; 李,D。; Hu,Y.中国大陆城市建筑面积的高分辨率地图。 朗诗。 城市规划。 2021 , 214 , 104187. [ 谷歌学者 ] [ 交叉参考 ] 曹琦。; 栾,Q。; 刘,Y。; Wang,R.二维和三维建筑形态对城市环境的影响:北京大都市圈的多尺度分析。 生成。 环境。 2021 , 192 , 107635. [ 谷歌学者 ] [ 交叉参考 ] 科诺,T。; Kaneko,T。; Morisugi,H.最低建筑面积比监管的必要性:第二好政策。 注册科学年鉴。 2010 , 44 , 523–539. [ 谷歌学者 ] [ 交叉参考 ] Wu,S。; 邱,X。; Wang,L.地理信息系统和遥感中的人口估计方法:综述。 地理科学。 远程传感器。 2005 , 42 , 80–96. [ 谷歌学者 ] [ 交叉参考 ] Wang,L。; Wu,C.利用遥感和GIS技术进行人口估算。 《国际遥感杂志》。 2010 , 31 , 5569–5570. [ 谷歌学者 ] [ 交叉参考 ] 南苏丹。; Satyanarayana,A.N.V.,印度大城市冬季使用远程技术的城市热岛强度:城市化的影响。 《国际遥感杂志》。 2018 , 39 , 6692–6730. [ 谷歌学者 ] [ 交叉参考 ] Shirani-Bidabadi,N。; Nasrabadi,T。; Faryadi,S。; 拉里贾尼,A。; Roodposhti,M.S.利用遥感评估城市热岛的空间分布和强度,伊朗伊斯法罕市的案例研究。 维持。 城市社会。 2019 , 45 , 686–692. [ 谷歌学者 ] [ 交叉参考 ] 崔,Z.-D。; 唐永清。; 严,X.-X。; Yan,C.-L。; 王海明。; Wang,J.-X.基于建筑面积比ANFIS模型的建筑物地质环境容量评估。 牛市。 工程地质。 环境。 2010 , 69 , 111–118. [ 谷歌学者 ] [ 交叉参考 ] 任,S。; He,K。; Girshick,R。; Sun,J.Faster R-CNN:利用区域建议网络实现实时目标检测。 IEEE传输。 模式分析。 机器。 智力。 2017 , 39 , 1137–1149. [ 谷歌学者 ] 陶,A。; 萨普拉,K。; Catanzaro,B.语义分割的层次多尺度关注。 arXiv公司 2020 ,arXiv:2005.10821。 [ 谷歌学者 ] Yu,J。; 林,Z。; 杨,J。; 沈,X。; 卢,X。; Huang,T.门限卷积的自由形式图像修复。 2019年10月27日至28日在韩国首尔举行的IEEE/CVF国际计算机视觉会议记录; 第4471–4480页。 [ 谷歌学者 ] 阿米尔科莱,H.A。; Arefi,H.使用深度卷积编解码网络从单个航空图像进行高度估计。 ISPRS J.摄影。 远程传感器。 2019 , 149 , 50–66. [ 谷歌学者 ] [ 交叉参考 ] 加米西,P。; Yokoya,N.IMG2DSM:使用条件生成对抗网从单个图像进行高度模拟。 IEEE地质科学。 遥感快报。 2018 , 15 , 794–798. [ 谷歌学者 ] [ 交叉参考 ] 斯里瓦斯塔瓦,S。; 沃尔皮,M。; Tuia,D.使用CNN对单目航空图像进行联合高度估计和语义标记。 2017年7月23日至28日在美国德克萨斯州沃思堡举行的2017 IEEE国际地球科学与遥感研讨会(IGARSS)会议记录; 第5173–5176页。 [ 谷歌学者 ] 佩德雷戈萨,F。; 瓦罗佐,G。; Gramfort,A.公司。; 米歇尔,V。; 蒂里昂,B。; O.格栅。; 布隆德尔,M。; 普雷滕霍弗,P。; 韦斯,R。; 杜堡,V。; 等。Scikit-learn:Python中的机器学习。 J.马赫。 学习。 物件。 2011 , 12 , 2825–2830. [ 谷歌学者 ]