3.2. 扩展的MobileNet
感受野是指映射在输入图像上的每一层输出的特征图中每个元素的大小,因此该层在靠近网络底部时会有更大的感受野,其感受野大约等于全局感受野。在我们的研究中,扩大局部感受野是为了提高MobileNet的分类精度,因此需要增加感受野的层靠近MobileNet的输入。根据扩展卷积滤波器的位置,我们提出了3种新的网络模型,分别命名为D1-MobileNet、D2-MobileNet和D3-MobileNet。
3.2.1. 扩展的1-MobileNet
D1-MobileNet在第一层中将卷积步长设置为1,并用扩展率为2的扩展卷积滤波器取代标准卷积滤波器。同时,为了抑制计算成本的增加,将第二层深度可分卷积的步长设置为2,其他层保持不变。与跨距为1的第一个卷积层MobileNet相比,第一个卷曲层的输出特征图的大小从112×112变为224×224,如所示.
3.2.2. 扩展的2-MobileNet
在DWD2(深度可分离)层中,深度卷积滤波器由扩展率为2的扩展卷积滤波器扩展,而其他层保持不变。此方法不会增加计算量和参数,也不会更改任何层的输出特征图的大小,如所示.
3.2.3. 扩展的3-MobileNet
D3-MobileNet将第一个卷积层中的卷积步长设置为1,并使用扩展率2将标准卷积滤波器替换为扩展卷积滤波器。在第一个卷积层中进行卷积操作后,通过批归一化层对其进行归一化[23]. 然后,步幅为2的最大池层位于批处理规范化层的后面,其他层保持不变,如所示.
在感受野扩展方面,也有不同的扩展方式。例如,Sun W将扩展卷积和深度可分卷积结合起来,形成网络构建的标准块[21]. 他们的方法是在每个深度可分离卷积之前添加一个扩张卷积层。与他们的方法不同的是,在Dilated1-MobileNet中,我们使用扩展卷积来代替Mobile Net第一层中的标准卷积,而不在所有后续的深度可分离卷积块之前添加扩展卷积,因为这会增加参数的数量。Dilated2-MobileNet中的差异更大,因为我们在深度卷积层中扩展了感受野,而不是在深度可分离卷积层之前添加了一个扩展卷积层。类似地,Dilated3-MobileNet在第一层用扩展卷积替换标准卷积,并在其后添加池层,而不是在所有深度可分离卷积块之前添加扩展卷积。
3.3. 计算分析
在标准卷积层中,假设输入特征映射的高度、宽度和输入通道数我是小时,w个、和米,卷积滤波器K(K)是秒×秒,输出通道号为n个和输出功能图O(运行)=K(K)×我可以通过卷积得到我和K(K)没有填充零和步幅1,如下式所示:
哪里O(运行)(年,x个,j个)表示点的值(年,x个)英寸j个第th个输出特征图,K(K)(u个,v(v),我,j个)表示点的值(u个,v(v))在频道上我在里面j个第个卷积滤波器,以及我(年,x个,我)表示点的值(年,x个)上的我输入特征图。来自公式(1),众所周知,输出值需要秒×秒×米乘以乘法,计算总量为秒×秒×米× (小时−秒+1) × (w个−秒+1) ×n个参数的数量为秒×秒×米×n个.
当Dilated-MobileNet在标准卷积层中引入扩展卷积时,利用特征映射I,利用卷积核在不填充零点的情况下执行扩展卷积K(K)相同的尺寸和膨胀率为2。因此,我们可以得到输出特征图O(运行)d日通过以下公式:
因此,扩展卷积层的总计算量为(秒×秒×米) × (小时−秒− (秒− 1)(第页− 1)+1) × (w个−秒− (秒− 1)(第页− 1)+1) ×n个,参数个数为秒×秒×米×n个.在没有填充零的情况下,用扩展率计算扩展卷积第页 > 1小于标准卷积,参数数量相同,但扩张卷积的感受野大于标准卷积的感受野。在填充零的卷积操作下,扩展卷积的映射大小与标准卷积的大小相同,两者都是小时×w个×n个计算结果与参数个数相同。
在深度卷积中引入扩展卷积滤波器时,上述特征映射我首先使用深度卷积滤波器K进行卷积,然后输出特征图O(运行)直流电通过以下公式得出:
哪里O(运行)直流(年,x个,j个)表示点的值(年,x个)英寸j个第个功能图。由于深度卷积滤波器只有一个信道,K(K)(u个,v(v),j个)表示点的值(u个,v(v))上的j个第个卷积滤波器和我(年,x个,j个)表示点的值(年,x个)上的j个第个输入通道。
深度可分卷积的总计算为(秒×秒×n个) × (小时−秒− (秒− 1)(第页− 1)+1) × (w个−秒− (秒− 1)(第页− 1)+1) ×米,参数总数为秒×秒×米+米×n个可以看出,与标准卷积相比,深度可分卷积的参数减少了:
计算比率为
类似地,在进行带补零的深度卷积时,参数的缩减率为
从上面的分析可以看出,深卷积核的感受野随着膨胀率的增大而增大第页和卷积核大小秒×秒等效于卷积核(第页×秒−第页+1) × (w个×秒−第页+1) 从而可以在不增加参数数量和计算量的情况下扩展感受野。
3.4. 接受域
在许多任务中,特别是语义图像分割和光流估计等密集型预测任务中,需要预测输入图像中每个像素的值,而每个输出像素的值需要一个较大的接收场来保留重要信息。局部感受野是指上层输入特征图中区域的大小,该区域由输出特征图中的像素映射。在本文中,扩张卷积被用来放大某一层的局部感受野,以捕捉更好的特征,并进一步影响后面卷积层的感受野大小。每层感受野的大小如下式所示:
哪里第页k个表示的感受野大小k个第层,(f)k个表示过滤器的尺寸,以及秒我表示我第层。第一层的感受野等于过滤器的大小。通过使用公式(7),我们可以得到MobileNet和Explated-MobileNets每层的感受野大小,如所示.
表1
| MobileNet公司 | 扩展的1-MobileNet | 扩展的2-MobileNet | 扩展的3-MobileNet |
---|
转换1 | 三 | 5 | 三 | 5 |
游泳池 | — | 6 | — | — |
转换2 ds | 7 | 10 | 11 | 7 |
转换3 ds | 11 | 14 | 15 | 11 |
转换4 ds | 19 | 22 | 23 | 19 |
转换5 ds | 27 | 30 | 31 | 27 |
转换6 ds | 43 | 46 | 47 | 43 |
转换7 ds | 59 | 62 | 63 | 59 |
转换8 ds | 91 | 94 | 95 | 91 |
转换9 ds | 123 | 126 | 127 | 123 |
转换10 ds | 155 | 158 | 159 | 155 |
转换11 ds | 187 | 190 | 191 | 187 |
转换12 ds | 219 | 222 | 223 | 219 |
转换13 ds | 251 | 254 | 255 | 251 |
转换14 ds | 315 | 318 | 319 | 315 |
中的“ds”图中显示了深度可分卷积,并且点式卷积与深度可分褶积中的深度卷积具有相同的感受野,因此统一给出感受野。D1-MobileNet和Explated3-MobileNet中第一个卷积层的感受野大小表明,当扩展率为2时,3×3卷积核的感受野变为5×5。总之,扩大卷积可以扩大局部感受野的大小。此外,Dilated1-MobileNet和Dilated2-Mobile Net也略微增加了底层的感受野大小。可以从中看到也就是说,对于扩张的MobileNet网络,虽然后一个卷积层的感受野的扩张比变小了,但其前几层的感受场要比Mobile Net的感受野大。这样,更容易提取更详细的信息,有利于提高分类精度。