摘要
为边缘设备设计神经架构受到精度、推理延迟和计算成本的限制。传统上,研究人员手工构建深层神经网络以满足移动设备的需求。神经体系结构搜索(NAS)旨在实现神经体系结构设计的自动化,而无需广泛的领域专业知识和大量的人工工作。最近的工作利用NAS设计移动模型,考虑到硬件限制,并以较少的参数和较少的计算成本(以乘法累加(MAC)衡量)实现了最先进的准确性。为了找到高度紧凑的神经网络结构,现有的工作依赖于预定义的单元并直接应用宽度乘法器,这可能会限制模型的灵活性,减少有用的特征映射信息,并导致精度下降。为了解决这个问题,我们提出了GRAM(GRAph propagation as Meta-knowledge),它采用细粒度(节点式)搜索方法,并将在更新过程中学习到的知识积累到一个Meta-GRAph中。因此,GRAM可以使搜索空间更加灵活,并实现更高的搜索效率。在不受预先定义的单元或块约束的情况下,我们提出了一种新的结构级剪枝方法来消除神经体系结构中的冗余操作。SwiftNet是GRAM发现的一组模型,其精度密度比MobileNet-V2高2.15倍,速度比MobileNetwork-V2快2.42倍,精度与之相当。与FBNet相比,SwiftNet将搜索成本降低了26倍,实现了2.35倍的精度密度和1.47倍的加速比,同时保持了相似的精度。SwiftNet在ImageNet-1K上只需5300万个MAC和207万个参数就可以获得63.28%的前1精度。谷歌像素1上相应的推理延迟仅为19.09毫秒。