A Greedy Algorithm for Quantizing Neural Networks

Eric Lybrand; Rayan Saab

我们提出了一种新的计算效率高的方法来量化预先训练的神经网络的权重，这种方法足够通用，可以处理多层感知器和卷积神经网络。我们的方法以迭代方式确定量化层，无需复杂的重新训练。具体来说，我们使用贪婪的路径允许算法量化每个神经元或隐藏单元。这个简单的算法相当于运行一个动态系统，当训练数据为高斯时，我们证明它对于量化单层神经网络（或者，对于量化多层网络的第一层）是稳定的。我们表明，在这些假设下，量化误差随层的宽度（即其过参数化程度）而衰减。我们在多层网络上进行了数值实验，以说明我们的方法在MNIST和CIFAR10数据上的性能，以及使用ImageNet数据量化VGG16网络的性能。

量化神经网络的贪婪算法

摘要