阿斯基特

ASKIT:一个用于高维内核求和的高效并行库。在各种机器学习和计算统计方法中,基于核的方法是一个强大的工具。这些方法的一个关键瓶颈是涉及到核矩阵的计算,它与问题的大小成二次关系。之前,我们介绍了ASKIT(近似骨架化-核无关树编码),一种有效的、可扩展的、与核无关的近似计算核矩阵向量积的方法。ASKIT基于一种新的随机方法,它利用近似近邻信息有效分解核矩阵的对角块。在这种情况下,ASKIT可以看作是一种代数快速多极子方法。在本文中,我们介绍了ASKIT的开源实现。我们的ASKIT库的特性包括对数据输入维的线性依赖性、在没有关于内核的先验信息的情况下近似内核函数的能力、可扩展到数万个计算核心和数十亿点或数百维的数据。我们还介绍了ASKIT的一些新的扩展和改进,包括在我们的库中。我们提出了一种新的自适应选择近似秩和正确划分最近邻信息的方法,这两种方法都提高了ASKIT的性能。我们对ASKIT算法进行了详细的描述,并在一个地方收集和总结了我们以前的理论复杂性和误差范围。我们提供了一个简短的实验结果,说明了ASKIT的准确性和可扩展性。然后我们为ASKIT的用户提供一些细节和指导。