CXL-ANNS:用于十亿规模近似最近邻搜索的软硬件协同内存分解和计算

作者:

Junhyeok Jang,计算机体系结构和存储系统实验室,KAIST;崔汉金,计算机体系结构和存储系统实验室,KAIST和Panmnesia,Inc。;Hanyeoreum Bae和Seungjun Lee,计算机体系结构和存储系统实验室,KAIST;Miryeong Kwon和Myoungsoo Jung,计算机体系结构和存储系统实验室,KAIST和Panmnesia,Inc。

摘要:

我们提出CXL-ANNS,这是一种软件协作方法,用于实现高度可扩展的近似最近邻搜索(ANNS)服务。为此,我们首先通过计算快速链接(CXL)将DRAM从主机中分离出来,并将所有必要的数据集放入其内存池中。虽然此CXL内存池可以使ANNS在不损失精度的情况下处理十亿点图,但我们观察到,由于CXL的类似远距内存的特性,搜索性能显著下降。为了解决这个问题,CXL-ANNS考虑了节点级关系,并将邻居缓存在本地内存中,这些邻居预计会最频繁地访问。对于未缓存的节点,CXL-ANNS通过了解ANNS的图遍历行为,预取最可能很快访问的一组节点。CXL-ANNS还了解CXL互连网络的体系结构,并允许其中的不同硬件组件并行协作搜索最近的邻居。为了进一步提高性能,它通过充分利用CXL网络中的所有硬件,放松了邻居搜索任务的执行依赖性,并最大限度地提高了搜索并行度。我们的经验评估结果表明,CXL-ANNS的QPS比我们测试的最先进的ANNS平台高111.1倍,查询延迟低93.3%。CXL-ANNS在延迟和吞吐量方面也分别优于仅具有DRAM(具有无限存储容量)的oracle ANNS系统68.0%和3.8x。

USENIX ATC’23 Open Access赞助商
阿卜杜拉国王科技大学

开放存取媒体

USENIX致力于开放访问我们活动上展示的研究。活动开始后,所有人都可以免费获得论文和会议记录。活动结束后发布的任何视频、音频和/或幻灯片也免费向所有人开放。支持USENIX以及我们对开放存取的承诺。

此内容可用于:

BibTeX公司
@进行中{288782,
author={Junhyeok Jang和Hanjin Choi以及Hanyeoreum Bae和Seungjun Lee以及Miryeong Kwon和Myoungsoo Jung},
title={{CXL-ANNS}:{Software-Hardware}协作内存分解和计算{十亿规模}近似最近邻搜索},
booktitle={2023 USENIX年度技术会议(USENIXATC 23)},
年份={2023},
isbn={978-1-939133-35-9},
地址={马萨诸塞州波士顿},
页数={585--600},
url={https://www.usenix.org/conference/atc23/presentation/jang},
publisher={USENIX协会},
月=七月
}

演示文稿视频