获取帮助推广图形!
文霞,华中科技大学和桑福科技股份有限公司。;周玉坤,华中科技大学;洪江,德克萨斯大学阿灵顿分校;丹凤、余华、胡玉冲、张玉成、刘青,华中科技大学
内容定义分块(CDC)由于其高冗余检测能力,在过去15年左右的时间里一直在重复数据消除系统中发挥着关键作用。然而,现有的基于CDC的方法引入了大量CPU开销,因为它们通过逐字节计算和判断数据流的滚动哈希来声明块切点。在本文中,我们提出了FastCDC,这是一种快速高效的CDC方法,它构建并改进了最新的基于齿轮的CDC应用程序,这是我们已知的最快的CDC方式之一。FastCDC背后的关键思想是结合使用三种关键技术,即简化和增强散列判断,以解决我们观察到的基于齿轮的CDC面临的挑战,跳过亚最小块切点以进一步加快CDC,以及在一个较小的指定区域中对块大小分布进行归一化,以解决由于切入点跳过而导致重复数据消除率降低的问题。我们的评估结果表明,通过结合使用这三种技术,FastCDC的速度约为基于Rabin的开源CDC的最佳速度的10倍,约为基于Gear和AE的最先进CDC的3倍,同时实现了与基于Rabin-的经典方法几乎相同的重复数据消除率。
USENIX致力于开放访问我们活动上展示的研究。活动开始后,所有人都可以免费获得论文和会议记录。活动结束后发布的任何视频、音频和/或幻灯片也免费向所有人开放。支持USENIX以及我们对开放存取的承诺。
下载音频