探索均衡恢复负载分布的数据放置算法

作者:

英迪山,中关村实验室与清华大学;陈康、吴永伟,清华大学

摘要:

在分布式存储系统中,从故障中恢复的能力对于确保可靠性至关重要。为了提高恢复速度,这些系统通常将恢复任务分布在多个磁盘上,并并行恢复数据单元。然而,使用细粒度数据单元进行更好的负载平衡会增加数据丢失的风险。

本文系统地分析了恢复负载分配问题,提出了一种新的数据放置算法,该算法可以在不使用细粒度数据单元的情况下实现负载平衡。为恢复负载平衡找到最佳数据位置的问题被正式定义为NP-hard。提出了一种贪婪数据布局算法,实验结果表明,与传统技术相比,该算法的性能优越,恢复速度快2.4倍。此外,该算法支持低开销的系统扩展。

USENIX ATC’23 Open Access赞助商
阿卜杜拉国王科技大学

开放存取媒体

USENIX致力于开放访问我们活动上展示的研究。活动开始后,所有人都可以免费获得论文和会议记录。活动结束后发布的任何视频、音频和/或幻灯片也免费向所有人开放。支持USENIX以及我们对开放存取的承诺。

此内容可用于:

BibTeX公司
@进行中{288754,
author={英迪山、康晨和吴永伟},
title={Explore Data Placement Algorithm for Balanced Recovery Load Distribution},
booktitle={2023 USENIX年度技术会议(USENIXATC 23)},
年份={2023},
isbn={978-1-939133-35-9},
地址={马萨诸塞州波士顿},
页数={233--240},
url={https://www.usenix.org/conference/atc23/presentation/shan},
publisher={USENIX协会},
月=七月
}

演示文稿视频