研究论文 在上共享 蜂巢:基于FPGA的SmartNIC上的有序键值存储加速作者:军献 线路接口单元,亚历山大 Dragojević,谢恩 弗莱明,安东尼奥斯 卡特萨拉基斯,+ 5,达里奥 科罗利亚,伊戈尔 扎布尔基,+ 3,和尚 Ng公司,阿努吉 卡莉亚,以及米格尔 卡斯特罗 (减去)作者信息和声明电气电子工程师学会计算机期刊,体积73,问题三页857-871https://doi.org/10.109/TC.2023.3345173出版:2023年12月20日 出版历史 获取引文提醒新增引文提醒!此警报已成功添加,将发送到:只要您选择的记录被引用,您就会收到通知。新引文提醒!拜托登录到您的帐户 目录电气电子工程师学会计算机期刊体积73,问题三以前的文章学习神经网络应用中近似乘数的误差特征上一个下一篇文章边云连续体中的联合虚拟网络功能配置和流路由下一步摘要工具书类信息和贡献者文献计量学和引文视图选项工具书类媒体桌子分享摘要内存中有序的键值存储是现代分布式应用程序中的一个重要构建块。我们介绍了蜂巢,这是一种混合软件硬件系统,用于在有序键值存储上加速以读为主的工作负载,为包括扫描在内的所有操作提供线性化能力。蜂巢将B-Tree存储在主机内存中。它在CPU上执行<sc>put</sc>、<sc>update</sc]和<sc>delete</sc>。同时,它将<sc>scan</sc>和<sc>get</sc>卸载到基于FPGA的SmartNIC上。此方法支持大型存储并简化了FPGA实现,但也带来了跨慢速PCIe总线进行数据访问和同步的挑战。我们描述了蜂巢如何通过仔细的数据结构设计、缓存、请求并行和无序执行、无等待读取操作以及CPU和FPGA之间的快速同步来克服这一挑战。对于读取量大的YCSB工作负载,Honeycomb将最先进的有序键值存储的吞吐量提高了至少1.8美元乘以1.8美元</mml:mo></mml:math><inline-graphic xlink:href=“liu-ieq1-3345173.gif”/></alternatives></inline-formula>。对于受云存储启发的扫描繁重工作负载,Honeycomb将吞吐量提高了2美元乘以2美元</mml:mo></mml:math><inline-graphic xlink:href=“liu-ieq2-3345173.gif”/></alternatives></inline-formula>。对于大规模部署更为重要的性价比提高了至少1.5美元乘以1.5美元</mml:mo></mml:math><inline-graphic xlink:href=“liu-ieq3-3345173.gif”/></alternatives></inline-formula>关于这些工作负载。工具书类[1]B.Atikoglu、Y.Xu、E.Frachtenberg、S.Jiang和M.Paleczny,“大型键值商店的工作量分析”,见程序。第12届ACM SIGMETRICS/执行联合国际协调测量。模型。计算。系统。2012年,第53-64页。数字图书馆谷歌学者[2]P.A.Bernstein、V.Hadzilacos和N.Goodman,数据库系统中的并发控制与恢复第370卷。美国马萨诸塞州雷丁:艾迪森·韦斯利,1987年。数字图书馆谷歌学者[3]M.S.Brunella等人,《hXDP:FPGA NIC上的高效软件包处理》,in程序。第14届USENIX研讨会。操作系统。设计。实施(OSDI)2020年,第973–990页。谷歌学者[4]C.Buragohain等人,“A1:分布式内存中图形数据库”,in程序。ACM SIGMOD国际协调管理。数据,2020年,第329–344页。谷歌学者[5]M.Burke、S.Joyner、A.Szekeres、J.Nelson、I.Zhang和D.R.Ports,“PRISM:重新思考分布式系统的RDMA接口”,in程序。ACM SIGOPS第28交响乐团。操作系统。普林克。2021年,第228-242页。谷歌学者[6]B.Calder等人,《Windows Azure存储:具有强一致性的高可用云存储服务》程序。第23届ACM交响乐团。操作系统。普林克。2011年,第143-157页。谷歌学者[7]A.M.Caulfield等人,《云级加速体系结构》,in第49年。IEEE/ACM国际研讨会。米克罗基特。(微型),台湾台北,美国新泽西州皮斯卡塔韦:IEEE出版社,2016。谷歌学者[8]S.R.Chalamarasetti、K.Lim、M.Wright、A.AuYoung、P.Ranganathan和M.Margala,《FPGA memcached设备》,摘自程序。ACM/SIGDA国际交响乐团。现场可编程门阵列2013年,第245-254页。谷歌学者[9]Y.Chen、X.Wei、J.Shi、R.Chen和H.Chen,《使用RDMA和HTM的快速和通用分布式事务》程序。第11届欧洲财务会议计算。系统。2016年,第1-17页。谷歌学者[10]D.Comer,“无处不在的B树”ACM计算。Surv公司。第11卷,第2期,第121-137页,1979年。数字图书馆谷歌学者[11]“Redis社区”,Redis。访问时间:2023年4月3日。[在线]。可用:https://redis.io网址/谷歌学者[12]B.F.Cooper、A.Silberstein、E.Tam、R.Ramakrishnan和R.Sears,《使用YCSB对云服务系统进行基准测试》,in程序。第一交响乐团。云计算。2010年,第143-154页。数字图书馆谷歌学者[13]J.Ding等人,《ALEX:可更新的自适应学习索引》程序。ACM SIGMOD国际协调管理。数据2020年,第969-984页。谷歌学者[14]A.Dragojević等人,《无妥协:具有一致性、可用性和性能的分布式事务》程序。第25次研讨会。操作系统。普林克。2015年,第54–70页。数字图书馆谷歌学者[15]H.Eran、L.Zeno、M.Tork、G.Malka和M.Silberstein,“NICA:网络应用程序内联加速的基础设施”,in程序。USENIX年。技术确认(USENIX ATC)2019年,第345-362页。谷歌学者[16]D.Firestone等人,《Azure加速网络:公共云中的SmartNIC》程序。第15届USENIX交响乐团。Netw公司。系统。设计。实施(NSDI),D.Bansal,K.Vaid和D.A.Maltz,Eds.,2018年4月,第51-66页。谷歌学者[17]D.Heinrich、S.Werner、M.Stelzner、C.Blochwitz、T.Pionteck和S.Groppe,《语义web数据库系统中B+树的混合FPGA方法》程序。第十国际交响乐团。可重新配置的Commun-中央系统-芯片(ReCoSoC)美国新泽西州皮斯卡塔韦:IEEE出版社,2015年,第1-8页。谷歌学者[18]M.Herlihy,“无等待同步”ACM事务处理。程序。语言系统。(托普拉斯),第13卷,第1期,第124-149页,1991年。数字图书馆谷歌学者[19]M.P.Herlihy和J.M.Wing,“线性度:并发对象的正确性条件,”ACM事务处理。程序。语言系统。(托普拉斯),第12卷,第3期,第463-492页,1990年。数字图书馆谷歌学者[20]N.P.Jouppi等人,“三代人的十个教训塑造了谷歌的TPUv4i:工业产品”程序。ACM/IEEE第48年。国际交响乐团。计算。阿基特。(ISCA)美国新泽西州皮斯卡塔韦:IEEE出版社,2021年,第1-14页。数字图书馆谷歌学者[21]A.Kalia、M.Kaminsky和D.Andersen,《数据中心RPC可以通用且快速》程序。第16届USENIX交响乐团。Netw公司。系统。设计。实施(NSDI)2019年,第1-16页。谷歌学者[22]J.Kim等人,《LineFS:利用管道并行高效地卸载分布式文件系统的SmartNIC》程序。ACM SIGOPS第28交响乐团。操作系统。普林克。CD-ROM光盘美国纽约州纽约市:ACM,2021年,第756–771页。数字图书馆谷歌学者[23]J.Kim和A.Chang,“Poseidon V1 E1.S SSD存储系统”,开放计算项目,2022年。访问时间:2023年4月3日。[在线]。可用:https://www.opencompute.org/documents/poseidon-v1-reference-system-spec-pdf谷歌学者[24]T.Kraska、A.Beutel、E.H.Chi、J.Dean和N.Polyzotis,《学习索引结构案例》程序。Int.Conf.管理。数据2018年,第489-504页。谷歌学者[25]V.Leis、A.Kemper和T.Neumann,“自适应基数树:主内存数据库的ARTful索引”,in程序。IEEE第29届国际会议数据工程(ICDE),美国新泽西州皮斯卡塔韦:IEEE出版社,2013年,第38-49页。谷歌学者[26]J.J.Levandoski、D.B.Lomet和S.Sengupta,《Bw-tree:新硬件平台的B树》程序。IEEE第29届国际会议数据工程(ICDE)2013年,第302-313页。谷歌学者[27]B.Li等人,《KV-direct:具有可编程NIC的高性能内存键值存储》,in程序。第26交响曲。操作系统。普林克。2017年,第137-152页。数字图书馆谷歌学者[28]B.Li等人,《ClickNP:具有可重构硬件的高度灵活和高性能网络处理》,in程序。ACM SIGCOMM配置。2016年,第1-14页。谷歌学者[29]M.Liu、T.Cui、H.Schuh、A.Krishnamurthy、S.Peter和K.Gupta,《使用iPipe将分布式应用程序卸载到SmartNIC》程序。ACM特殊利益集团数据通信。2019年,第318–333页。数字图书馆谷歌学者[30]Y.Mao、E.Kohler和R.T.Morris,“快速多核键值存储的缓存技巧”,in程序。第七届ACM欧洲会议计算。系统。2012年,第183-196页。数字图书馆谷歌学者[31]P.E.McKenney和J.Walpole,“什么是RCU?”Linux每周新闻(LWN.net), 2007.谷歌学者[32]Mellanox,“ConnectX-3 VPI单双QSFP+端口适配器卡用户手册”,Mellanox2013年。[在线]。可用:https://www.mellanox.com/related-docs/user_manuals/ConnectX-3_VPI_Single_and_Dual_QSFP_Port_Adapter_Card_user_Manual.pdf谷歌学者[33]C.Mitchell、K.Montgomery、L.Nelson、S.Sen和J.Li,“在单元分布式B树存储中平衡CPU和网络”,in程序。USENIX年度。技术咨询(USENIXATC)2016年,第451-464页。谷歌学者[34]R.Nishtala等人,《在脸书上缩放内存缓存》程序。第十届USENIX交响乐团。Netw公司。系统。设计。实施(NSDI)2013年,第385-398页。数字图书馆谷歌学者[35]P.M.Phothilimthana、M.Liu、A.Kaufmann、S.Peter、R.Bodik和T.Anderson,“Floem:NIC加速网络应用程序的编程系统”,摘自程序。第13届USENIX交响乐团。操作系统。设计。实施(OSDI)2018年,第663-679页。谷歌学者[36]A.Putnam等人,《用于加速大规模数据中心服务的可重新配置结构》程序。第41年。国际交响乐团。计算。阿基特。(ISCA),明尼阿波利斯,明尼苏达州,美国。皮斯卡塔韦,新泽西州,美国:IEEE出版社,2014年,第13-24页。谷歌学者[37]Y.Ren等人,《在FPGA-CPU平台上使用B树的低延迟多版本密钥值存储》程序。第29届国际会议现场可编程逻辑应用。(FPL)美国新泽西州皮斯卡塔韦:IEEE出版社,2019年,第321-325页。谷歌学者[38]H.N.Schuh、W.Liang、M.Liu、J.Nelson和A.Krishnamurthy,《Xenic:SmartNIC-加速分布式事务》程序。ACM SIGOPS第28交响乐团。操作系统。普林克。2021年,第740-755页。数字图书馆谷歌学者[39]A.Singhvi等人,《CliqueMap:生产基于RMA的分布式缓存系统》,in程序。ACM SIGCOMM配置美国纽约州纽约市:美国医学会,2021年,第93–105页。谷歌学者[40]V.Venkataramani等人,《TAO:脸书如何服务社交图》程序。ACM SIGMOD国际协调管理。数据2012年,第791-792页。谷歌学者[41]Z.Wang等人,“建造一棵Bw树需要的不仅仅是流行语”程序。Int.Conf.管理。数据2018年,第473–488页。谷歌学者[42]X.Wei、R.Chen和H.Chen,“使用远程学习缓存的基于RDMA的快速有序键值存储”,in程序。第14届USENIX交响乐团。操作系统。设计。实施(OSDI)2020年,第117-135页。数字图书馆谷歌学者[43]H.Yang、Z.Li、J.Wang、S.Yin、S.Wei和L.Liu,“HeteroKV:异构CPU-FPGA平台上的可扩展线速键值存储”,in程序。设计。,自动化。测试欧洲Conf.Exhib。(日期)美国新泽西州皮斯卡塔韦:IEEE出版社,2021年,第834-837页。谷歌学者[44]A.Zeitak和A.Morrison,“杜鹃尝试:利用内存级并行实现高效DRAM索引”,in程序。ACM SIGOPS第28交响乐团。操作系统。普林克。2021年,第147-162页。谷歌学者[45]T.Ziegler、S.T.Vani、C.Binnig、R.Fonseca和T.Kraska,《为快速RDMA可访问网络设计分布式基于树的索引结构》程序。Int.Conf.管理。数据,2019年,第741–758页。谷歌学者 引用人查看全部内尔森-斯利文J扬科维奇R哈桑A帕尔米耶里R阿格拉瓦尔K彼得兰克E(2024)简短公告:ROMe:RDMA的无等待对象第36届ACM算法和体系结构并行性研讨会论文集10.1145/3626183.3660262(371-373)在线发布日期:2024年6月17日https://dl.acm.org/doi/10.1145/3626183.3660262 索引术语 蜂巢:基于FPGA的SmartNIC上的有序键值存储加速计算机系统组织体系结构硬件集成电路超大规模集成设计特定应用的超大规模集成电路设计 索引项已通过自动分类分配给内容。 建议 基于LSM的键值存储的FPGA加速压缩FAST’20:第18届USENIX文件和存储技术会议记录 日志结构合并树(LSM-Tree)键值(KV)存储作为分层存储具有较高的写入效率和较低的成本,因此在业界得到了广泛的部署。为了保持这种优势,LSM-tree依赖于后台压缩操作来。。。阅读更多信息大规模键值存储的LSM-树管理存储SoCC’17:2017年云计算研讨会论文集 键值存储越来越多地采用LSM-树作为后端存储中的启用数据结构,并通过文件系统持久化其集群数据。文件系统不仅需要提供文件/目录抽象来组织。。。阅读更多信息用于大规模键值存储的LSM-树管理存储 键值存储越来越多地采用LSM-树作为后端块存储中的启用数据结构,并通过块管理器(通常是文件系统)持久化其集群数据。一般来说,文件系统不仅应该。。。阅读更多信息 评论 Please enable JavaScript to view thecomments powered by Disqus. 信息和贡献者问询处发布于 电气电子工程师学会计算机期刊 第73卷第3期2024年3月325页ISSN公司:0018-9340期刊目录 0018-9340©2023 IEEE版权所有。允许个人使用,但重新发布/重新分发需要IEEE许可。请参见https://www.ieee.org/publications/rights/index.html了解更多信息。出版商IEEE计算机学会美国出版历史出版:2023年12月20日限定符研究文章贡献者 其他指标查看文章指标文献计量学和引文文献计量学 文章指标 1引文总数查看引文0总下载次数下载次数(过去12个月)0下载次数(最近6周)0 其他指标查看作者指标引文 引用人查看全部内尔森-斯利文J扬科维奇R哈桑A帕尔米耶里R阿格拉瓦尔K彼得兰克E(2024)简短公告:ROMe:RDMA的无等待对象第36届ACM算法和体系结构并行性研讨会论文集10.1145/3626183.3660262(371-373)在线发布日期:2024年6月17日https://dl.acm.org/doi/10.1145/3626183.3660262 视图选项查看选项获取访问权限 登录选项检查您是否可以通过登录凭据或您的机构访问本文。登录完全访问权限获取此出版物 媒体数字其他桌子分享分享共享此出版物链接复制链接已复制!复制失败。在社交媒体上分享Linkedin公司重新编辑电子邮件附属公司军献 线路接口单元微软,美国雷蒙德https://orcid.org/0000-0002-4277-1802查看个人资料亚历山大 DragojevićCitadel Securities,英国伦敦查看个人资料谢恩 弗莱明AMD,英国斯旺西查看个人资料安东尼奥斯 卡萨拉基斯华为,英国爱丁堡查看个人资料达里奥 科罗利亚ETH苏黎世、苏黎世和瑞士查看个人资料伊戈尔 扎布尔基瑞士苏黎世Mysten实验室查看个人资料和尚 Ng公司英国伦敦帝国理工学院https://orcid.org/0000-0002-5171-1318查看个人资料阿努吉 卡莉亚微软,美国雷德蒙德查看个人资料米格尔 卡斯特罗OpenAI,英国伦敦查看个人资料