跳到主要内容
10.1145/3373376.3378451acm会议文章/章节视图摘要出版物页面阿斯普洛斯会议记录会议集合
研究论文
公共访问
可用工件
评估的工件和功能

∅sim:为具有万亿级存储器的世界准备系统软件

出版:2020年3月13日出版历史

摘要

存储技术的最新进展意味着商品机器可能很快就会有TB的内存;然而,这种机器在今天仍然很昂贵而且不常见。因此,很少有程序员和研究人员能够调试和原型化可伸缩性问题的修复,或者探索由TB级内存引起的新系统行为。

为了能够快速、早期地对此类机器的系统软件进行原型制作和探索,我们构建并开源了∅sim模拟器。∅sim使用虚拟化来模拟大型工作负载在普通机器上的执行。我们的主要观察结果是,许多工作负载遵循相同的控制流,而不管其输入如何。我们称这种工作负载为数据透明。0sim利用数据共享性,通过内存压缩使大型模拟变得可行和快速。

∅sim对于许多任务来说足够精确,可以模拟一个比主机大20-30倍的来宾系统,对于我们观察到的工作负载,它的速度是主机的8倍-100倍,而更可压缩的工作负载运行得更快。例如,我们在31GB机器上模拟1TB机器,在160GB机器上仿真4TB机器。我们进行了案例研究,以证明∅sim的实用性。例如,我们发现,对于混合工作负载,尽管有几十GB的可用内存,Linux内核仍然可以创建无法修复的碎片,并且我们使用∅sim调试内存巨大的memcached的意外故障。

工具书类

  1. Linux内核文档:设备映射器精简配置。https://www.kernel.org/doc/Documentation/device-mapper/thin-provisioning.txt。谷歌学者谷歌学者
  2. Linux内核文档:内核Samepage合并。https://www.kernel.org/doc/html/latest/admin-guide/mm/ksm.html。谷歌学者谷歌学者
  3. Linux内核文档:Zswap。https://www.kernel.org/doc/Documentation/vm/zswap.txt。谷歌学者谷歌学者
  4. Redis延迟问题textendash Redis疑难解答。https://redis.io/topics/latency。谷歌学者谷歌学者
  5. Bulent Abali、Hubertus Franke、Dan E.Poff、Robert A.Saccone、Charles O.Schulz、Lorraine M.Herger和T.Basil Smith。hrefhttp://citeserx.ist.psu.edu/viewdoc/summary?doi=10.1.1.16.5201内存扩展技术(MXT):软件支持和性能。IBM研究与开发杂志,45(2):287--3012001年3月。谷歌学者谷歌学者数字图书馆数字图书馆
  6. 尼丁·阿格拉瓦尔(Nitin Agrawal)、利奥·阿鲁拉吉(Leo Arulraj)、安德烈亚·阿帕西·杜塞奥(Andrea C.Arpaci-Dusseau)和雷姆齐·H·阿帕西·杜塞奥(Remzi H.Arpaci-Dosseau。hrefhttp://doi.acm.org/10.1145/207861.2078862仿真大卫的歌利亚存储系统。ACM事务处理。存储,7(4):2012年2月12:1--12:21。谷歌学者谷歌学者数字图书馆数字图书馆
  7. 马丁·艾格纳(Martin Aigner)、克里斯托夫·基尔希(Christoph M.Kirsch)、迈克尔·利普茨(Michael Lippautz)和安娜·索科洛娃(Ana Sokolova)。hrefhttp://doi.acm.org/10.1145/2814270.2814294快速,通过大型虚拟内存和全局数据结构进行多核可扩展、低碎片内存分配。《2015年ACM SIGPLAN面向对象编程、系统、语言和应用国际会议论文集》,OOPSLA,2015年。谷歌学者谷歌学者
  8. 阿拉·R·阿拉梅尔丁(Alaa R.Alameldeen)、米洛·M·K·马丁(Milo M.K.Martin)、卡尔·J·摩尔(Carl J.Mauer)、凯文·摩尔(Kevin E.Moore)、闵·徐(Min Xu)、马克·D·希尔(Mark D.Hill。hrefhttps://doi.org/10.109/MC.2003.1178046模拟一台200万美元的PC上的200万美元商业服务器,36(2):50-572003年2月。谷歌学者谷歌学者数字图书馆数字图书馆
  9. 亚马逊公司EC2实例定价文本-亚马逊网络服务(AWS)。https://aws.amazon.com/ec2/pricing/on-demand/。谷歌学者谷歌学者
  10. Amazon Inc.Amazon EC2高内存实例,具有6、9和12 TB内存,非常适合SAP HANA。https://aws.amazon.com/blogs/aws/now-available-amazon-ec2-high-memory-instances-with-6-9-and-12-tb-of-memory-perfect-for-sap-hana/2018年9月。谷歌学者谷歌学者
  11. G.M.Amdahl、G.A.Blaauw和F.P.Brooks。hrefhttps://doi.org/10.1147/rd.82.0087架构IBM系统/360。IBM研究与开发杂志,8(2):87-1011964年4月。谷歌学者谷歌学者数字图书馆数字图书馆
  12. 苹果公司OS X小牛核心技术概述。https://images.apple.com/media/us/osx/2013/docs/osx_Mavericks_Core_Technology_Overview.pdf, 2013.谷歌学者谷歌学者
  13. David H Bailey、E.Barszcz、John T Barton、D.S.Browning、R.L.Carter、Leonardo Dagum、Rod A Fatoohi、Paul O Frederickson、Tom A Lasinski、Robert S Schreiber、Horst D Simon、V.Venkatakrishnan和Sisira K Weeratunga。hrefhttp://doi.acm.org/10.1145/125826.125925NAS平行基准:总结和初步结果。1991年ACM/IEEE超级计算会议论文集,1991年。谷歌学者谷歌学者数字图书馆数字图书馆
  14. 阿尔卡普拉瓦·巴苏、杰内尔·甘地、张继川、马克·希尔和迈克尔·斯威夫特。hrefhttp://doi.acm.org/10.1145/2485922.2485943高效大内存服务器的虚拟内存。第40届计算机体系结构国际研讨会论文集,ISCA,2013年。谷歌学者谷歌学者数字图书馆数字图书馆
  15. 利兰·L·贝克。hrefhttp://doi.acm.org/10.1145/358656.358671A基于内存驻留时间的动态存储分配技术。Commun公司。ACM,25(10):714-7241982年10月。谷歌学者谷歌学者数字图书馆数字图书馆
  16. C.戈登·贝尔和艾克·纳西。hrefhttps://ieeexplore.ieee.org/document/8268027重访可扩展相干共享内存。计算机,51(1):40-492018年1月。谷歌学者谷歌学者交叉引用交叉引用
  17. Muli Ben-Yehuda、Michael D.Day、Zvi Dubitzky、Michael Factor、Nadav Har'El、Abel Gordon、Anthony Liguori、Orit Wasserman和Ben-Ami Yassour。hrefhttps://www.usenix.org/conference/osdi10/turtles-project-design-and-implementation-nested-virizationThe海龟项目:嵌套虚拟化的设计与实现。第九届USENIX操作系统设计与实现研讨会,OSDI,2010年。谷歌学者谷歌学者
  18. 安娜·本德斯基和埃雷斯·彼得兰克。hrefhttp://doi.acm.org/10.1145/1926385.1926441空间部分压缩动态内存管理的开销界限。2011年,第38届ACM SIGPLAN-SIGACT编程语言原理研讨会论文集。谷歌学者谷歌学者
  19. Emery D.Berger、Kathryn S.McKinley、Robert D.Blumofe和Paul R.Wilson。hrefhttp://doi.acm.org/10.1145/356989.357000主页:用于多线程应用程序的可扩展内存分配器。SIGPLAN否。,35(11):117--128,2000年11月。谷歌学者谷歌学者数字图书馆数字图书馆
  20. 拉维·巴加瓦(Ravi Bhargava)、本杰明·塞雷布林(Benjamin Serebrin)、弗朗西斯科·斯帕迪尼(Francesco Spadini)和斯利拉塔·曼恩(Srilatha Manne)。hrefhttp://doi.acm.org/10.1145/1346281.1346286加速虚拟化系统的二维页面漫游。《第13届编程语言和操作系统体系结构支持国际会议论文集》,ASPLOS,2008年。谷歌学者谷歌学者
  21. Nathan Binkert、Bradford Beckmann、Gabriel Black、Steven K.Reinhardt、Ali Saidi、Arkaprava Basu、Joel Hestness、Derek R.Hower、Tushar Krishna、Somayeh Sardashti、Rathijit Sen、Korey Sewell、Muhammad Shoaib、Nilay Vaish、Mark D.Hill和David A.Wood。hrefhttp://dl.acm.org/citation.cfm?id=2024716.2024718gem5模拟器。ACM SIGARCH计算机架构新闻,39(2):1-7,2011年5月。谷歌学者谷歌学者数字图书馆数字图书馆
  22. Edouard Bugnion、Scott Devine、Kinshuk Govil和Mendel Rosenblum。hrefhttp://doi.acm.org/10.1145/265924.265930迪斯科:在可扩展多处理器上运行商品操作系统。ACM事务处理。计算。系统。,15(4):412--4471997年11月。谷歌学者谷歌学者数字图书馆数字图书馆
  23. 马修·查普曼和格诺特·海泽。hrefhttp://dl.acm.org/citation.cfm?id=1855807.1855809vNUMA:虚拟共享内存多处理器。《2009年USENIX年度技术会议记录》,USENIXATC,2009年。谷歌学者谷歌学者
  24. 奥斯汀·T·克莱门茨(Austin T.Clements)、M·弗兰斯·卡索克(M.Frans Kaashoek)和尼科莱·泽尔多维奇(Nickolai Zeldovich)。hrefhttp://doi.acm.org/10.1145/2465351.2465373 RadixVM:多线程应用程序的可扩展地址空间。《第八届ACM欧洲计算机系统会议论文集》,EuroSys,2013年。谷歌学者谷歌学者数字图书馆数字图书馆
  25. 乔纳森·科贝特。持久内存和页面结构。https://lwn.net/文章/644079/2015年5月。谷歌学者谷歌学者
  26. 乔纳森·科尔贝。持久内存支持进度。https://lwn.net/Articles/640113(网址:https://lwn.net/Articles/640113)/2015年4月。谷歌学者谷歌学者
  27. 乔纳森·科尔贝。区域_DEVICE和结构页的未来。https://lwn.net/文章/717555/2017年3月。谷歌学者谷歌学者
  28. 乔纳森·科尔贝。改进对大型连续分配的支持。https://lwn.net/文章/753167/,2018年5月。谷歌学者谷歌学者
  29. 乔纳森·科尔贝。Ktask:优化CPU密集型内核工作。https://lwn.net/文章/771169/2018年11月。谷歌学者谷歌学者
  30. 乔纳森·科尔贝。在大内存系统上实现更好的性能。https://lwn.net/文章/753171/2018年5月。谷歌学者谷歌学者
  31. 乔纳森·科尔贝。主动回收空闲内存。https://lwn.net/文章/787611/2019年5月。谷歌学者谷歌学者
  32. 沙发座。禁用透明大页面(THP)| Couchbase文档。https://docs.couchbase.com/server/current/install/thp-disable.html。谷歌学者谷歌学者
  33. Jean-Francois Dagenais女士。UIO下PCI-E设备的超大DMA缓冲区。https://lkml.org/lkml/2011/18/462。谷歌学者谷歌学者
  34. D.朱莉娅。M.戴维斯。hrefhttp://doi.acm.org/10.1145/358198.358226内存垃圾收集系统的占用模式。Commun公司。ACM,27(8):819-8251984年8月。谷歌学者谷歌学者
  35. Srividya Desireddy公司。[PATCH v2]zswap:零填充页面处理。https://lkml.org/lkml/2017/8/16/560。谷歌学者谷歌学者
  36. Magnus Ekman和Per Stenstrom。hrefhttps://doi.org/10.109/ISCA.2005.6A稳健的主内存压缩方案。第32届计算机体系结构国际研讨会论文集,ISCA,2005年。谷歌学者谷歌学者
  37. 雅各布·恩格布洛姆。模拟6 TB的严重RAM。https://software.intel.com/en-us/blogs/2016/09/02/simulating-six-terabytes-of-serior-ram, 2017.谷歌学者谷歌学者
  38. 迈克尔·约瑟夫·菲利(Michael Joseph Feeley)、W.E.Morgan、E.P.Pighin、A.R.Karlin、Henry M Levy和Chandramohan A Thekkath。hrefhttp://doi.acm.org/10.1145/224056.224072实施工作站群集中的全局内存管理。在第十五届ACM操作系统原理研讨会论文集,SOSP,1995年。谷歌学者谷歌学者数字图书馆数字图书馆
  39. 杰内尔·甘地、瓦西里奥斯·卡拉科斯塔斯、福坎·阿亚尔、阿德里安·克里斯塔尔、马克·D·希尔、凯瑟琳·麦金利、马里奥·内米洛夫斯基、迈克尔·斯威夫特和奥斯曼·苏安萨尔。hrefhttps://ieeexplore.ieee.org/document/7436661范围快速虚拟内存的转换。IEEE Micro,36(3):118-1262016年5月。谷歌学者谷歌学者交叉引用交叉引用
  40. Erol Gelenbe、J.C.A.Boekhorst和J.L.W.Kessels。hrefhttp://doi.acm.org/10.1145/362248.362253最小化分区分割中浪费的空间。Commun公司。ACM,16(6):343--3491973年6月。谷歌学者谷歌学者数字图书馆数字图书馆
  41. 谷歌公司谷歌计算引擎定价-谷歌云。https://cloud.google.com/compute/pricing#machinetype。谷歌学者谷歌学者
  42. 梅尔·戈尔曼和安迪·惠特克罗夫特。反碎片化的内容、原因和去向。《Linux研讨会论文集》,第1卷,第369-384页,2006年1月。谷歌学者谷歌学者
  43. 顾俊成、李英蒙、张艺文、穆沙拉夫·乔杜里和康国新。hrefhttps://www.usenix.org/conference/nsdi17/technical-sessions/presentation/guEfficient网站使用Infiniswap进行内存分解。第14届USENIX网络系统设计与实现研讨会,NSDI,2017年。谷歌学者谷歌学者
  44. 迪瓦克·古普塔(Diwaker Gupta)、肯尼斯·尤库姆(Kenneth Yocum)、马文·麦克奈特(Marvin McNett)、亚历克斯·C·斯诺伦(Alex C.Snoeren)、阿明·瓦达特(Amin Vahdat)和杰弗里·沃克尔(Geoffrey M。hrefhttp://doi.acm.org/10.1145/1095810.1118605收件人无限与超越:时间扭曲的网络仿真。第二十届ACM操作系统原理研讨会论文集,SOSP海报会议,2005年。谷歌学者谷歌学者数字图书馆数字图书馆
  45. 丹尼尔·希尔斯伯格(Daniel S.Hirschberg)。hrefhttp://doi.acm.org/10.1145/362375.362392A一类动态内存分配算法。Commun公司。ACM,16(10):615--61851973年10月。谷歌学者谷歌学者数字图书馆数字图书馆
  46. Intel Inc.5级寻呼和5级EPT。https://software.intel.com/en-us/download/5-level-paging-and-5-level-ept-white-paper。谷歌学者谷歌学者
  47. 针对虚拟化的Intel Inc.Timestamp-Counter Scaling(TSC缩放)。https://www.intel.com/content/www/us/en/processors/timestamp-counterscaleing-virtualization-white-paper.html。谷歌学者谷歌学者
  48. Intel Inc.Intel的3D XPoint#8482;Technology Products(技术产品)文本介绍了什么是可用的,什么即将到来。https://software.intel.com/en-us/articles/3d-xpoint-technology-products网站2017年10月。谷歌学者谷歌学者
  49. 马克·约翰斯通(Mark S.Johnstone)和保罗·威尔逊(Paul R.Wilson)。hrefhttp://doi.acm.org/10.1145/286860.286864内存碎片问题:解决了吗?1998年ISMM第一届记忆管理国际研讨会论文集。谷歌学者谷歌学者
  50. 丹尼尔·乔丹。[RFC,v4,00/13]ktask:多线程CPU密集型内核工作-修补程序。https://patchwork.kernel.org/cover/10668661/。谷歌学者谷歌学者
  51. Frans Kaashoek、Robert Morris和Yandong Mao。hrefhttps://dspace.mit.edu/bitstream/handle/1721.1/54692/mit-CSAIL-TR-2010-020.pdf优化多核架构的MapReduce。MIT-CSAIL-TR-2010-020技术报告,计算机科学和人工智能实验室,麻省理工学院,2010年5月。谷歌学者谷歌学者
  52. 萨加尔·卡兰迪卡尔、霍华德·毛、东于金、大卫·比安科林、阿隆·阿米德、戴约尔·李、内森·彭伯顿、艾曼纽尔·阿马罗、科林·施密特、阿迪蒂亚·乔普拉、黄启静、凯尔·科瓦茨、波里沃耶·尼科利奇、兰迪·卡茨、乔纳森·巴赫拉赫和克里斯特·阿萨诺维奇。hrefhttps://doi.org/10.109/ISCA.2018.00014消防模拟:FPGA—公共云中的加速循环精确扩展系统仿真。第45届计算机体系结构国际研讨会论文集,ISCA,2018年。谷歌学者谷歌学者数字图书馆数字图书馆
  53. 肯尼思·诺尔顿(Kenneth C.Knowlton)。hrefhttp://doi.acm.org/10.1145/365628.365655A快速存储分配器。Commun公司。ACM,8(10):623--6241965年10月。谷歌学者谷歌学者数字图书馆数字图书馆
  54. 保罗·科彻(Paul Kocher)、詹恩·霍恩(Jann Horn)、安德斯·福格(Anders Fogh)和丹尼尔·根金(Daniel Genkin)、丹尼尔·格鲁斯(Daniele Gruss)、沃纳·哈斯(Werner Haas)、迈克·汉堡(Mike Hamburg)、莫里茨·利普(Moritz Lipp)、斯特凡·曼。Spectre攻击:利用推测执行。第40届IEEE安全与隐私研讨会,标准普尔,2019年。谷歌学者谷歌学者
  55. 特德·刘易斯、布莱恩·史密斯和玛丽莲·史密斯。hrefhttp://doi.acm.org/10.1145/108800.1408893动态用于最小化内部碎片的内存分配系统。1974年ACM年会论文集——第2卷,1974年。谷歌学者谷歌学者数字图书馆数字图书馆
  56. 莫里茨·利普(Moritz Lipp)、迈克尔·施瓦兹(Michael Schwarz)、丹尼尔·格鲁斯(Daniel Gruss)、托马斯·普雷舍(Thomas Prescher)、沃纳·哈斯(Werner Haas)、安德斯·福格(Anders Fogh)、詹恩·霍恩(Jann Horn)、斯特凡·曼加德(Stefan Mangard)、保罗·科赫(Paul。在第27届USENIX安全研讨会上,USENIX安全,2018。谷歌学者谷歌学者
  57. Microsoft Inc.定价-Linux虚拟机| Microsoft Azure。https://azure.microsoft.com/en-us/pricing/details/virtual-machines/linux/。谷歌学者谷歌学者
  58. MongoDB Inc.禁用透明大页面(THP)文本emdash MongoDB手册。https://docs.mongodb.com/manual/tutorial/transparent-huge-pages。谷歌学者谷歌学者
  59. 安德鲁·莫顿。回复:[PACH-RFC]允许将大型内存机器的vm_dirty设置为低于1%。https://lkml.org/lkml/2007/1/9/80。谷歌学者谷歌学者
  60. 安德鲁·莫顿。Re:[PATCH v2]z3fold:压缩页面的三重分配器。https://lkml.org/lkml/2016/4/21/799。谷歌学者谷歌学者
  61. 诺曼·R·尼尔森。hrefhttp://doi.acm.org/10.1145/359863.359890动态计算机模拟中的内存分配。Commun公司。ACM,20(11):864--8731977年11月。谷歌学者谷歌学者数字图书馆数字图书馆
  62. Markus F.X.J.Oberhumer。Oberhumer.com:LZO实时数据压缩库。http://www.oberhumer.com/opensource/lzo/。谷歌学者谷歌学者
  63. 《Oracle Inc.数据库安装指南》。https://docs.oracle.com/cd/E11882_01/install.112/e47689/pre_install.htm#LADBI1152。谷歌学者谷歌学者
  64. Oracle Inc.HotSpot虚拟机垃圾收集调整指南。https://docs.oracle.com/en/java/javase/11/gctuning/z-garbage-collector1.html#GUID-A5A42691-095E-47BA-B6DC-FB4E5FAA43D0。谷歌学者谷歌学者
  65. Ashish Panwar、Naman Patel和K.Gopinath。hrefhttp://doi.acm.org/10.1145/2967360.2967371A保护来自内核的巨大页面的案例。第七届ACM SIGOPS亚太系统研讨会会议记录,APSys,2016年。谷歌学者谷歌学者数字图书馆数字图书馆
  66. Ashish Panwar、Aravinda Prasad和K.Gopinath。hrefhttp://doi.acm.org/10.1145/3173162.3173203制作巨大的页面实际上很有用。《第二十三届编程语言和操作系统体系结构支持国际会议论文集》,ASPLOS,2018年。谷歌学者谷歌学者数字图书馆数字图书馆
  67. Chang Hyun Park、Taekyung Heo、Jungi Jeong和Jaehyuk Huh。hrefhttp://doi.acm.org/10.1145/3079856.3080217混合TLB合并:在不同的碎片内存分配下提高TLB翻译覆盖率。第44届计算机体系结构国际研讨会论文集,ISCA,2017年。谷歌学者谷歌学者
  68. 詹姆斯·彼得森和西奥多·诺曼。hrefhttp://doi.acm.org/10.1145/359605.359626好友系统。Commun公司。ACM,20(6):421-4311977年6月。谷歌学者谷歌学者数字图书馆数字图书馆
  69. Aravinda Prasad和K.Gopinath。hrefhttp://doi.acm.org/10.1145/2872362.2872405谨慎基于拖延的同步中的内存回收。《第二十一届编程语言和操作系统体系结构支持国际会议论文集》,ASPLOS,2016年。谷歌学者谷歌学者数字图书馆数字图书馆
  70. Robert Ricci、Eric Eide和CloudLab团队。hrefhttps://www.usenix.org/publications/login/dec14/ricci简介云实验室:推进云架构和应用的科学基础设施;登录名:,39(6):36--382014年12月。谷歌学者谷歌学者
  71. 卡尔·鲁普。40年微处理器趋势数据。https://www.karlrupp.net/2015/06/40-years-of-microprocessor-trend-data/。谷歌学者谷歌学者
  72. ScaleMP Inc.ScaleMP—用于高端计算的虚拟化。https://www.scalemp.com/。谷歌学者谷歌学者
  73. 约翰·肖尔(John E.Shore)。hrefhttp://doi.acm.org/10.1145/360933.360949打开First-fit和Best-fit分配策略产生的外部存储碎片。Commun公司。ACM,18(8):433--4401975年8月。谷歌学者谷歌学者数字图书馆数字图书馆
  74. TidalScale Inc.软件定义服务器。https://www.tidalscale.com/technology。谷歌学者谷歌学者
  75. 莱纳斯·托瓦尔兹。预填充匿名页面。https://www.realworldtech.com/forum/?threadid=185310&curpostid=1853982019年6月。谷歌学者谷歌学者
  76. 哈里斯·沃洛斯(Haris Volos)、吉尔赫梅·马加尔哈斯(Guilherme Magalhaes)、卢德米拉·切尔卡索娃(Ludmila Cherkasova)和李军(Jun Li)。hrefhttp://doi.acm.org/10.1145/2814576.2814806石英:持久内存软件的轻量级性能仿真器。《第16届中间件年会论文集》,中间件,2015年。谷歌学者谷歌学者数字图书馆数字图书馆
  77. 卡尔·A·沃尔兹清洗机。hrefhttp://dl.acm.org/citation.cfm?id=1060289.1060307内存VMware ESX Server中的资源管理。2002年OSDI第五届操作系统设计与实现研讨会论文集。谷歌学者谷歌学者
  78. Yang Wang、Manos Kapritsos、Lara Schmidt、Lorenzo Alvisi和Mike Dahlin。hrefhttp://dl.acm.org/citation.cfm?id=2616448.2616461考试:授权研究人员评估大型存储系统。《第11届USENIX网络系统设计与实现会议记录》,NSDI,2014年。谷歌学者谷歌学者

索引术语

  1. ∅sim:为具有万亿级存储器的世界准备系统软件

        建议

        评论

        登录选项

        请检查您是否可以通过登录凭据或您的机构访问此文章以获得完全访问权限。

        登录

        完全访问权限

        PDF格式

        以PDF文件查看或下载。

        PDF格式

        电子阅读器

        使用eReader联机查看。

        电子阅读器