名人堂奖

提名截止日期:2024年7月31日

SIGOPS名人堂奖设立于2005年,旨在表彰过去至少十年发表的最具影响力的操作系统论文。从2016年开始,SIGOPS将每年选择1-2篇论文,仅限于之前至少10年以任何形式发表的论文,具体而言,在第X-9年9月30日之前,其中X是选择年份。

这些奖项的遴选委员会由在10-11年内举行的SOSP/OSDI会议的项目主席/联合主席组成。如果出现利益冲突,早期SOSP/OSDI会议的项目主席将帮助进行选择。

这一决定将基于一次讨论,该讨论考虑了该论文(以及更广泛地说,该论文中描述的研究)对操作系统研究领域的影响。奖项委员会将准备一份简短的声明,描述论文被选中的原因。有关该奖项SIGOPS政策的深入讨论,请阅读Jeff Mogul的SIGOPS名人堂奖政策.

获奖者将由现任项目主席在SOSP或OSDI会议上宣布。项目主席将阅读奖项委员会编写的声明,其中描述了论文被选中的原因。获奖论文的作者将获得一块牌匾,上面注明论文、作者、论文发表的会议或期刊以及获奖的会议。该证书将由SIGOPS项目主席和现任主席签署。获奖者名单将保存在SIGOPS网站上。

2024提名

2024年,2015年9月30日之前发表的操作系统论文有资格获得提名。允许自我提名。2024年选拔委员会由迈克·达林、杰森·弗林和汉克·利维组成

请使用以下表格提交提名:
https://tinyurl.com/sigopshof2024

提名必须在2024年7月31日或之前在任何时区收到。您可以通过以下方式向选拔委员会提出问题和意见:HOFnominations@sigops.org。

获奖者

2023

  • Paul Barham、Boris Dragovic、Keir Fraser、Steven Hand、Tim Harris、Alex Ho、Rolf Neugebauer、Ian Pratt、Andrew Warfield。对于他们的论文Xen和虚拟化艺术在SOSP'03:第十九届ACM操作系统原理研讨会论文集。“Xen论文通过引入多种创新技术,在推进虚拟化领域发挥了重要作用。其贡献对现代虚拟机监控程序的设计和实现产生了重大影响,并继续影响着虚拟化技术在研究和工业领域的发展。”

2022

    • James C.Corbett、Jeffrey Dean、Michael Epstein、Andrew Fikes、Christopher Frost、JJ Furman、Sanjay Ghemawat、Andrey Gubarev、Christopher Heiser、Peter Hochschild、Wilson Hsieh、Sebastian Kanthak、Eugene Kogan、Hongyi Li、Alexander Lloyd、Sergey Melnik、David Mwaura、David Nagle、Sean Quinlan、Rajesh Rao、Lindsay Rolig、Yasushi Saito、,Michal Szymanik、Christopher Taylor、Ruth Wang和Dale Woodford谷歌公司。对于他们的论文扳手:谷歌全球分布式数据库OSDI’12:第十届USENIX操作系统设计与实现会议记录。“Spanner展示了如何平衡全球复制事务数据库系统的一致性、可用性和分区容差要求。在这样做的过程中,Spanner简化了一系列更高级别服务的实现,这些服务可以通过熟悉且功能强大的事务API在全球范围内扩展。关键在于利用TrueTime和专用、冗余、高容量数据中心广域网(不同于公共互联网)的时钟同步作为扩展基础的观点,在今天仍然是基本的设计模式。”

2021

    • 蒂穆·科波宁(Teemu Koponen)、马丁·卡萨多(Martin Casado)、娜塔莎·古德(Natasha Gude)、杰里米·斯特林(Jeremy Stribling)、利昂·波提夫斯基(Leon Poutievski)、朱敏(Min Zhu)、拉吉夫·拉马纳森(Rajiv Ramanathan)、岩田裕一郎(Y。对于他们的论文:Onix:大型生产网络的分布式控制平台OSDI’10:第九届USENIX操作系统设计与实现会议记录。“Onix与作者构建的几个早期学术原型一起,演示了如何构建通用、可扩展的操作系统来管理共享网络资源,这是软件定义网络广泛商业成功的关键因素。”

2020

    • William Enck、Peter Gilbert、Byung-Gon Chun、Landon P.Cox、Jaeyon Jung、Patrick McDaniel和Anmol N.Sheth。对于他们的论文TaintDroid:一种用于智能手机实时隐私监控的信息流跟踪系统OSDI’10:第九届USENIX操作系统设计与实现会议记录。“这篇论文有助于证明污点跟踪可以高效且细粒度地进行。对于未经修改的智能手机应用程序,在最小的监控开销下,作者发现了数十个潜在的敏感和隐私信息泄漏。这项工作引发了一个关于智能手机隐私的重要研究议程,该议程包括直到今天。”

    • 安德鲁·鲍曼(Andrew Baumann)、保罗·巴勒姆(Paul Barham)、皮埃尔·埃瓦里斯特·达甘(Pierre-Evariste Dagand)、蒂姆·哈里斯(Tim Harris)、丽贝卡·艾萨克斯(Rebecca Isaacs)、西蒙·彼得(Simon Peter)、蒂莫西·罗斯科(Timothy Ros。对于他们的论文多核:一种新的可扩展多核系统操作系统体系结构在SOSP'09:ACM SIGOPS第22届操作系统原理研讨会论文集。“本文综合了微内核的一些想法,构建了一个高度可扩展的多处理器操作系统。Barrelfish激发了将单机操作系统设计为分布式系统的需要,该系统具有共享内存消息队列,用于应用程序、内核和可扩展的用户级服务之间的通信如所示。”

2019

    • 柯克·格雷姆、金舒曼·金舒曼、史蒂夫·格林伯格、加布里埃尔·奥尔、文斯·奥尔戈文、格雷格·尼科尔斯、大卫·格兰特、格雷琴·洛伊尔和盖伦·亨特。大规模调试:十年的实施和经验在SOSP’09 ACM SIGOPS第22届操作系统原理研讨会论文集中。“本文描述了长达十年的成功努力,通过收集和分析世界各地每台PC所经历的每次崩溃的数据,极大地提高了Windows的安全性和可靠性。尽管我们现在理所当然地认为,部署的软件应该总是“呼叫总部”错误报告,本文所描述的工作是第一次在全球范围内这样做。”

    • 格温·克莱因(Gerwin Klein)、凯文·埃尔芬斯通(Kevin Elphinstone)、格诺特·海泽(Gernot Heiser)、琼·安德罗妮克(June Andronick)、大卫·科克(David Cock)、菲利普·德林(Philip Derrin)、达米卡·埃尔卡杜威(Dhammika Elkaduwe)、凯·恩格哈特(Kai Engelhar。seL4:操作系统内核的形式化验证在SOSP’09 ACM SIGOPS第22届操作系统原理研讨会论文集中。“seL4项目是第一个为高性能微内核的正确性和安全性属性提供机器检查证明的项目。作者使用了一种独特的方法,融合了形式化和操作系统技术,产生了一个通用操作系统内核,它的性能与最先进的微内核和who对于任何输入,都可以精确地预测e行为。这项工作已经成为在可证明的正确系统中进行大量后续工作的基础。”

2018

    • 袁瑜、迈克尔·伊萨德、丹尼斯·费特利、米海·布迪乌、乌尔法尔·埃尔林森、普拉迪普·库马尔·冈达和乔恩·库里。DryadLINQ:使用高级语言进行通用分布式数据并行计算的系统。OSDI’08:2008年第八届USENIX操作系统设计与实现会议记录。DryadLINQ演示了如何在顶部提供声明性操作分布式数据流系统,方便程序员使用计算在大型数据集上使用关系运算符提供高-性能。其技术包括翻译数据-并行操作成为Dryad数据的分布式执行计划流动系统.论文通过展示结果来自Dryad正在数千台计算机的集群上生产。

    • 克里斯蒂安·卡达尔(Cristian Cadar)、丹尼尔·邓巴(Daniel Dunbar)和道森·恩格尔(Dawson Engler)。KLEE:复杂系统程序高覆盖测试的无辅助自动生成。OSDI’08:2008年第八届USENIX操作系统设计与实现会议记录。KLEE展示了如何缩放符号执行以生成实现高覆盖率的自动测试,并将其应用于广泛使用的软件,包括GNU COREUTILS实用程序。作者通过发现手动测试遗漏的错误,证明了KLEE在大量使用的程序上的有效性。想法和结果 灵感许多的后来的工作关于自动错误查找。

2017

    • 迈克·伯罗斯。用于松散耦合分布式系统的Chubby锁服务。 第七届USENIX操作系统设计与实现研讨会(OSDI 2006)会议记录,335-350。Chubby锁服务为松散耦合的分布式系统提供了粗粒度的锁定和可靠的低容量存储,对于在客户端之间同步活动特别有用。查比使用帕克索斯内部,但向客户端公开了一个锁服务API,旨在简化程序员的采用。这篇论文是第一篇讨论设计高可用性服务以供广泛用户使用的挑战的文章之一程序员在全球分布的环境中。虽然Chubby本身仅在谷歌内部广泛使用,但该论文启发了类似服务的开源实现,如Zookeeper,提供了类似的功能。

    • 朱塞佩·德坎迪亚(Giuseppe DeCandia)、丹尼斯·哈斯托伦(Deniz Hastorun)、马丹·贾帕尼(Madan Jampani)、古纳瓦德汉·卡库拉帕蒂(Gunavardhan Kakulapati)、阿维纳什·拉克什曼(Avinash Lakshman)、亚历克斯·皮尔钦(Alex Pilchin)、斯瓦米纳森。迪纳摩:亚马逊的高可用性键值商店。第21届ACM操作系统原理研讨会论文集(SOSP 2007),205-220。Dynamo是一个可扩展且高度可靠的分布式密钥值存储。本文描述了Dynamo如何在可用性、一致性、成本效益和性能之间进行权衡,并解释了该系统如何结合各种技术:一致散列、向量时钟、松散配额、Merkle树以及基于闲话的成员资格和故障检测协议。特别是,本文强调了支持最终一致性以在分布式系统中提供高可用性的价值。Dynamo在亚马逊内部发展成为流行云服务的基础,也启发了Cassandra等开源系统。

2016

    • Fay Chang、Jeffrey Dean、Sanjay Ghemawat、Wilson C.Hsieh、Deborah A.Wallach、Mike Burrows、Tushar Chandra、Andrew Fikes和Robert E.Gruber。Bigtable:结构化数据的分布式存储系统2006年11月,第七届USENIX操作系统设计与实现研讨会(OSDI’06)会议记录。

2015

    • R.A.Meyer和L.H.Seawright。虚拟机分时系统IBM Systems Journal 9(3),1970年9月,199-218。本文描述了第一个虚拟机系统的第二代。它最初是在1966年为带有定制虚拟内存硬件的IBM 360/40构建的,然后移植到内置虚拟内存的360/67上。除了名为CP的虚拟机监视器外,该系统还包括一个名为CMS的单用户交互系统,该系统深受麻省理工学院CTSS的影响;为了支持多个用户,系统为每个用户在单独的VM中运行CMS。由于360的干净架构,CP可以完美地虚拟化硬件(除了时序依赖性和自我修改的通道程序),而无需二进制翻译,尽管它必须翻译通道程序。它可以在虚拟机中运行大多数现有的IBM操作系统。CP/67演变为VM/370,成为IBM大型机的主要分时系统。

    • 大卫。L.帕纳斯。关于将系统分解为模块的标准ACM通信15(12),1972年12月,1053-1058。本文介绍了一种将复杂系统分解为模块的技术。通过一个简单的例子,它表明,在软件工程生命周期方面,强调所谓“信息隐藏”的模块化优于更明显的模块分解。本文认为可以用最小的性能开销实现有益的分解。“信息隐藏”方法影响了软件工程领域,包括操作系统、分布式系统、数据库和编程语言。

    • H.T.Kung和John T.Robinson。关于并发控制的乐观方法ACM数据库系统事务(TODS)6(2),1981年6月,213-226。本文引入了乐观并发控制的概念,在不锁定访问的数据项的情况下处理事务,期望事务的访问不会与其他事务的访问冲突。这个想法最初是在传统数据库的背景下引入的,当事务应用于通用系统时,它已经被证明是非常强大的。

    • 马歇尔·麦库西克、威廉·乔伊、塞缪尔·莱夫勒和罗伯特·法布里用于UNIX的快速文件系统ACM计算机系统交易(TOCS)2(3),1984年8月,181-197年。本文介绍了使文件系统“感知磁盘”的技术,从而证明了理解硬件技术和文件系统设计之间相互作用的重要性。柱面组的结构概念虽然简单,但在许多当前系统(包括广泛部署的Linux-ext*系列)中都以某种形式存在,它是存储中本地性重要性的一个很好的例子。本文还介绍了许多功能改进,包括符号链接和原子重命名,这些功能后来成为现代文件系统中的常见功能。

    • James J.Kistler和M.Satyanarayanan。Coda文件系统中的断开操作ACM计算机系统交易(TOCS)10(1),1992年2月,3-25。本文首次描述了在客户端使用存储在远程文件服务器上的文件的分布式环境中,除了提高性能外,还使用缓存来提供可用性,从而在断开连接时可能导致服务丢失。Coda的设计为断开连接时的持续服务提供了一种周到而优雅的方法。断开连接的客户端继续使用本地缓存的内容服务用户请求;然而,断开连接时执行的所有潜在修改都会在本地记录,当服务恢复时,系统会尝试将本地修改与当前服务器状态进行协调。Coda的设计启发了许多关于分布式文件系统的后续研究,其技术也被其他系统所采用。

    • 莫里斯·赫利希和J.艾略特·莫斯。事务内存:对无锁数据结构的体系结构支持《第20届计算机体系结构国际研讨会论文集》(ISCA’93),1993年5月,289-300。本文介绍了事务内存,这是一个架构概念,旨在使无锁同步与基于互斥的传统技术一样高效且易于使用。这一概念已进入商用多核处理器,并在软件事务内存中产生了大量后续工作。

    • Robert Wahbe、Steven Lucco、Thomas E.Anderson和Susan L.Graham。高效的基于软件的故障隔离第14届ACM操作系统原理研讨会(SOSP’93)会议记录。1993年12月,203-216。本文证明了编译器或代码重写技术可以隔离不受信任的代码模块,防止它们写入或跳转到其“容错域”之外的地址,而无需跨越硬件强制的地址空间边界的开销,也不会大大增加域内代码的执行时间。本文激发了大量后续研究,基本技术已在广泛部署的软件中实现,如Web浏览器。

    • D.B.Terry、M.M.Theimer、Karin Petersen、A.J.Demers、M.J.Spreitzer和C.H.Hauser。管理Bayou(弱连接复制存储系统)中的更新冲突《第15届ACM操作系统原理研讨会论文集》(SOSP’95),1995年12月,172-182。Bayou是一个复制存储系统,它预见了许多小型移动设备在不可靠的网络上执行协作应用程序的世界。本文描述了一种支持最终一致性的客户端-服务器存储结构、反熵协议、断开连接操作、基于日志的恢复,以及一种以应用程序为中心的方法,用于检测和解决更新冲突,以获得一致的副本。这些概念由一个原型实现、两个应用程序和一个简单的性能评估支持。Bayou仍然与当今大量现代应用程序所面临的问题和所采用的解决方案相关。

    • J.利特克。关于微内核构造在第15届美国计算机学会操作系统原理研讨会论文集(SOSP'95),1995年12月,237-250。本文介绍了L4微内核背后的核心设计思想,特别是最小原则,该原则规定,如果将功能移到内核外部会妨碍所需系统功能的实现,则只能在内核内部实现功能。这一原则是L4设计的核心,并支持无情的性能关注,这使得L4能够在数量级上超越其他微内核。本文的核心思想导致了L4微内核家族的大规模商业部署,并最终通过正式验证实现了前所未有的保证。

    • Ion Stoica、Robert Morris、David Karger、M.Frans Kaashoek和Hari Balakrishnan。Chord:用于Internet应用程序的可扩展对等查找服务《2001年计算机通信应用、技术、体系结构和协议会议论文集》(SIGCOMM’01),2001年,149-160。本文介绍了一种新的协议,可以在大规模动态环境中实现高效的密钥查找;本文介绍了如何利用一致哈希来实现可证明的正确性和性能属性,同时保持设计的简单性和优雅性。本文中的核心思想对随后的学术工作和行业都产生了巨大影响,许多流行的键值存储系统都采用了类似的技术。在优雅地处理节点添加和删除的同时进行扩展的能力仍然是当今许多系统所需要的基本属性。

    • 卡尔·A·沃尔兹清洗机。VMware ESX server中的内存资源管理《第五届操作系统设计与实现研讨会论文集》(OSDI’02),2002年12月,181-194。本文介绍了优雅而有效的虚拟机监控程序内存管理技术。内存膨胀允许虚拟机监控程序根据未修改的来宾操作系统策略从虚拟机回收内存。透明页面共享支持以较小的开销高效地使用内存。活动内存估计、空闲内存税和比例公平共享的结合,以及准入控制的内存预留,为服务级别协议和合理的过度承诺提供了基础。这篇论文影响很大;它的许多技术已经被广泛使用的虚拟机监控程序所采用。

    • George W.Dunlap、Samuel T.King、Sukru Cinar、Murtaza A.Basrai和Peter M.Chen。ReVirt:通过虚拟机日志记录和回放启用入侵分析《第五届操作系统设计与实现研讨会论文集》(OSDI’02),2002年,211-224。本文证明了虚拟机中任意程序的执行可以被确定性地、高效地重放。记录和回放最初主要用作入侵分析工具,后来被用于调试、容错、审计程序执行和其他虚拟机服务。这项工作直接影响了商业产品,并引发了一个持续至今的研究领域。

    • Sanjay Ghemawat、Howard Gobioff和Shun-Tak Leung。谷歌文件系统《第19届ACM操作系统原理研讨会论文集》(SOSP’03)。2003, 29-43.本文提出了一种大规模分布式文件系统的有效设计,该系统在廉价的商品硬件上运行时提供容错功能。它通过让所有数据传输直接发生在客户机进程和存储实际数据的机器之间,处理故障磁盘和机器的自动恢复,并保留了在单个集中主机中管理文件系统元数据的简单性,从而提供了非常大的I/O带宽。GFS是开源HDFS系统设计的基础,也是谷歌和其他地方大规模分布式文件系统发展的骨干。

    • 杰弗里·迪恩(Jeffrey Dean)和桑杰·盖马沃特(Sanjay Ghemawat)。MapReduce:简化大型集群上的数据处理2004年,在USENIX协会第六届操作系统设计与实现研讨会(OSDI’04)会议记录中。本文提出了一种简单而高效的方法,以可扩展和容错的方式处理大型数据集。该设计的一个令人印象深刻的方面是它的简单性:它优雅地捕获了一个通用模式,解决了当今许多开发人员面临的两个关键问题(可伸缩性和容错性),同时仍然保留了一个支持广泛应用程序的干净、易于使用的界面。MapReduce的影响是巨大的。它在工业中被广泛使用,几乎每个大公司都运行MapReduce。作为伟大系统设计的标志,开发人员在许多用例中采用了MapReduce,超出了其最初的目标,并激发了许多后续系统。

2013

    • Daniel G.Bobrow、Jerry D.Burchfel、Daniel L.Murphy和Raymond S.Tomlinson。Tenex,PDP-10的分页分时系统ACM通信15(3),1972年3月。Tenex系统开创了许多在现代操作系统中突出的思想。它包括第一个基于页面的内存系统之一、写时复制共享、将文件映射到虚拟内存以及用户/组/其他文件保护。它还具有命令行完成和自动文件版本控制的助记命令。正如一位评论家所说,“现在读这本书,我对它的熟悉程度感到欣慰,这要感谢它的后继者。”

    • 乔尔·巴特利特。不间断内核《第八届ACM操作系统原理研讨会论文集》(SOSP’81),加利福尼亚州太平洋格罗夫,1981年12月。Tandem是第一个实现容错的商业数据库。为了实现这一点,Tandem系统必须将许多技术(包括消息传递、镜像、快速故障检测和故障转移)集成到实际的设计和实现中。

    • K.Mani Chandy和Leslie Lamport。分布式快照:确定分布式系统的全局状态ACM计算机系统汇刊3(1),1985年2月。本文将一致性的思想用于分布式谓词求值,并对其进行形式化,区分稳定谓词和动态谓词,给出正确检测稳定条件的精确条件。本文的基本技术是许多分布式算法中的秘密酱汁,用于死锁检测、终止检测、一致检查点容错、用于调试和监视的全局谓词检测以及分布式仿真。

    • 肯尼思·伯曼(Kenneth P.Birman)和托马斯·约瑟夫(Thomas A.Joseph)。分布式系统中虚拟同步的开发1987年11月,德克萨斯州奥斯汀,第十一届ACM操作系统原理研讨会(SOSP’87)会议记录。本文描述了一种构建由多个组件组成的分布式应用程序的方法,每个组件都由一组复制服务器实现。它定义了许多组通信原语,然后通过引入虚拟同步原则将故障通知绑定到组服务结构中,虚拟同步原则在组成员之间和多个组之间统一排序通信和故障通知。

    • Eddie Kohler、Robert Morris、Benjie Chen、John Jannotti和Frans Kaashoek。Click模块化路由器ACM计算机系统交易(TOCS),18(3),2000年8月。Click定义了一个简单、模块化和高效的框架,用于构建具有不同服务和属性的网络路由器。自本文发表以来,Click已经成为网络和系统研究社区的一个重要工具,它拥有数十个甚至数百个系统和论文,其中包括一些商业上成功的系统。

2012

    • Brian M.Oki,Barbara H.Liskov。视图标记复制:一种支持高可用分布式系统的新主拷贝方法第七届ACM分布式计算原理年度研讨会论文集(PODC 1988),加拿大安大略省多伦多,1988年8月,第8-17页。本文介绍了一种与现在所称的Paxos非常相似的复制协议。该协议已成为一致、容错状态机复制的标准,并广泛用于数据中心,以在发生故障和重新配置时保持状态一致。

    • 莱斯利·兰波特。兼职议会ACM TOCS 16(2),1998年5月,133–169。这项工作(最初发表于1989年)是独立的,与今年获得认可的Viewstamp复制工作大致同时进行。它以更通用的设置描述了协议,添加了正确性参数,并构成了现代Paxos实现的基础。

    • 李凯,保罗·哈达克。共享虚拟内存系统中的内存一致性ACM TOCS 7(4),1989年11月,第321-359页。本文介绍了如何在集群上模拟一致共享内存,并介绍了基于目录的分布式缓存一致性。它产生了整个研究领域,并引入了在工业中广泛使用的缓存一致性机制。

    • 孟德尔·罗森布鲁姆(Mendel Rosenblum)、约翰·奥斯特霍特(John K.Ousterhout)。日志结构文件系统的设计与实现ACM TOCS 10(1),1992年2月,第26-52页。本文介绍了日志结构文件存储,其中数据按顺序写入日志并不断进行碎片整理。这些基本思想影响了许多现代文件和存储系统,如NetApp的WAFL文件系统、Facebook的图片存储、谷歌BigTable的各个方面,以及SSD中的Flash翻译层。

2011

    • 肯·汤普森(Ken Thompson)。关于信任的思考ACM通讯,第27卷第8期,1984年8月。这篇论文证明,要信任一个程序,不能仅仅依赖于对编写程序的人的信任,甚至依赖于对源代码的验证。还必须确保用于生成和执行二进制文件的整个工具链是可信的。

    • 杰克·丹尼斯(Jack B.Dennis),厄尔·范霍恩(Earl C.Van Horn)。多程序计算的编程语义ACM通讯,第9卷第3期,1966年3月。本文阐述了计算机系统多道程序设计和保护的概念基础。

    • David A.Patterson、Garth Gibson和Randy H.Katz。廉价磁盘冗余阵列(RAID)案例1988年ACM SIGMOD国际数据管理会议记录。本文介绍了如何使用廉价、不可靠的组件实现高效、容错和高可用的存储。

2010

    • 吉姆·格雷(Jim Gray)、保罗·麦克琼斯(Paul McJones)、迈克·布拉斯根(Mike Blasgen)、布鲁斯·林赛(Bruce Lindsay)、雷蒙德·洛里(Raymond Lorie)、汤姆·普莱斯(Tom Price)、弗兰科·普佐鲁(Franco。System R数据库管理器的恢复管理器。ACM计算调查,1981年6月。

2009

    • Cary G.Gray和David R.Cheriton,租约:一种高效的分布式文件缓存一致性容错机制《第十二届ACM操作系统原理(SOSP)研讨会论文集》,1989年12月,美国亚利桑那州利奇菲尔德公园。Gray和Cheriton的论文通过对Leases机制的分析开创了先河,Leases机制已成为管理分布式缓存最广泛使用的机制之一。这篇论文尤其引人注目,因为它仔细分析了租约的语义,进行了详细的实验,并对容错问题进行了深入的讨论。

    • 巴特勒·W·兰普森和大卫·D·雷德尔,Mesa的流程和监控器经验《第七届ACM操作系统原理研讨会(SOSP)论文集》,1979年12月,美国加利福尼亚州太平洋格罗夫。在撰写本文时,监视器已成为首选的同步方法。在编程语言会议和操作系统教科书中。本文是第一篇密切关注监控器在大型生产系统中使用时所带来的实际问题的文章。这些问题仍然是当代的,事实上,研究事务性内存机制的研究人员可以很好地重读这篇精彩的论文。

    • 南希·P·科伦伯格、亨利·M·利维和威廉·D·斯特雷克,VAXclusters:一个紧密耦合的分布式系统《第十届AMC操作系统原理研讨会论文集》,1985年12月,美国奥卡斯岛。VAX集群系统是第一个支持分布式文件系统和分布式锁定服务等基本功能的现代集群系统。关于VAX集群的SOSP文件至今仍是经典之作。VAXclusters在商业上取得了巨大成功,为今天的大规模数据中心奠定了基础。

2008

    • John H.Howard、Michael L.Kazar、Sherri G.Menees、David A.Nichols、M.Satyanarayanan、Robert N.Sidebotham和Michael J.West,分布式文件系统中的扩展和性能《第十一届ACM操作系统原理研讨会论文集》,1987年11月,美国德克萨斯州奥斯汀。

    • 安德鲁·伯雷尔(Andrew D.Birrell)、罗伊·莱文(Roy Levin)、罗杰·李约瑟(Roger M.Needham)和迈克尔·施罗德(Michael D.Schroeder),葡萄藤:分布式计算练习《第八届ACM操作系统原理研讨会论文集》,1981年12月,美国加利福尼亚州太平洋格罗夫。

    • 安德烈·本苏桑(Andre Bensoussan)、查理·克林顿(Charlie T.Clingen)、罗伯特·戴利(Robert C.Daley)、,多线程虚拟存储器:概念与设计,ACM通讯15(5):308-3181972年5月。

2007

    • 莱斯利·兰波特,分布式系统中的时间、时钟和事件顺序ACM通讯21(7):558-5651978年7月。也许是第一篇真正的“分布式系统”论文,它引入了“因果排序”的概念,这在许多情况下都很有用。该论文提出了一种称为“逻辑时钟”的机制,但现在每个人都将其称为“Lamport时钟”

    • Andrew D.Birrell和Bruce Jay Nelson,实现远程过程调用《美国计算机学会计算机系统学报》2(1):39-592984年2月。这是这个RPC已经成为分布式系统和互联网中远程通信的标准。本文出色地规划了RPC的基本模型和实现选项。

    • J.H.Saltzer、D.P.Reed和D.D.Clark,系统设计中的端到端参数,ACM计算机系统交易2(4):277-2881984年11月。本文为系统设计者,特别是互联网设计者提供了一个优雅的框架,用于做出合理的决策。这篇论文引发了一场革命,最终也引发了一种宗教。

    • 迈克尔·伯罗斯、马丁·阿巴迪和罗杰·尼达姆,认证逻辑,ACM计算机系统交易8(1):18-361990年2月。本文向系统社区介绍了一种基于逻辑的认证协议表示法,以精确描述证书、委托等。通过这种精确的描述,设计者可以很容易地判断协议是否正确,并避免困扰协议的安全缺陷。“Speaks-for”和“says”现在是系统设计者的标准工具。

    • 弗雷德·施耐德,使用状态机方法实现容错服务:教程,ACM计算调查22(4):299-3191990年12月。这篇文章解释了我们应该如何看待复制……这是一个模型,它是Paxos、Virtual Synchrony、Byzantine复制,甚至是Transactional 1-Copy Serializability的基础。

2006

    • George C.Necula和Peter Lee,无运行时检查的安全内核扩展,会议记录第二届USENIX操作系统设计与实现研讨会1996年10月,华盛顿州西雅图。本文介绍了证明携带代码(PCC)的概念,并说明了如何使用它来确保内核扩展的安全执行,而不会产生运行时开销。PCC是一种在系统中重新定位信任的通用方法;组件中的信任是通过信任验证检查器(并使用它检查组件按预期运行的证明)而不是信任组件本身来获得的。PCC已成为基于语言的安全性的基石之一。

2005

    • Edsger W.Dijkstra,多道程序设计系统的结构,会议记录第一届ACM操作系统原理研讨会1967年10月,美国田纳西州加特林堡。第一篇建议以结构化方式构建操作系统的论文。该结构是一系列层,每个层都是一个虚拟机,引入了使用较低层的功能构建的抽象。本文刺激了大量后续工作,将操作系统构建为结构化系统。

    • 巴特勒·兰普森,计算机系统设计提示,会议记录第九届ACM操作系统原理研讨会第33-48页,1983年10月,美国新罕布什尔州布雷顿森林。这是对构建大型系统经验的经典研究,为操作系统研究人员提炼成智慧食谱。随着时间的推移,这些提示的价值只会增加,它们所应用的系统范围也会扩大。