跳到主要内容
10.5555/1251254.1251257指导程序文章/章节视图摘要出版物页面会议记录acm-pubtype公司
第条

Microreboot—一种廉价恢复技术

出版:2004年12月6日出版历史

摘要

大规模互联网系统中有很大一部分软件故障是通过重新启动来解决的,即使具体的故障原因未知。然而,重新启动可能代价高昂,即使在使用集群和故障转移时,也会导致非平凡的服务中断或停机。在这项工作中,我们使用进程恢复与数据恢复的分离来启用微重启,这是一种细粒度的技术,用于在不影响应用程序其余部分的情况下,通过外科手术恢复有故障的应用程序组件。

我们在应用服务器上运行的互联网拍卖系统中评估微重启。微重新引导可以恢复与完全重新引导相同的大多数故障,但恢复速度要快一个数量级,并且可以在损失的工作中节省大量的工作量。这种廉价的恢复形式产生了一种新的高可用性方法:在多节点集群中的节点故障转移之前,可以在最轻微的故障提示下使用微重新引导,即使在故障检测中可能出现错误的情况下;通过透明的调用级重试,可以对最终用户屏蔽故障和恢复;系统可以通过部件恢复活力,而无需关闭。

工具书类

  1. {1} A.Adya、W.Bolosky、M.Castro、G.Cermak、R.Chaiken、J.Douceur、J.Howell、J.Lorch、M.Theimer和R.Wattenhofer。FARSITE:为不完全信任的环境联合、可用和可靠的存储。程序。第五届操作系统设计与实现研讨会马萨诸塞州波士顿,2002年。]]谷歌学者谷歌学者数字图书馆数字图书馆
  2. {2} M.Baker和M.Sullivan。恢复盒:使用快速恢复在UNIX环境中提供高可用性。程序。夏季USENIX技术会议德克萨斯州圣安东尼奥,1992年。]]谷歌学者谷歌学者
  3. {3} M.巴恩斯。J2EE应用服务器:市场概述。Meta Group,2004年3月。]]谷歌学者谷歌学者
  4. {4} N.Bhatti、A.Bouch和A.Kuchinsky。将用户感知的质量集成到web服务器设计中。程序。第九届WWW国际会议,荷兰阿姆斯特丹,2000年。]]谷歌学者谷歌学者数字图书馆数字图书馆
  5. {5} E.布鲁尔。大型服务的经验教训。IEEE互联网计算,5(4):46-552001年7月。]]谷歌学者谷歌学者数字图书馆数字图书馆
  6. {6} P.A.Broadwell、N.Sastry和J.Traupman。图:恢复机制在线验证的原型工具。自我修复、自适应和自我管理系统研讨会,纽约州纽约市,2002年。]]谷歌学者谷歌学者
  7. {7} K.Buchacker和V.Sieh。系统容错测试框架,包括操作系统和网络方面。程序。IEEE高安全系统工程研讨会佛罗里达州博卡拉顿,2001年。]]谷歌学者谷歌学者数字图书馆数字图书馆
  8. {8} G.坎迪亚和A.福克斯。递归重启:将重启大锤变成手术刀。程序。第八届操作系统热点研讨会德国埃尔茅,2001年。]]谷歌学者谷歌学者数字图书馆数字图书馆
  9. {9} G.坎迪亚和A.福克斯。仅限碰撞的软件。程序。第九届操作系统热点研讨会,夏威夷利休,2003年。]]谷歌学者谷歌学者数字图书馆数字图书馆
  10. {10} E.Cecchet、J.Marguerite和W.Zwaenepoel。EJB应用程序的性能和可扩展性。程序。第17届面向对象编程、系统、语言和应用会议华盛顿州西雅图,2002年。]]谷歌学者谷歌学者数字图书馆数字图书馆
  11. {11} M.Chen、A.Zheng、J.Lloyd、M.Jordan和E.Brewer。使用决策树进行故障诊断。程序。国际自主计算会议,纽约州纽约市,2004年。]]谷歌学者谷歌学者数字图书馆数字图书馆
  12. {12} T·C·周。超越容错。IEEE计算机, 30(4):31-36, 1997.]]谷歌学者谷歌学者数字图书馆数字图书馆
  13. {13} T·C·周。个人沟通。甲骨文公司,2003年。]]谷歌学者谷歌学者
  14. {14} H.Cohen和K.Jacobs。个人通信。Oracle,2002年。]]谷歌学者谷歌学者
  15. {15} S.Duvur。个人通讯。Sun Microsystems,2004年。]]谷歌学者谷歌学者
  16. {16} 2004年5月,根据禁止披露公司名称的协议获得的信息。]]谷歌学者谷歌学者
  17. {17} T.Garfinkel、B.Pfaff、J.Chow、M.Rosenblum和D.Boneh。Terra:基于虚拟机的可信计算平台。程序。第19届ACM操作系统原理研讨会,博尔顿兰德,纽约,2003年。]]谷歌学者谷歌学者数字图书馆数字图书馆
  18. {18} J.Gettys、J.Mogul、H.Frystyk、L.Masinter、P.Leach和T.Berners-Lee。超文本传输协议-HTTP/1.1。互联网RFC 26161999年6月。]]谷歌学者谷歌学者
  19. {19} J.格雷。为什么电脑会停止工作,可以采取什么措施?程序。第五交响曲。分布式软件和数据库系统的可靠性加利福尼亚州洛杉矶,1986年。]]谷歌学者谷歌学者
  20. {20} Y.Huang、C.M.R.Kintala、N.Kolettis和N.D.Fulton。软件复兴:分析、模块和应用程序。程序。第25届容错计算国际研讨会加利福尼亚州帕萨迪纳,1995年。]]谷歌学者谷歌学者数字图书馆数字图书馆
  21. {21}JBoss网页。http://www.jboss.org/。]]谷歌学者谷歌学者
  22. {22}基调系统。http://www.keynote.com/。]]谷歌学者谷歌学者
  23. {23}勒费夫雷西部。CNN.com面临世界危机。在以下位置交谈第15届USENIX系统管理会议, 2001.]]谷歌学者谷歌学者
  24. {24}H.莱文。个人沟通。EBates.com,2003年。]]谷歌学者谷歌学者
  25. {25}J.利特克。朝向真正的微内核。ACM通信, 39(9):70-77, 1996.]]谷歌学者谷歌学者数字图书馆数字图书馆
  26. {26}B.Ling、E.Kiciman和A.Fox。会话状态:超越软状态。程序。第一届网络系统设计与实现研讨会,加利福尼亚州旧金山,2004年。]]谷歌学者谷歌学者数字图书馆数字图书馆
  27. {27}D.E.Lowell、S.Chandra和P.M.Chen。探索故障透明度和通用恢复的限制。程序。第四届操作系统设计与实现研讨会加利福尼亚州圣地亚哥,2000年。]]谷歌学者谷歌学者数字图书馆数字图书馆
  28. {28}G.梅瑟。个人沟通。美国银行,2004年。]]谷歌学者谷歌学者
  29. {29}A.梅辛格。个人通信BEA系统,2004年。]]谷歌学者谷歌学者
  30. {30}微软。微软。NET框架微软出版社,华盛顿州雷蒙德,2001年。]]谷歌学者谷歌学者
  31. {31}R.米勒。人机对话事务中的响应时间。程序。AFIPS秋季联合计算机会议1968年第33卷。]]谷歌学者谷歌学者数字图书馆数字图书馆
  32. {32}N.米切尔。IBM研究。个人通信,2004年。]]谷歌学者谷歌学者
  33. {33}N.Mitchell和G.Sevitsky。LeakBot:用于诊断大型Java应用程序中的内存泄漏的自动化轻量级工具。程序。第17届欧洲面向对象编程会议,德国达姆施塔特,2003年。]]谷歌学者谷歌学者交叉引用交叉引用
  34. {34}B.墨菲和T.根特。使用自动数据收集过程测量系统和软件的可靠性。国际质量与可靠性工程。, 11:341-353, 1995.]]谷歌学者谷歌学者交叉引用交叉引用
  35. {35}A.Pal.个人交流。雅虎!,公司,2002年。]]谷歌学者谷歌学者
  36. {36}D.雷默。IBM研究。个人通讯,2004年。]]谷歌学者谷歌学者
  37. {37}RUBiS项目网页。http://rubis.objectweb.org/。]]谷歌学者谷歌学者
  38. {38}W.D.Smith。TPC-W:电子商务解决方案的基准测试。交易处理委员会,2002年。]]谷歌学者谷歌学者
  39. {39}M.Sullivan和R.Chillarege。软件缺陷及其对系统可用性的影响——对操作系统现场故障的研究。程序。第21届容错计算国际研讨会,加拿大蒙特利尔,1991年。]]谷歌学者谷歌学者交叉引用交叉引用
  40. {40}太阳微系统公司。http://java.sun.com/j2ee/。]]谷歌学者谷歌学者
  41. {41}M.M.Swift、B.N.Bershad和H.M.Levy。提高商品操作系统的可靠性。程序。第19届ACM操作系统原理研讨会,博尔顿兰德,纽约,2003年。]]谷歌学者谷歌学者数字图书馆数字图书馆
  42. {42}K.Whisnant、Z.Kalbarczyk和R.Iyer。微检查点:多线程应用程序的检查点。程序。IEEE国际在线测试研讨会, 2000.]]谷歌学者谷歌学者数字图书馆数字图书馆
  43. {43}A.P.伍德。从客户角度看软件可靠性。IEEE计算机,36(8):37-422003年8月。]]谷歌学者谷歌学者数字图书馆数字图书馆
  44. {44}区域研究公报:速度II的需求,2001年4月。]]谷歌学者谷歌学者

索引术语

  1. Microreboot—一种廉价恢复技术

          建议

          评论

          登录选项

          检查您是否可以通过登录凭据或您的机构访问本文。

          登录

          完全访问权限

          • 发布于

            封面图片指南会议记录
            OSDI’04:第6届操作系统设计与实现研讨会会议记录-第6卷
            2004年12月
            403页

            出版商

            USENIX协会

            美国

            出版历史

            • 出版:2004年12月6日

            限定符

            • 第条