×

灾难恢复即服务解决方案的可用性建模和分析。 (英语) Zbl 1381.93073号

摘要:在现代企业环境中,拥有灾难恢复解决方案不再是一种奢侈,而是一种业务需要。然而,采用灾难恢复解决方案可能成本高昂,而且往往只有大型企业才能负担得起。灾难恢复即服务(Disaster-Recovery-as-a-Service,DRaaS)是一种基于云的解决方案,中小型企业一直在采用它来确保即使在灾难情况下也能提供可用性。与传统解决方案相比,它的购置和运营成本更低。这项工作提供了评估DRaaS解决方案的可用性模型,其中考虑了关键的灾难恢复指标,如停机时间、成本、恢复时间目标和事务损失。此外,我们对DRaaS模型进行了敏感性分析,以确定对系统可用性影响最大的参数。根据这些分析,灾难恢复协调员可以通过平衡系统停机成本与恢复系统所需的资源成本,确定恢复受损系统的最佳点。我们的数值结果显示了DRaaS解决方案在停机时间、成本和过渡损失方面的有效性。

MSC公司:

93元65角 离散事件控制/观测系统
93E03型 控制理论中的随机系统(一般)
93A30型 系统数学建模(MSC2010)
90B25型 运筹学中的可靠性、可用性、维护和检查

软件:

开放MADS
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abdallah H,Hamza M(2002)关于预期累计报酬的敏感性分析。执行评估47(2):163-179·Zbl 1013.68043号 ·doi:10.1016/S0166-5316(01)00063-3
[2] Alves TL、Ypma C、Visser J(2010)《从基准数据推导度量阈值》。在:IEEE软件维护国际会议(ICSM)。IEEE,第1-10页
[3] Andrade E,Maciel P,Callou G,Nogueira B(2008)将uml交互概览图映射到时间petri网,用于分析和验证具有能量约束的嵌入式实时系统。参加:建模控制与自动化计算智能国际会议。IEEE,第615-620页
[4] Andrade EC、Alves M、Matos R、Silva B、Maciel P(2013)Openmads:分布式系统建模和分析的开源工具。In:计算机安全性、可靠性和安全性。施普林格,第277-284页
[5] Andrade EC、Machida F、Kim DS、Trivedi KS(2011)通过sysml和随机奖励网对具有复兴功能的服务器系统进行建模和分析。第六届可用性、可靠性和安全性国际会议(ARES)。IEEE,第161-168页·Zbl 1013.68043号
[6] Araújo C、Sousa E、Maciel P、Chicout F、Andrade E(2009),用于评估和规划具有突发到达流量的电子资金转账系统的性能建模。参加:第一届密集型应用和服务国际会议。IEEE,第65-70页·Zbl 1013.68043号
[7] Avizienis A、Laprie J、Randell B、Landwehr C(2004)可靠和安全计算的基本概念和分类。IEEE Trans可靠安全计算1(1):11-33·doi:10.1109/TDSC.2004.2
[8] Bell K(2015)Google Drive在短暂停机后重新上线。大理石色。http://mashable.com/2015/10/09/google-docs-sheets-down/
[9] Blake JT,Reibman AL,Trivedi KS(1988)多处理器系统可靠性和性能度量的敏感性分析。摘自:ACM SIGMETRICS计算机系统测量和建模会议记录,第177-186页
[10] Campos E、Matos R、Maciel P、Pereira A、Souza F(2015)私有云中自动缩放机制的随机建模,用于支持性能调整。参加:IEEE系统、人与控制论(SMC)国际会议。IEEE,第109-114页
[11] Chisholm P(2008)准备从IT灾难中恢复吗?认证杂志。http://certmag.com/is-your-company-prepared-to-recover-from-an-it-disaster/
[12] Dantas J、Matos R、Araujo J、Maciel P(2012)《桉树平台的可用性模型:热备用复制机制分析》。收录:IEEE系统、人与控制论(SMC)国际会议。IEEE,第1664-1669页
[13] Dantas J、Matos R、Araujo J、Maciel P(2015)《基于桉树的私有云:可用性建模和与公共云成本的比较》。计算97(11):1121-1140·Zbl 1339.60130号 ·doi:10.1007/s00607-015-0447-8
[14] Fiveash K(2015)AWS宕机在MEGA数据崩溃中打击了亚马逊、Netflix、Tinder和IMDb。登记册。http://www.theregister.co.uk/2015/09/20/aws数据库中断/
[15] Frank PM(1978)系统灵敏度理论导论。纽约学术出版社·Zbl 0464.93001号
[16] Hamby DM(1994)《环境模型参数敏感性分析技术综述》。环境监测评估32:135-154·doi:10.1007/BF00547132
[17] Hoffman F,Gardner R(1983)环境辐射评估模型中的不确定性评估。收录:Till J,Meyer H(编辑)《放射评估:环境剂量评估教科书》。美国核管理委员会,华盛顿特区。报告编号NUREG/CR-3332·Zbl 1339.60130号
[18] Hu T,Guo M,Gu S,Ozaki H,Zheng L,Ota K,Dong M(2010)复合web服务的Mttf。参加:并行和分布式处理应用国际研讨会(ISPA)。IEEE,第130-137页
[19] Johnson R(2015)关于今天停机的更多详细信息。https://www.facebook.com/notes/facebook-engineering/more-details-on-todays-outage/431441338919/ ·Zbl 1013.68043号
[20] Kaplan RS,Norton DP(1996)将平衡计分卡用作战略管理系统。哈佛商业评论,波士顿
[21] Keeton K、Santos C、Beyer D、Chase J、Wilkes J(2004)《灾难设计》。收录:第三届USENIX文件和存储技术会议记录。USENIX协会,第59-62页
[22] Kim DS、Machida F、Trivedi KS(2009)虚拟化系统的可用性建模和分析。2009年,第15届IEEE环太平洋可靠计算国际研讨会。IEEE,第365-371页
[23] Machida F、Andrade E、Kim D、Trivedi K(2011)Candy:使用sysml进行云服务管理的基于组件的可用性建模框架。摘自:第30届IEEE可靠分布式系统(SRDS)研讨会。IEEE,第209-218页
[24] Maciel P、Trivedi KS、Matias R、Kim DS(2011)可靠性建模。主题:服务计算中的性能和可靠性:概念、技术和研究方向。IGI Global,好时
[25] Mao M,Li J,Humphrey M(2010)《期限和预算约束下的云自动缩放》。2010年第11届IEEE/ACM网格计算国际会议。IEEE,第41-48页
[26] Marsan MA,Conte G,Balbo G(1984)一类用于多处理器系统性能评估的广义随机petri网。ACM事务计算系统2:93-122。doi:10.145/190.191·doi:10.145/190.191
[27] Mishra N(2011)灾难恢复作为一种服务的优势。数据中心知识。http://www.datacenterknowledge.com/archives/2011/10/25/advantages-of-disaster-recovery-as-a-service/
[28] Molloy MK(1982)使用随机petri网进行性能分析。IEEE Trans计算31(9):913-917。doi:10.1109/TC.1982.1676110·doi:10.1109/TC.1982.1676110
[29] Muppala JK,Trivedi KS(1990)GSPN模型:敏感性分析和应用。收件人:ACM-SE 28:第28届东南地区年度会议记录。美国纽约州纽约市ACM,第25-33页。doi:10.1145/98949.98962
[30] Murata T(1989)Petri网:特性、分析和应用。程序IEEE 77(4):541-580·数字对象标识代码:10.1109/5.24143
[31] 机架空间:灾难恢复规划。http://www.rackspace.com/disaster-recovery-planning。2013
[32] Reese G(2009)《云应用程序架构》。O'Reilly Media Inc,Newton公司
[33] Silva B、Maciel P、Tavares E、Zimmermann A(2013)设计容灾云计算系统的可靠性模型。2013年第43届IEEE/IFIP可靠系统和网络(DSN)国际年会。IEEE,第1-6页
[34] Silva B、Matos R、Callou G、Figueiredo J、Oliveira D、Ferreira J、Dantas J、Junior A、Alves V、Maciel P(2015)Mercury:通用系统性能和可靠性评估的集成环境。附:第45届可靠系统和网络会议(DSN)工业轨道会议记录
[35] Trivedi KS、Andrade EC、Machida F(2012),结合实际的性能和可用性分析。高级计算84:1-38·doi:10.1016/B978-0-12-396525-7.00001-0
[36] Wood T、Cecchet E、Ramakrishnan K、Shenoy P、Van der Merwe J、Venkataramani A(2010)作为云服务的灾难恢复:经济效益和部署挑战。收录:第二届USENIX云计算热门话题会议记录。USENIX协会,第8-8页
[37] Yin B,Dai G,Li Y,Xi H(2007)m/G/1排队系统的敏感性分析和性能估计。执行评估64(4):347-356·doi:10.1016/j.peva.2006.06.004
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。