{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部件”:[[2023,9,3]],“日期-时间”:“2023-09-03T05:41:28Z”,“时间戳”:1693719688221},“引用-计数”:30,“发布者”:“威利”,“问题”:“4”,“许可证”:[{“开始”:{“日期-零件”:[[2013,5,10]],T00:00:00Z“,”时间戳“:1368144000000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“http://\/onlinelibrary.wiley.com/termsAndConditions#vor”}],“content-domain”:{“domain”:[],“crossmark-restriction”:false},“short-container-title”:[“Concurrency and Computation”],“published-print”:{“date-parts”:[[2016,3,25]]},”abstract“:”摘要<\/jats:title>云计算的出现为更广泛的应用程序和用户提供了使用2010年大规模计算基础设施的机会。由于云范例在资源使用和相关成本方面的\u2018\u2019弹性越来越有吸引力(用户只为实际使用的资源付费),云应用程序仍然受到云存储服务的高延迟和低性能的影响。随着云上的大数据分析在许多应用领域变得越来越重要,实现2010年高吞吐量的云数据海量数据处理成为一个关键问题,因为它会影响整个应用程序的性能。在本文中,我们将在云存储级别解决这一挑战。我们引入了一个并发性\u2010优化的数据存储系统(称为TomusBlobs),该系统联合与云上运行应用程序代码的虚拟机关联的虚拟磁盘。通过在TomusBlobs的基础上为Microsoft的Azure云平台构建一个优化的原型MapReduce框架,我们展示了我们的解决方案在高效数据密集型处理方面的性能优势。最后,我们通过提议MapIteriveReduce作为MapReduce模型的扩展,专门解决了用于减少大量工作负载的state\u2010of\u2010\u2010art MapReducer框架的局限性。我们通过使用跨多个数据中心分布的资源,在Azure商业云上使用合成基准测试和实际应用程序进行大规模实验,验证了上述贡献;它们证明了我们的解决方案与依赖于u2010ofu2010art云对象存储的方法相比,为数据密集型应用程序带来了巨大的好处。版权所有\u00a9 2013 John Wiley&Sons,Ltd.<\/jats:p>“,”DOI“:”10.1002\/cpe.3034“,”type“:”期刊文章“,”已创建“:{”日期部分“:[[2013,5,10]],”日期时间“:”2013-05-10T22:34:38Z“,”时间戳“:1368225278000},”页面“:”950-976“,”来源“:”Crossref“,”按计数引用“:8,”标题“:[”TomusBlobs:Azure云上的可扩展数据\u2010密集型处理“],”前缀“:”10.1002“,”卷“:”28“,”作者“:[{”给定“:”亚历山德鲁“,”家族“:”科斯坦“,”序列“:”第一“,”从属“:[}”名称“:”Inria Rennes\u2010 Bretagne Atlastive Campus de Beaulieu 35042 Rennes France“}]},{”已知“:”Radu“,”家庭“:”Tudoran“,“序列”:”附加“,”affiliation“:[{”name“:”Inria Rennes\u2010 Bretagne Atlastive Campus de Beaulieu 35042 Rennes France“}]},{”given“:”Gabriel“,”family“:”Antoniu“,”sequence“:”additional“,”affiliance“:[[{“name”:”Inia Rennes\u 2010 Bretagene Atlastyty Campus der Beaulieu35042 Rennes France“{]}”givine“,{given”:“Goetz”,“family”:“Brasche”,“sequence”:“additional”,“”affiliation“:[{”name“:”Microsoft Advanced Technology Labs Europe,EMIC Ritterstrasse 23 52072 Aachen Germany“}]}],”member“:”311“,”published-on-line“:{”date-parts“:[[2013,5,10]]},”reference“:[}”key“:”e_1_2_11_2_1“,”volume-title“:”The Fourth Paradigm:Data\u2010密集科学发现“,”author“:”Hey T“,”year“:”2009“}非结构化”:“1000个基因组项目。(可从以下网址获得:http://\/aws.amazon.com/fr\/1000genomes\/)。“},{”key“:”e_1_2_11_4_1“,”unstructured“:”Azure。(可从http://www.windowsazure.com/en\u2010us\/获得)。“}CarnsP LigonWB RossRB ThakurR.PVFS:用于linux集群的并行文件系统。2000年美国亚特兰大第四届Linux年会论文集;317\u2013327.“},{”key“:”e_1_2_11_7_1“,”unstructured“:”Gunarathet WuT\u2010L QiuJ FoxG.科学云中的Mapreduce。InCloudcom10 2010;565\u2013572.“}”,{“key”:“e_1_i_11_11_8_1”,“doi-asserted-by”:“crossref”,”unstrated“:“”TudoranR CostanA AntoniuG SoncuH(塔多兰·科斯坦)。TomusBlobs:面向Azure中MapReduce应用程序的通信\u2010高效存储。2012年第12届IEEE \/ACM集群云和网格计算国际研讨会(CCGrid’2012)加拿大渥太华;427\u2013434.“,”DOI“:”10.1109\/CCGrid.2012.104“},{”key“:”e_1_2_11_9_1“,”DOI-asserted-by“:”crossref“,“unstructured”:“TudoranR CostanA AntoniuG.MapIteriveReduce:Azure云上简化2010密集型数据处理的框架。第三届MapReduce及其应用国际研讨会(MapReduce'12)与ACM HPDC’12联合举办。荷兰代尔夫特2012;9\u201316.“,”DOI“:”10.1145\/2287016.2287019“},{“key”:“e_1_2_11_10_1”,“DOI-asserted-by”:“crossref”,”unstructured“:”LuoY PlaleB.Hierarchical MapReduce Programming Model and Scheduling Algorithms 2012.“,”DOI“:“10.1109\/CCGrid.2012.132”},“key“:”e_1_i_11_11_11_1“,”DOI-assert-by“:”publisher“,“DOI”:“10.1007\/s00354-009-0089-5“},{”键“:”e_1_2_11_12_1“,”非结构化”:“A\u2010大脑。(可从以下网址获得:http://www.msr\u2010inria.inria.fr\/Projects\/a\u2010brain)。“},{”key“:”e_1_2_11_13_1“,”doi-asserted-by“:”crossref“,“unstructured”:“PolineJ LalanneC TenenhausA DuchesnayE ThirionB FrouinV.成像遗传学:生物2010信息学和生物2010统计挑战。InCOMPSTAT Vol.\u20091 Paris 2010;101\u2013113.”,“doi”:“10.1007\/978-3-7908-2604-3_9”},”{“key”:“e_1_i_11_11_14_1”,“doi-assert-by”:“crossref.”“,”非结构化“:”DorierM AntoniuG CappelloF SnirM OrfL.Damaris:如何有效利用多核并行性实现可伸缩的无抖动I/O InCluster 2012;155\u2013163.“,”DOI“:”10.1109\/CLUSTER.2012.26“},{”key“:”e_1_2_11_15_1“,”DOI-asserted-by“:”crossref“,“unstructured”:“TudoranR CostanA AntoniuG Boug\u00e9L都铎风格。科学应用程序Azure和nimbus云的性能评估。InCloudCP 2012\u2013第二届云计算平台国际研讨会与ACM SIGOPS Eurosys 2012年瑞士伯尔尼会议联合举办;41\u201346.“,”DOI“:”10.1145\/2168697.2168701“},{“key”:“e_1_2_11_16_1”,“unstructured”:“Azure定价。(可从https:\/\/www.windowsazure.com\/en\u2010us\/priging\/details\/获取)。”},“key“:”e_1_i_11_11_17_1“,”DOI-asserted-by“:”crossref“,“unsructured“:”OstermannS IosupA YigitbasiN ProdanR FahringerT EpemaDHJ公司。用于科学计算的EC2云计算服务的性能分析。InCloudComp’2009德国慕尼黑2009;115\u2013131.“,”DOI“:”10.1007\/978-3-642-12636-9_9“},{”key“:”e_1_2_11_18_1“,”unstructured“:”VecchiolaC PandeyS BuyyaR.高性能云计算:科学应用普适系统算法和网络视图。ISPAN9台湾高雄2009;4\u201316.“}”,{“key”:“e_1_ 11_19_1”,“unstructure”:“”Azure驱动器。(可从以下网址获得:http://\/msdn.microsoft.com/en\u2010us\/library\/windowsazure\/ee924681.aspx)。“},{”key“:”e_1_2_11_20_1“,”unstructured“:”SchwanP.Lustre:为1000\u2010节点群集构建文件系统。《2003加拿大渥太华安大略省Linux研讨会论文集》2003;380\u2013386.“}”,{“key”:“e_1_i_11_11_21_1”,“unstructure”:“Eucalyptus.(可从:http://www.Eucalyptus.com/获得)。“}KeaheyK Freeman T BresnahanJ LaBissoniereD公司。积云:科学开源存储云。InSc2010美国洛杉矶新奥尔良海报2010;25\u201332.“},{”key“:”e_1_2_11_23_1“,”unstructured“:”Amazon web service.(可从:http://\/aws.Amazon.com/获得)。“}MoiseD Carpen\u2010AmarieA AntoniuG Boug\u00e9L。MapReduce应用程序在云中的成本\u2010评估。2011年法国兰斯Grid5000学校会议记录;37\u201348.“,”DOI“:”10.1007\/978-3642-32344-7_4“},{”key“:”e_1_2_11_25_1“,”DOI-asserted-by“:”publisher“,“DOI”:“10.1016\/j.jpdc.2010.08.004”},“key”:“e_1_i_11_11_26_1”,“首页”:“10”,“volume-title”:“Hotcloud'10”,”author“:”Zaharia M“,“年份”:“2010”}1_2_11_27_1“,”DOI-asserted-by“:”crossref“,“非结构化”:“DaveA LuW JacksonJ BargaR。云集群:朝向云上的迭代数据处理模式。IPDPSW 2011美国阿拉斯加安克雷奇2011年5月;1132\u20131137.“,”DOI“:”10.1109\/IPDPS.2011.258“},{”key“:”e_1_2_11_28_1“,”DOI-asserted-by“:”publisher“,“DOI”:“10.14778\/1920841.1920881”},“key”:“e_1_i_11_11_29_1”,“DOI-assert-by”:“crossref”,”unstructured“:”EkanayakeJ LiH ZhangB GunaratheT BaeS\u2010H QiuJ FoxG.Twister:迭代运行时mapreduce.InHPDC’10美国伊利诺伊州芝加哥,2010年;810\u2013818.“,”DOI“:”10.1145\/1851476.1851593“},{”key“:”e_1_2_11_30_1“,”DOI-asserted-by“:”publisher“,“DOI”:”10.1016\/j.future.2012.05.027“}”,{“key”:“e_1_i_11_11_31_1”,“DOI-assert-by”:“crossref”,“unstructured”:“ZhangY GaoQ GaoL WangC.imaproduce:一种用于迭代计算的分布式计算框架。InIPDPSW 2011美国阿拉斯加安克雷奇2011年5月;1112\u20131121.“,”DOI“:”10.1109\/IPDPS.2011.260“}],”container-title“:[”并发与计算:实践与经验“],”原始标题“:[],”language“:”en“,”link“:[{”URL“:”https:\/\/api.wiley.com\/onlinelibrary\/tdm\/v1\/articles \/10.10002%2Fcpe.3034“,”content-type“:”unspecified“,”内容版本“:”vor“,”intended-d-应用程序“:”文本提示“},{”URL“:”https:\/\/onlinelibrary.wiley.com//doi\/pdf\/10.1002\/cpe.3034“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2023,9,2],”date-time“:“2023-09-02T21:41:56Z”,“timestamp”:1693690916000},“score”:1,“resource”:{“primary”:{“URL”:“https:\/\/onlinelibrary.wiley.com/doi\/10.1002\/cpe.3034“}},”副标题“:[],”短标题“:[],”已发布“:{”日期部分“:[[2013,5,10]]},“参考计数”:30,”日志发布“:”发布“:“:”http://\/dx.doi.org\/10.1002\/cpe.3034“,”存档“:[”Portico“],”关系“:{},“ISSN”:[“1532-0626”,“1532-0.634”],“ISSN-type”:[{“value”:“1532-00626”,”type“:”print“},{“value”:“1522-0634”,“type”:“electronic”}],“subject”:【】,“published”:{“date-parts”:【2013年5月10日】}}}