跳到主要内容
10.1145/3132747.3132750acm会议文章/章节视图摘要出版物页面硫酸钠会议记录会议集合
研究论文
公共访问

小雨:大规模快速适应性水流处理

出版:2017年10月14日出版历史

摘要

大规模流媒体系统旨在提供高吞吐量和低延迟。它们通常用于运行任务关键型应用程序,必须全天候可用。因此,此类系统需要适应故障和工作负载的固有变化,对延迟和吞吐量的影响最小。不幸的是,现有解决方案要求运营商在正常运行期间实现低延迟和适应期间产生最小影响之间进行选择。连续运营商流系统,如Naiad和Flink,在正常执行期间提供低延迟,但在适应(例如恢复)期间会产生高开销,而微批处理系统,如Spark streaming和FlumeJava,在正常操作期间以高延迟为代价快速适应。

我们的主要观察结果是,虽然流式工作负载需要毫秒级的处理,但工作负载和集群属性的更改频率较低。基于此,我们开发了Drizzle,这是一个将处理间隔与用于容错和适应性的协调间隔解耦的系统。我们在128节点EC2集群上的实验表明,在Yahoo Streaming Benchmark上,Drizzle可以实现小于100ms的端到端记录处理延迟,并且可以获得比Spark低2-3倍的延迟。Drizzle还具有更好的适应性,并且可以以比Flink快4倍的速度从故障中恢复,而在恢复期间的延迟则低13倍。

跳过补充材料部分

补充材料

细雨.mp4

英里4

2 GB

工具书类

  1. Abadi,D.J.、Carney,D.、Chetintemel,U.、Cherniack,M.、Convey,C.、Lee,S.、Stonebraker,M.,Tatbul,N.和Zdonik,S.Aurora:数据流管理的新模型和架构。VLDB(2003)。谷歌学者谷歌学者数字图书馆数字图书馆
  2. Akidau,T.、Balikov,A.、Bekiroglu,K.、Chernyak,S.、Haberman,J.、Lax,R.、McVeety,S.,Mills,D.、Nordstrom,P.和Whittle,S.Millwheel:互联网规模下的容错流处理。VLDB(2013),第734-746页。谷歌学者谷歌学者数字图书馆数字图书馆
  3. Akidau,T.、Bradshaw,R.、Chambers,C.、Chernyak,S.、Fernández-Moctezuma,R.J.、Lax,R.,McVeety,S.,Mills,D.、Perry,F.、Schmidt,E.和Whittle,S.。数据流模型:在大规模、无界、无序数据处理中平衡正确性、延迟和成本的实用方法。VLDB(2015),1792-1803。谷歌学者谷歌学者数字图书馆数字图书馆
  4. Ananthanarayanan,G.,Ghodsi,A.,Shenker,S.,和Stoica,I.,有效的分散者缓解:克隆人的攻击。在NSDI(2013)中。谷歌学者谷歌学者数字图书馆数字图书馆
  5. Ananthanarayanan,G.、Ghodsi,A.、Wang,A.、Borthakur,D.、Kandula,S.、Shenker,S.和Stoica,I.Pacman:并行作业的协调内存缓存。在NSDI(2012)中。谷歌学者谷歌学者数字图书馆数字图书馆
  6. Ananthanarayanan,G.、Kandula,S.、Greenberg,A.、Stoica,I.、Lu,Y.、Saha,B.和Harris,E.使用Mantri对Map-Reduce集群中的异常值进行Reining。《OSDI》(2010)。谷歌学者谷歌学者数字图书馆数字图书馆
  7. Apache Hadoop NextGen MapReduce(YARN)。2013年9月24日检索,URL:http://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/yarn.html。谷歌学者谷歌学者
  8. Armbrust,M.、Xin,R.S.、Lian,C.、Huai,Y.、Liu,D.、Bradley,J.K.、Meng,X.、Kaftan,T.、Franklin,M.J.、Ghodsi,A.等人。《Spark SQL:Spark中的关系数据处理》。SIGMOD(2015)。谷歌学者谷歌学者数字图书馆数字图书馆
  9. Bingmann,T.,Axtmann,M.,Jöbstl,E.,Lamm,S.,Nguyen,H.C.,Noe,A.,Schlag,S.、Stumpp,M.、Sturm,T.和Sanders,P.Thrill:使用C++进行高性能算法分布式批处理。CoRR abs/1608.05634(2016)。谷歌学者谷歌学者
  10. Boncz,P.A.、Zukowski,M.和Nes,N.Monetdb/x100:超管道查询执行。CIDR(2005),第5卷,第225-237页。谷歌学者谷歌学者
  11. Boutin E.、Ekanayake J.、Lin W.、Shi B.、Zhou J.、Qian Z.、Wu M.和Zhou L.Apollo:云计算的可伸缩协调调度。在OSDI(2014)中。谷歌学者谷歌学者数字图书馆数字图书馆
  12. Brakmo,L.S.和Peterson,L.L.TCP Vegas:全球互联网上的端到端拥塞避免。IEEE通信领域选择期刊13,8(1995年10月),1465-1480。谷歌学者谷歌学者数字图书馆数字图书馆
  13. Carbone,P.、Fóra,G.、Ewen,S.、Haridi,S.和Tzoumas,K.分布式数据流的轻量级异步快照。CoRR abs/1506.08603(2015)。谷歌学者谷歌学者
  14. Carbone,P.、Katsifodimos,A.、Ewen,S.、Markl,V.、Haridi,S.和Tzoumas,K.Apache Flink:单引擎中的流和批处理。IEEE数据工程公告(2015)。谷歌学者谷歌学者
  15. Chaiken,R.、Jenkins,B.、Larson,P.奥勒、。,Ramsey,B.、Shakib,D.、Weaver,S.和Zhou,J.SCOPE:简单高效的大规模数据集并行处理。VLDB(2008),1265--1276。谷歌学者谷歌学者数字图书馆数字图书馆
  16. Chambers,C.、Raniwala,A.、Perry,F.、Adams,S.、Henry,R.、Bradshaw,R.和Nathan。FlumeJava:简单、高效的数据并行管道。PLDI(2010)。谷歌学者谷歌学者数字图书馆数字图书馆
  17. Chandrasekaran,S.、Cooper,O.、Deshpande,A.、Franklin,M.J.、Hellerstein,J.M.、Hong,W.、Krishnamurthy,S.R.、Madden,S.R.、Reiss,F.和Shah,M.A.电报CQ:连续数据流处理。在SIGMOD(2003)中,ACM。谷歌学者谷歌学者数字图书馆数字图书馆
  18. Chandy,K.M.和Lamport,L.分布式快照:确定分布式系统的全局状态。美国计算机学会计算机系统学报(TOCS)3,1(1985),63-75。谷歌学者谷歌学者数字图书馆数字图书馆
  19. Chowdhury,M.、Zaharia,M.,Ma,J.、Jordan,M.I.和Stoica,I.与管弦乐队一起管理计算机集群中的数据传输。在SIGCOMM(2011)中。谷歌学者谷歌学者数字图书馆数字图书馆
  20. Das,T.、Zhong,Y.、Stoica,I.和Shenker,S.使用动态批量调整的自适应流处理。SOCC(2014)。谷歌学者谷歌学者数字图书馆数字图书馆
  21. 扩展雅虎!流媒体基准。http://data-artisans.com/extending-the-yahoo-streaming-benchmark。谷歌学者谷歌学者
  22. Apache Spark中的结构化流媒体:一种新的流媒体高级API。https://databricks.com/blog/2016/07/28/structured-streaming-in-apache-spark.html。谷歌学者谷歌学者
  23. Datanami公司。卡夫卡在LinkedIn网站上的每日信息量超过1万亿条。https://goo.gl/cY7VOz。谷歌学者谷歌学者
  24. Dean,J.和Ghemawat,S.MapReduce:大型集群上的简化数据处理。ACM通讯51,1(2008)。谷歌学者谷歌学者数字图书馆数字图书馆
  25. Dragojević,A.、Narayanan,D.、Nightingale,E.B.、Renzelmann,M.、Shamis,A.,Badam,A.和Castro,M.。无妥协:具有一致性、可用性和性能的分布式事务。SOSP(2015)。谷歌学者谷歌学者数字图书馆数字图书馆
  26. Floratou,A.、Agrawal,A.、Graham,B.、Rao,S.和Ramasamy,K.Dhalion:苍鹭的自我调节流处理。VLDB捐赠会议记录10,12(2017),1825-1836。谷歌学者谷歌学者数字图书馆数字图书馆
  27. Ford,D.、Labele,F.、Popovici,F.I.、Stokely,M.、Truong,V.-A.、Barroso,L.、Grimes,C.和Quinlan,S.在全球分布式存储系统中的可用性。OSDI(2010),第61-74页。谷歌学者谷歌学者数字图书馆数字图书馆
  28. Ghodsi,A.、Zaharia,M.、Hindman,B.、Konwinski,A.,Shenker,S.和Stoica,I.主导资源公平:多种资源类型的公平分配。在NSDI(2011)中。谷歌学者谷歌学者数字图书馆数字图书馆
  29. Graefe,G.火山查询处理系统中并行性的封装。在SIGMOD(1990)中,第102-111页。谷歌学者谷歌学者数字图书馆数字图书馆
  30. Gray,C.和Cheriton,D.Leases:分布式文件缓存一致性的高效容错机制。SOSP(1989),第202-210页。谷歌学者谷歌学者数字图书馆数字图书馆
  31. Grosvenor,M.P.,Schwarzkopf,M.,Gog,I.,Watson,R.N.M.,Moore,A.W.,Hand,S.和Crowcroft,J.Queues不在乎你什么时候可以跳过它们!在NSDI(2015)中。谷歌学者谷歌学者数字图书馆数字图书馆
  32. Hindman,B.、Konwinski,A.、Zaharia,M.、Ghodsi,A.,Joseph,A.D.、Katz,R.、Shenker,S.和Stoica,I.Mesos:数据中心细粒度资源共享平台。在NSDI(2011)中。谷歌学者谷歌学者数字图书馆数字图书馆
  33. Isard,M.和Abadi,M.Falkirk wheel:数据流系统的回滚恢复。arXiv预印本arXiv:153.08877(2015)。谷歌学者谷歌学者
  34. Isard,M.、Budiu,M.、Yu,Y.、Birrell,A.和Fetterly,D.Dryad:来自顺序构建块的分布式数据并行程序。在Eurosys(2007)中。谷歌学者谷歌学者数字图书馆数字图书馆
  35. Isard,M.、Prabhakaran,V.、Currey,J.、Wieder,U.、Talwar,K.和Goldberg,A.Quincy:分布式计算集群的公平调度。SOSP(2009)。谷歌学者谷歌学者数字图书馆数字图书馆
  36. 雅各布森,V.拥堵避免和控制。ACM SIGCOMM计算机通信评论18,4(1988),314--329。谷歌学者谷歌学者数字图书馆数字图书馆
  37. Jiang,J.、Sekar,V.、Milner,H.、Shepherd,D.、Stoica,I.和Zhang,H.CFA:视频QoE优化的实用预测系统。在NSDI(2016)中,第137-150页。谷歌学者谷歌学者数字图书馆数字图书馆
  38. Johnston,W.M.、Hanna,J.和Millar,R.J.数据流编程语言进展。ACM计算调查(CSUR)36,1(2004),1-34。谷歌学者谷歌学者数字图书馆数字图书馆
  39. Ke,Q.,Isard,M.和Yu,Y.Optimus:数据并行执行计划的动态重写框架。在Eurosys(2013)中,第15-28页。谷歌学者谷歌学者数字图书馆数字图书馆
  40. Kreps,J.、Narkhede,N.、Rao,J.等人。Kafka:用于日志处理的分布式消息传递系统。在NetDB(2011)中。谷歌学者谷歌学者
  41. Kulkarni,S.、Bhagat,N.、Fu,M.、Kedigehalli,V.、Kellogg,C.、Mittal,S.,Patel,J.M.、Ramasamy,K.和Taneja,S.推特苍鹭:大规模流处理。在SIGMOD(2015)中,第239--250页。谷歌学者谷歌学者数字图书馆数字图书馆
  42. Lin,W.,Qian,Z.,Xu,J.,Yang,S.,Zhou,J,and Zhow,L.Streamscope:大数据流的连续可靠分布式处理。在NSDI(2016)中,第439-453页。谷歌学者谷歌学者数字图书馆数字图书馆
  43. Mashayekhi,O.、Qu,H.、Shah,C.和Levis,P.,可扩展的快速云计算,带执行模板。CoRR abs/1606.01972(2016)。谷歌学者谷歌学者
  44. McSherry,F.、Isard,M.和Murray,D.G.可扩展性!但代价是什么?第十五届操作系统热点研讨会(HotOS XV)(2015年)。谷歌学者谷歌学者数字图书馆数字图书馆
  45. Meisner,D.、Sadler,C.M.、Barroso,L.A.、Weber,W.-D.和Wenisch,T.F.在线数据密集型服务的电源管理。ISCA(2011)。谷歌学者谷歌学者数字图书馆数字图书馆
  46. 流分析SLA。https://azure.microsoft.com/en-us/support/legal/sla/stream-analytics/v1_0/。谷歌学者谷歌学者
  47. Motwani,R.、Widom,J.、Arasu,A.、Babcock,B.、Babu,S.、Datar,M.、Manku,G.、Olston,C.、Rosenstein,J.和Varma,R.数据流管理系统中的查询处理、资源管理和近似。CIDR(2003)。谷歌学者谷歌学者
  48. Murray,D.G.、McSherry,F.、Isaacs,R.、Isard,M.、Barham,P.和Abadi,M.Naiad:一个及时的数据流系统。SOSP(2013),第439-455页。谷歌学者谷歌学者数字图书馆数字图书馆
  49. Murray,D.G.、Schwarzkopf,M.、Smowton,C.、Smith,S.、Madhavapedy,A.和Hand,S.Ciel:分布式数据流计算的通用执行引擎。在NSDI(2011)中,第113-126页。谷歌学者谷歌学者数字图书馆数字图书馆
  50. 螳螂流处理。http://techblog.netflix.com/2016/03/stream-processing-with-mantis.html。谷歌学者谷歌学者
  51. Ousterhout,K.,Panda,A.,Rosen,J.,Venkataraman,S.,Xin,R.,Ratnasamy,S.、Shenker,S.和Stoica,I.计算集群中微小任务的情况。在HotOS(2013)中。谷歌学者谷歌学者数字图书馆数字图书馆
  52. Ousterhout,K.、Wendell,P.、Zaharia,M.和Stoica,I.Sparrow:分布式低延迟调度。在SOSP(2013)中,第69-84页。谷歌学者谷歌学者数字图书馆数字图书馆
  53. Rech,B.、Re,C.、Wright,S.和Niu,F.Hogwild!:一种并行化随机梯度下降的无锁方法。《神经信息处理系统进展》(2011年),第693-701页。谷歌学者谷歌学者数字图书馆数字图书馆
  54. Schelter,S.、Ewen,S.,Tzoumas,K.和Markl,V.。条条大路通罗马:分布式迭代数据处理的乐观恢复。在CIKM(2013)中。谷歌学者谷歌学者数字图书馆数字图书馆
  55. Selinger,P.G.、Astrahan,M.M.、Chamberlin,D.D.、Lorie,R.A.和Price,T.G.关系数据库管理系统中的访问路径选择。在SIGMOD(1979)中,第23-34页。谷歌学者谷歌学者数字图书馆数字图书馆
  56. Stonebraker,M.、Ch etintemel,U.和Zdonik,S.实时流处理的8项要求。SIGMOD记录34,4(2005年12月),42-47。谷歌学者谷歌学者数字图书馆数字图书馆
  57. Toshniwal,A.、Taneja,S.、Shukla,A.、Ramasamy,K.、Patel,J.M.、Kulkarni,S.,Jackson,J.、Gade,K.,Fu,M.、Donham,J.等。推特上的风暴。在SIGMOD(2014)中。谷歌学者谷歌学者
  58. Twitter的可观察性:技术概述。https://goo.gl/wAHi2I。谷歌学者谷歌学者
  59. Apache Spark,为下一波反应性大数据做准备。http://goo.gl/FqEh94。谷歌学者谷歌学者
  60. Verma,A.、Cho,B.、Zea,N.、Gupta,I.和Campbell,R.H.打破mapreduce阶段障碍。集群计算16,1(2013),191--206。谷歌学者谷歌学者数字图书馆数字图书馆
  61. Verma,A.、Pedrosa,L.、Korupolu,M.、Oppenheimer,D.、Tune,E.和Wilkes,J.《谷歌与borg的大规模集群管理》(2015)。谷歌学者谷歌学者数字图书馆数字图书馆
  62. Yadwadkar,N.J.、Ananthanarayanan,G.和Katz,R.Wrangler:可预测且更快的工作,使用更少的资源。SOCC(2014)。谷歌学者谷歌学者数字图书馆数字图书馆
  63. 雅虎流计算引擎基准测试!https://yahooeng.tumblr.com/post/135321837876。谷歌学者谷歌学者
  64. Yu,Y.、Isard,M.、Fetterly,D.、Budiu,M.和Erlingsson,美国。,Gunda,P.和Currey,J.Dryadlinq:使用高级语言进行通用分布式数据并行计算的系统。OSDI(2008)。谷歌学者谷歌学者数字图书馆数字图书馆
  65. Zaharia,M.、Borthakur,D.、Sen Sarma,J.、Elmelegy,K.、Shenker,S.和Stoica,I.延迟调度:在集群调度中实现局部性和公平性的简单技术。在Eurosys(2010)中。谷歌学者谷歌学者数字图书馆数字图书馆
  66. Zaharia,M.、Chowdhury,M.,Das,T.、Dave,A.、Ma,J.、McCaley,M.和Franklin,M.以及Shenker,S.和Stoica,I.弹性分布式数据集:内存集群计算的容错抽象。在NSDI(2012)中。谷歌学者谷歌学者数字图书馆数字图书馆
  67. Zaharia,M.、Das,T.、Li,H.、Hunter,T.,Shenker,S.和Stoica,I.离散流:大规模容错流计算。SOSP(2013)。谷歌学者谷歌学者数字图书馆数字图书馆
  68. Zhang,T.、Chowdhery,A.、Bahl,P.V.、Jamieson,K.和Banerjee,S.无线视频监控系统的设计和实现。《第21届移动计算与网络国际年会论文集》(2015),ACM,第426-438页。谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. 小雨:大规模快速适应性水流处理

      建议

      评论

      登录选项

      检查您是否可以通过登录凭据或您的机构访问本文。

      登录

      完全访问权限

      • 发布于

        封面图片ACM会议
        SOSP’17:第26届操作系统原理研讨会论文集
        2017年10月
        677页
        国际标准图书编号:9781450350853
        内政部:10.1145/3132747

        版权所有©2017 ACM

        如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].

        出版商

        计算机协会

        美国纽约州纽约市

        出版历史

        • 出版:2017年10月14日

        权限

        请求有关此文章的权限。

        请求权限

        检查更新

        限定符

        • 研究论文
        • 研究
        • 推荐有限公司

        接受率

        总体验收率131属于716提交文件,18%

        即将召开的会议

        SOSP’24
        ACM SIGOPS第29届操作系统原理研讨会
        2024年11月5日至8日
        奥斯汀,德克萨斯州,美国

      PDF格式

      以PDF文件查看或下载。

      PDF格式

      电子阅读器

      使用eReader联机查看。

      电子阅读器