×

在多个MapReduce作业之间共享。 (英语) Zbl 1333.68102号


MSC公司:

68第20页 信息存储和数据检索
64岁以下 分布式系统
第68页,共15页 数据库理论
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿扎·阿布泽德(Azza Abouzeid)、卡米勒·巴伊达·保利科夫斯基(Kamil Bajda-Pawlikowski)、丹尼尔·阿巴迪(Daniel J.Abadi)、阿维·西尔伯沙茨(Avi Silberschatz)和亚历山大·拉辛。2009年HadoopDB:用于分析工作负载的MapReduce和DBMS技术的架构混合。程序。荷兰VLDB。2, 1, 922–933.
[2] Foto Afrati和Jeffrey D.Ullman。2010.在MapReduce环境中优化联接。第13届会议记录;支持>第60个/支持>扩展数据库技术国际会议(EDBT’10)。99–110. ·数字对象标识代码:10.1145/1739041.1739056
[3] Parag Agrawal、Daniel Kifer和Christopher Olston。2008.安排大型数据文件的共享扫描。程序。荷兰VLDB。1, 1, 958–969.
[4] 亚马逊。2006.亚马逊弹性计算云。http://aws.amazon.com/ec2/。
[5] 罗恩·阿夫努尔(Ron Avnur)和约瑟夫·海勒斯坦(Joseph M.Hellerstein)。2000.Eddies:持续自适应查询处理。ACM SIGMOD国际数据管理会议记录(SIGMOD'00)。261–272. ·Zbl 1060.68585号
[6] Shivnath Babu、Rajeev Motwani、Kamesh Munagala、Itaru Nishizawa和Jennifer Widom。2004.流水线流过滤器的自适应排序。在ACM SIGMOD国际数据管理会议记录(SIGMOD'04)中。407–418之间。
[7] Spyros Blanas、Jignesh M.Patel、Vuk Ercegovac、Jun Rao、Eugene J.Shekita和田媛媛。2010年,MapReduce中日志处理的连接算法比较。在ACM SIGMOD国际数据管理会议(SIGMOD'10)的会议记录中。975–986.
[8] 博客范围。2005年,BlogScope。http://www.blogscope.net/。
[9] 乔治·坎迪亚(George Candea)、尼奥克利斯·波利佐提斯(Neoklis Polyzotis)和拉德克·文格拉莱克(Radek Vingralek)。2009年。用于高度并发数据仓库的可扩展、可预测的连接操作符。程序。荷兰VLDB。2, 1, 277–288.
[10] 罗尼·查肯(Ronnie Chaiken)、鲍勃·詹金斯(Bob Jenkins)、佩尔·阿克·拉森(Per-Ake Larson)、比尔·拉姆齐(Bill Ramsey)、达伦·沙基布(Darren Shakib)、西蒙·韦弗(Simon Weaver)和周敬仁(。2008.范围:轻松高效地并行处理海量数据集。程序。VLDB Endow 1、2、1265–1276号。
[11] Sirish Chandrasekaran、Owen Cooper、Amol Deshpande、Michael J.Franklin、Joseph M.Hellerstein、Wei Hong、Sailesh Krishnamurthy、Samuel Madden、Vijayshankar Raman、Frederick Reiss和Mehul A.Shah。2003.TelegraphCQ:不确定世界的连续数据流处理。在1<会议记录中;支持>标准&#60/支持>创新数据系统研究两年期会议(CIDR'03)。
[12] Surajit Chaudhuri和Kyuseok Shim。1993年。存在外部函数时的查询优化。《19世纪会议录》;支持>第60个/支持>超大数据库国际会议(VLDB’93)。529–542.
[13] Surajit Chaudhuri和Kyuseok Shim。1996.使用用户定义谓词优化查询。《19世纪会议录》;支持>第60个/支持>超大数据库国际会议(VLDB’96)。87–98.
[14] Surajit Chaudhuri和Kyuseok Shim。1999.使用用户定义谓词优化查询。ACM事务处理。数据库系统。24177–228·doi:10.1145/320248.320249
[15] Fa-Chung Fred Chen和Margaret H.Dunham。1998年。多查询处理中的通用子表达式处理。IEEE传输。知识。数据引擎。10, 3, 493–499. ·数字对象标识代码:10.1109/69.687980
[16] 陈建军(Jianjun Chen)、戴维·德威特(David J.Dewitt)、田锋(Feng Tian)和王远(Yuan Wang)。NiagaraCQ:互联网数据库的可扩展连续查询系统。ACM SIGMOD国际数据管理会议记录(SIGMOD'00)。379–390.
[17] 程涛(Cheng Tao Chu)、金桑坤(Sang Kyun Kim)、林毅安(Yi-An Lin)、余元元(Yuan Yu)、加里·布拉德斯基(Gary Bradski)、安德鲁·吴彦祖(Andrew Y.Ng)和库尼·奥卢科顿。2006.用于多核机器学习的MapReduce。神经信息处理系统会议记录(NIPS'06)。
[18] 杰弗里·科恩(Jeffrey Cohen)、布莱恩·多兰(Brian Dolan)、马克·邓拉普(Mark Dunlap)、约瑟夫·海勒斯坦(Joseph M.Hellerstein)和卡勒布·韦尔顿(Caleb Welton)。2009年,MAD技能:大数据的新分析实践。程序。荷兰VLDB。2, 2, 1481–1492.
[19] 杰弗里·迪恩(Jeffrey Dean)和桑杰·盖马沃特(Sanjay Ghemawat)。2004.MapReduce:简化大型集群上的数据处理。第6届会议记录;支持>第60个/支持>操作系统设计与实现研讨会(OSDI’04)。107–113.
[20] 杰弗里·迪恩(Jeffrey Dean)和桑杰·盖马沃特(Sanjay Ghemawat)。MapReduce:简化大型集群上的数据处理。通信ACM 51、1、107–113·数字对象标识代码:10.1145/1227452.1327492
[21] Jens Dittrich、Jorge Quiane、Alekh Jindal、Yagiz Kargin、Vinay Setty和Jorg Schad。2010年Hadoop&plus&加;:让一头黄色的大象像猎豹一样奔跑(它甚至没有注意到)。程序。荷兰VLDB。3, 1.
[22] 谢尔登·芬克尔斯坦。1982.数据库应用程序中的常见表达式分析。在ACM SIGMOD国际数据管理会议(SIGMOD'82)的会议记录中。235–245.
[23] Eric Friedman、Peter Pawlowski和John Cieslewicz。2009.Sql/MapReduce:一种实现自我描述、多态和可并行的用户定义函数的实用方法。程序。荷兰VLDB。2、2·doi:10.14778/1687553.1687567
[24] Alan F.Gates、Olga Natkovich、Shubham Chopra、Pradeep Kamath、Shravan M.Narayanamurthy、Christopher Olston、Benjamin Reed、Santhosh Srinivasan和Utkarsh Srivastava。2009年,在MapReduce之上构建高级数据流系统:猪的体验。程序。荷兰VLDB。2, 2, 1414–1425.
[25] 哈多。2007.Hadoop项目。http://hadoop.apache.org/。
[26] Stavros Harizopoulos、Vladislav Shkapenyuk和Anastasia Ailamaki。QPipe:一个同时使用流水线的关系查询引擎。ACM SIGMOD国际数据管理会议记录(SIGMOD'00)。383–394.
[27] 约瑟夫·海勒斯坦(Joseph M.Hellerstein)。1994.实际谓词位置。在ACM SIGMOD国际数据管理会议(SIGMOD'94)的会议记录中。325–335.
[28] 约瑟夫·海勒斯坦(Joseph M.Hellerstein)和迈克尔·斯通布雷克(Michael Stonebraker)。1993.谓词迁移:使用昂贵的谓词优化查询。ACM SIGMOD记录22、2、267–276·doi:10.1145/170036.170078
[29] 希罗多托斯·希罗多托(Herodotos Herodotou)、哈罗德·林(Harold Lim)、罗刚(Gang Luo)、内迪亚尔科·鲍里索夫(Nedyalko Borisov)、梁栋(Liang Dong)、法塔玛·比尔根·塞廷(Fatma Bilgen Ce。2011.海星:大数据分析的自调整系统。《创新数据系统研究两年期会议记录》(CIDR’11)。
[30] Eaman Jahani、Michael J.Cafarella和Christopher Re.2011年。MapReduce程序的自动优化。程序。荷兰VLDB。4, 6. ·doi:10.14778/1978665.1978670
[31] 姜大伟、吴本钦、史磊和吴赛。2010年,MapReduce的性能:深入研究。程序。荷兰VLDB。3, 1. ·数字对象标识代码:10.14778/1920841.1920903
[32] 瑞安·约翰逊(Ryan Johnson)、斯塔夫罗斯·哈里佐普洛斯(Stavros Harizopoulos)、尼科斯·哈达维拉斯(Nikos Hardavellas)、基万斯·萨比里(Kivanc Sabirli)、伊波克拉蒂斯·潘迪斯(Ippokratis Pandis)、安娜斯塔西娅·艾拉马基(Anastasia Ailamaki。2007.分享或不分享?第33届会议记录;支持>第60页/sup 62;超大数据库国际会议(VLDB'07)。351–362之间。
[33] 李博多(Bodou Li)、爱德华·马祖(Edward Mazur)、戴燕蕾(Yanlei Diao)、安德鲁·麦格雷戈(Andrew Mcgregor)和普拉珊特·谢诺伊(Prashant J.Shenoy)。2012.SCALLA:一个使用MapReduce进行可扩展单程分析的平台。ACM事务处理。数据库系统。37, 4, 27.
[34] 刘震(Zhen Liu)、斯里尼瓦桑·帕塔萨拉蒂(Srinivasan Parthasarathy)、阿南德·兰加纳坦(Anand Ranganathan)和郝阳(Hao Yang)。2008年a。用于共享过滤器排序问题的通用流算法。第27届会议记录;支持>第60个/支持>ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会(PODS’08)。ACM出版社,纽约,79-88·doi:10.1145/1376916.1376929
[35] 刘震(Zhen Liu)、斯里尼瓦桑·帕塔萨拉蒂(Srinivasan Parthasarathy)、阿南德·兰加纳坦(Anand Ranganathan)和郝阳(Hao Yang)。2008年b。数据流系统中共享过滤器评估的近优算法。ACM SIGMOD国际数据管理会议记录(SIGMOD'08)。ACM出版社,纽约,133-146。
[36] 塞缪尔·马登(Samuel Madden)、梅胡尔·沙阿(Mehul A.Shah)、约瑟夫·海勒斯坦(Joseph M.Hellerstein)和维杰珊卡·拉曼(Vijayshankar Raman)。2002.连续自适应流上的连续查询。ACM SIGMOD国际数据管理会议记录(SIGMOD'02)。49–60.
[37] 卡梅什·穆纳加拉(Kamesh Munagala)、乌特卡什·斯利瓦斯塔瓦(Utkarsh Srivastava)和詹妮弗·威多姆(Jennifer Widom)。2007.使用共享的昂贵过滤器优化连续查询。第26届会议记录;支持>第60个/支持>ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会(PODS'07)。215–224. ·doi:10.1145/1265530.1265561
[38] 托马斯·尼基尔(Tomasz Nykiel)、米查利斯·波塔米亚斯(Michalis Potamias)、查塔尼亚·米什拉(Chaitanya Mishra)、乔治·科利奥斯(George Kollios)和尼克·库达斯(Nick Koudas)。2010.MRShare:在MapReduce中跨多个查询共享。程序。荷兰VLDB。3, 1, 494–505. ·Zbl 1333.68102号
[39] 克里斯托弗·奥尔斯顿(Christopher Olston)、本杰明·里德(Benjamin Reed)、亚当·西尔伯斯坦(Adam Silberstein)和乌特卡什·斯利瓦斯塔瓦(Utkarsh Srivastava)。2008年a。并行数据流程序的自动优化。在年度技术会议(ATC’08)的年度技术会议记录中。267–273之间。
[40] Christopher Olston、Benjamin Reed、Utkarsh Srivastava、Ravi Kumar和Andrew Tomkins。2008年b。Pig拉丁语:一种不太外语的数据处理语言。ACM SIGMOD国际数据管理会议记录(SIGMOD'08)。1099–1110.
[41] Biswanath Panda、Joshua S.Herbach、Sugato Basu和Roberto J.Bayardo。2009年,《行星》:使用mapreduce大规模并行学习树集合。程序。荷兰VLDB。2, 2. ·doi:10.14778/1687553.1687569
[42] Jooseok Park和Arie Segev。1988.使用公共子表达式优化多个查询。在4<会议记录中;支持>第60个/支持>国际数据工程会议(ICDE'88)。311–319. ·doi:10.1109/ICDE.1988.105474
[43] 安德鲁·帕夫洛、埃里克·保尔森、亚历山大·拉辛、丹尼尔·阿巴迪、大卫·德威特、塞缪尔·马登和迈克尔·斯通布拉克。2009年,大规模数据分析方法的比较。在ACM SIGMOD国际数据管理会议(SIGMOD'09)的会议记录中。 ·doi:10.1145/1559845.1559865
[44] 罗伯·派克(Rob Pike)、肖恩·多沃德(Sean Dorward)、罗伯特·格雷塞默(Robert Griesemer)和肖恩·昆兰(Sean Quinlan)。2005.数据解释:与sawzall进行平行分析。科学。程序。13, 4, 277–298.
[45] 林乔(Lin Qiao)、维杰珊卡·拉曼(Vijayshankar Raman)、弗雷德里克·赖斯(Frederick Reiss)、彼得·哈斯(Peter J.Haas)和盖·洛曼(Guy M.Lohman)。2008.多核CPU的主存储器扫描共享。程序。荷兰VLDB。1, 1, 610–621.
[46] Daniel J.Rosenkrantz和Harry B.Hunt III,1980年。处理连接谓词和查询。第6届会议记录;支持>第60个/支持>超大数据库国际会议(VLDB’80)。64–72.
[47] Prasan Roy、Sridhar Seshadri、S.Sudarshan和Siddhesh Bhobe。2000.高效且可扩展的多查询优化算法。ACM SIGMOD修订版29,2249-260。
[48] 蒂莫斯·塞利斯。1988.多查询优化。ACM事务处理。数据库系统。13, 1, 23–52. ·数字对象标识代码:10.1145/42201.42203
[49] Kyuseok Shim、Timos Sellis和Dana Nau。1994年,改进了用于多查询优化的启发式算法。数据知识。发动机。12, 2, 197–222. ·doi:10.1016/0169-023X(94)90014-0
[50] Ashish Thusoo、Joydep Sen Sarma、Namit Jain、Zheng Shao、Prasad Chakka、Suresh Anthony、Hao Liu、Pete Wyckoff和Raghotham Murthy。2009年。Hive–基于MapReduce框架的仓库解决方案。Proc。荷兰VLDB。2, 2, 1626–1629.
[51] 卡尔·A·沃尔兹普勒(Carl A.Waldspurger)和威廉·E·威尔(William E.Weihl)。1994年。彩票安排:灵活的比例共享资源管理。在1<会议记录中;支持>标准&#60/支持>USENIX操作系统设计与实现会议(OSDI’94)。1–11。
[52] 王晓丹(Xiaodan Wang)、克里斯托弗·奥尔斯顿(Christopher Olston)、安尼什·达斯·萨玛(Anish Das Sarma)和兰达尔·伯恩斯(Randal Burns)。2011.CoScan:云计算中的合作扫描共享。第二届会议记录;支持>第60页/支持>ACM云计算研讨会(SOCC’11)。11:1–11:12.
[53] 乔尔·沃尔夫(Joel Wolf)、安德烈·巴尔敏(Andrey Balmin)、迪帕克·拉詹(Deepak Rajan)、基尔斯滕·希尔德拉姆(Kirsten Hildrum)、罗希特·坎德卡尔(Rohit Khandekar)、苏杰·帕雷克(Sujay Parekh)、吴坤龙(。2012.CIRCUMFLEX:一个用于MapReduce工作负载的调度优化器,具有共享扫描功能。SIGOPS操作。系统。第46、1、26–32版·doi:10.1145/2146382.2146388
[54] 赛乌、冯丽、莎拉德·梅赫罗特拉和本金乌伊。2011.大规模并行数据处理的查询优化。第二届会议记录;支持>第60页/sup 62;ACM云计算研讨会(SOCC'11)。12:1–12:13。
[55] 杨洪志、阿里·达斯丹、肖若龙和D.斯托特·帕克。2007.MapReduce-merge:简化大型集群上的关系数据处理。ACM SIGMOD国际数据管理会议记录(SIGMOD'07)。1029–1040.
[56] 袁瑜、迈克尔·伊萨德、丹尼斯·费特利、米海·布迪乌、乌法尔·埃尔林森、普拉迪普·库马尔·冈达和乔恩·库里。2008.DryadLINQ:使用高级语言进行通用分布式数据并行计算的系统。在8<会议记录中;支持>第60个/支持>USENIX操作系统设计与实现会议(OSDI’08)。1–14.
[57] 周敬仁、佩尔·阿克·拉尔森、约翰·克里斯托夫·弗雷塔格和沃尔夫冈·莱纳。2007.有效利用类似子表达式进行查询处理。ACM SIGMOD国际数据管理会议记录(SIGMOD'07)。533–544.
[58] 马金·祖科夫斯基(Marcin Zukowski)、桑德尔·赫曼(Sandor Heman)、尼尔斯·内斯(Niels Nes)和彼得·邦茨(Peter Boncz)。2007.合作扫描:DBMS中的动态带宽共享。《第33届会议论文集》;支持>第60页/支持>超大数据库国际会议(VLDB’07)。723–734.
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。