×

查询图形数据库–语言选择和性能注意事项。 (英语) Zbl 1343.68068号

概述:NoSQL,尤其是图形数据库,在开发人员中不断受到欢迎,因为它们承诺在处理高度互联的数据时,与关系数据库相比,能够提供卓越的性能。Apache Shindig是OpenSocial的参考实现,具有高度互联的数据模型。然而,它有一个关系数据库作为后端。在本文中,我们描述了使用图形数据库Neo4j作为后端的经验,并比较了Cypher、Gremlin和Java作为MySQL查询数据的替代方法。我们从开发人员的角度考虑性能和可用性。我们的结果表明,就代码可读性而言,Cypher是一种很好的查询语言,对于大多数查询来说开销适中(20-200%)。然而,必须用“存储过程”来补充它,以弥补模式匹配查询(\(>1000\%\))中的一些性能缺陷。RESTful API不可用的速度很慢,而我们的WebSocket连接性能要好得多(>650\%\)。

MSC公司:

第68页,共15页 数据库理论
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Tudorica,B.G。;Bucur,C.,《几个NoSQL数据库之间的比较及评论和注释》,(2011年第十届Roedunet国际会议,2011年第10届Roedunet国际会议,Roedunet(2011)),1-5
[2] Pokorny,J.,《NoSQL数据库:在web环境中实现数据库可伸缩性的一步》,《国际网络信息系统》。,9, 1, 69-82 (2013)
[3] Miller,J.J.,《使用Neo4j绘制数据库应用程序和概念》,(第16届南方信息系统协会会议,第16届南部信息系统协会大会,美国佐治亚州亚特兰大(2013))
[4] Cecchet,E.,《C-JDBC:用于数据库集群的中间件框架》,IEEE Data Eng.Bull。,27,2,19-26(2004年)
[5] 卡尔森,M。;摩尔,K。;Hagersten,E。;Wood,D.A.,基于Java中间件的存储系统行为,(第九届高性能计算机体系结构国际研讨会,第九届国际高性能计算机架构研讨会,HPCA’03(2003)),217-228
[6] 李毅。;Lü,K.,网络数据库的性能问题,(数据库和专家系统应用程序(2000)),825-834
[7] Stonebraker,M。;Cattell,R.,“简单操作”数据存储中可扩展性能的10条规则,Commun。ACM,54,6,72-80(2011年6月)
[8] Codd,E.F.,《关系数据库:生产力的实用基础》,Commun。ACM,25,2,109-117(1982年2月)
[9] Trueblood,R.P.,《使用SQL的数据挖掘和统计分析》(2008),4月
[10] 尼古拉,M。;Van der Linden,B.,DB2通用数据库中的本地XML支持,(第31届超大数据库国际会议论文集(2005)),1164-1174
[11] Melton,S.B.Jim,XQuery,XPath和SQL/XML in Context(2006),Morgan Kaufmann·Zbl 1096.68046号
[12] 阿拉斯古尔,A。;Su,S.Y。;Lam,H.,OQL:一种操作面向对象数据库的查询语言,(第十五届超大数据库国际会议(1989)),433-442
[13] Sackett,L.,MDX Reporting and Analytics with SAP NetWeaver BW(2009年),SAP PRESS
[14] 哈斯,P。;布罗克斯特拉,J。;埃伯哈特,A。;Volz,R.,《RDF查询语言的比较》,(McIlraith,S.;Plexousakis,D.;Harmelen,F.,《语义网-ISWC 2004》,第3298卷(2004),施普林格:施普林格柏林,海德堡),502-517
[15] 佩雷斯,J。;阿雷纳斯,M。;Gutierrez,C.,《SPARQL的语义和复杂性》,(Cruz,I.;Decker,S.;Allemang,D.;Preist,C.;Schwabe,D.;Mika,P.;Uschold,M.;Aroyo,L.,《语义网-ISWC 2006》,第4273卷(2006),施普林格:施普林格柏林,海德堡),30-43
[16] Giugno,R。;Shasha,D.,GraphGrep:一种快速通用的图形查询方法,(第16届模式识别国际会议论文集,第2卷(2002)),112-115
[17] He,H。;Singh,A.K.,Graphs-at-A-ta-time:图形数据库的查询语言和访问方法,(2008年ACM SIGMOD国际数据管理会议,2008年ACM-SIGMOD-国际数据管理大会,加拿大温哥华(2008)),405-418
[18] Angles,R.,《当前图形数据库模型的比较》,(2012年IEEE第28届数据工程研讨会国际会议,2012年IEEE第28届国际数据工程研讨会,ICDEW(2012)),171-177
[19] BarcelóBaeza,P.,查询图数据库,(第32届数据库系统原理研讨会论文集(2013)),175-188
[20] Neo技术,Neo4j手册。第11章。8聚合
[21] Dayaratha,M。;Suzumura,T.,XGDBench:exascale云中图形存储的基准测试平台,(第四届IEEE云计算技术与科学国际会议,第四届EEE云计算技术和科学国际会议(2012年,台湾台北),363-370
[22] 维奇奈尔,C。;马西亚斯,M。;赵,Z。;Nan,X。;陈,Y。;Wilkins,D.,图表数据库和关系数据库的比较:数据来源视角,(第48届东南地区年会。第48届东南地区年会,牛津,密西西比(2010)),42:1-42:6
[23] Houkjaer,K。;托普,K。;Wind,R.,《简单而现实的数据生成》(第32届超大数据库国际会议,第32届国际超大数据库会议,韩国首尔(2006)),1243-1246
[24] 马雷克·西格伦(Marek Ciglan);亚历克斯·阿弗布奇(Alex Averbuch);Hluchy,L.,《对图形数据库的遍历操作进行基准测试》,(第三届图形数据管理国际研讨会:技术与应用。第三届图表数据管理国际会议:技术和应用,GDM 2012,美国华盛顿特区(2012)),186-189
[25] Shalini Batra,C.T.,关系数据库和图形数据库的比较分析,国际软计算杂志。工程师,2,2(2012年5月)
[26] Dominguez-Sal,D。;Urbón-Bayes,P。;Giménez-Vañó,A。;哥梅斯·维拉莫尔,南部。;Martínez-Bazán,n。;Larriba-Pey,J.L.,《关于HPC可扩展图形分析基准的图形数据库性能调查》,(Shen,H.;Pei,J.;Øzsu,M.T.;Zou,L.;Lu,J.,Ling,T.-W.;Yu,G.;Zhuang,Y.;Shao,J.《Web-Age Information Management》,第6185卷(2010),《Springer:Springer Berlin》,第37-48页
[27] 角度,R。;Prat-Pérez,A。;Dominguez-Sal,D。;Larriba-Pey,J.-L.,《社交网络应用的基准数据库系统》(第一届图形数据管理经验和系统国际研讨会(2013年)),第15页
[28] Macko,P。;Margo博士。;Seltzer,M.,图形数据库的性能自省,(第六届国际系统和存储会议,第六届世界系统和存储大会,以色列海法(2013)),18
[29] Cattuto,C。;Quaggiotto,M。;Panisson,A。;Averbuch,A.,《图形数据库中的时间变化社交网络:Neo4j用例》(第一届图形数据管理经验和系统国际研讨会(2013年)),11
[30] 巴mpis,K。;Kolovos,D.,《当代图形数据库对大规模模型有效持久性的评估》,J.Object Technol。,13, 3, 1-26 (2014)
[31] Dayaratha,M。;Suzumura,T.,使用XGDBench在云环境上进行Graph数据库基准测试,Autom。柔和。工程,21,4,509-533(2014)
[32] Dayaratha,M。;Suzumura,T.,《利用XGDBench在图形数据库上模拟大规模复杂网络工作负载》,(2014 IEEE国际大数据大会,2014 IEEE大数据国际大会,BigData大会(2014)),748-755
[33] 北波比迪纳。;Rümmele,S。;Skritek,S。;Werthner,H.,《图形模式匹配的基准数据库系统》(database and Expert systems Applications,2014),226-241
[34] Jouili,S。;Vansteenberghe,V.,《图形数据库的实证比较》,(国际社会计算会议,国际社会计算大会,SocialCom,美国华盛顿特区(2013)),708-715
[35] 多伊彻,Y。;Galon,B。;Kanza,Y.,《将社会空间数据管理为大图形》(第21届国际万维网会议,第21届世界万维网国际会议,IW3C2,法国里昂(2012))
[36] Nogueras-Iso,J。;Zarazaga-Soria,F.J。;Béjar,R。;阿尔瓦雷斯,P。;Muro-Medrano,P.R.,OGC目录服务:空间数据基础设施开发的关键要素,计算。地质科学。,31, 2, 199-209 (2005)
[37] McColl,R.C。;Ediger,D。;普维,J。;坎贝尔,D。;Bader,D.A.,《开源图形数据库的性能评估》,(分析应用程序并行编程第一次研讨会论文集(2014)),11-18
[38] Xin,R.S。;冈萨雷斯,J.E。;富兰克林,M.J。;Stoica,I.,《Graphx:基于火花的弹性分布式图形系统》(graph Data Management Experiences and Systems首次国际研讨会(2013)),2
[39] 布朗森,N。;安斯登,Z。;Cabrera,G。;查卡,P。;迪莫夫,P。;丁,H。;费里斯,J。;Giardullo,A。;库尔卡尼,S。;Li,H.C.,TAO:Facebook的社交图分布式数据存储,(USENIX年度技术会议(2013)),49-60
[40] 韩,W.S。;Lee,S。;帕克,K。;Lee,J.-H。;Kim,M.-S。;Kim,J。;Yu,H.,TurboGraph:在单个PC上处理十亿级图形的快速并行图形引擎,(第19届ACM SIGKDD国际知识发现和数据挖掘会议(2013)),77-85
[41] 邵,B。;Wang,H。;Li,Y.,Trinity:内存云上的分布式图形引擎(2013年国际数据管理会议论文集(2013)),505-516
[42] Goasdoué,F。;马诺莱斯库,I。;Roatiš,A.,针对动态RDF数据库的高效查询应答,(第十六届国际扩展数据库技术会议(2013)),299-310
[43] 安格斯,R。;Boncz,P。;Larriba-Pey,J。;Fundulaki,I。;诺依曼,T。;欧·埃尔林。;Neubauer,P。;Martinez-Bazan,N。;科采夫,V。;Toma,I.,《关联数据基准委员会:图表和RDF行业基准工作》,SIGMOD Rec.,43,1,27-31(2014)
[44] 明德,P。;Boncz,P。;Erling,O.,S3G2:一种可扩展的结构相关社交图生成器(第四届TPC技术会议,第四届土耳其伊斯坦布尔TPC技术大会(2012))
[45] 马,H。;魏杰。;钱,W。;Yu,C。;夏,F。;Zhou,A.,《在线社交媒体分析查询基准测试》(第一届图形数据管理经验和系统国际研讨会(2013年)),10
[46] 阿姆斯特朗·T·G。;Ponnekanti,V。;Borthakur,D。;Callaghan,M.,Linkbench:基于脸书社交图的数据库基准,(2013年国际数据管理会议论文集(2013)),1185-1196
[47] 格罗斯尼克劳斯,M。;塞拉利昂,S。;Zäschke,T.,《走向图形数据管理和处理的基准》(2013年),康斯坦茨大学计算机和信息科学系:康斯坦兹大学计算机和信息化系,技术报告KN-2013-DBIS-01
[48] Holzschuher,F。;Peinl,R.,《图形查询语言的性能:Neo4j中Cypher、Gremlin和本地访问的比较》,(第二届图形结构化数据查询国际研讨会,第二届查询图形结构化数据国际研讨会,意大利热那亚(2013)),195-204
[49] Holzschuher,F。;Peinl,R.,查询社交网络数据的性能优化,(第三届查询图形结构化数据国际研讨会。第三届图形结构化数据查询国际研讨会,希腊雅典(2014)),232-239
[50] 德维吉利奥,R。;Maccioni,A。;Torlone,R.,《将关系数据库转换为图形数据库》,(第一届图形数据管理经验和系统国际研讨会(2013年)),1
[52] 巴士,R.P。;Weimer,W.R.,软件可读性的度量,(2008年软件测试与分析国际研讨会论文集(2008)),121-130
[54] Unde,P。;Vin,H.M。;纳图,M。;库尔卡尼,V。;托马斯·D·。;Vasudevan,S。;Dhondage,A。;慢跑,C。;Sahai,S。;Pathak,R.,为IT基础设施和数据中心监控工具构建数据库访问,(ICDE研讨会(2012)),351-354
[55] Cecchet,E。;M.朱莉。;Zwaenepoel,W.,C-JDBC:灵活的数据库集群中间件,(USENIX年度技术会议(2004))
[56] 米勒,M。;Medak,D。;Odobašić,D.,运输网络上图形和关系数据库中最短路径算法性能比较,PROMET Traffic Transp。,26, 1, 75-82 (2014)
[57] Vaquero,L.M。;罗德里奥·梅里诺(Rodero Merino,L.)。;Buyya,R.,《云中动态缩放应用程序》,计算。Commun公司。版次:41、1、45-52(2011年)
[58] Harji,A.S。;Buhr,P.A。;Brecht,T.,《比较高性能多核web服务器架构》,(第五届国际系统和存储年会,第五届年度国际系统和存储器年会,以色列海法(2012))
[59] 马尔科夫斯基,S。;Jayasinghe,D。;海德维希,M。;Park,J。;Kanemasa,Y。;Pu,C.,使用具有读密集型工作负载的N层基准测试对数据库服务器可伸缩性的实证分析,(第25届ACM应用计算研讨会,第25届ASM应用计算会议,瑞士洛桑(2010)),1680-1687
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。