跳到主要内容
10.1109/CCGRID.2018.00080acm会议文章/章节视图摘要出版物页面中央电网会议记录会议集合
研究论文

近似G:通过精度控制快速近似并行图形计数

出版:2018年5月1日出版历史

摘要

Graphlet计数是一种检测大型图的局部结构属性的方法,已经使用了十多年。尽管在优化其性能方面付出了巨大努力,但即使是3节点和4节点的graphlet计数例程也可能在高度优化的系统上运行数小时或数天。在本文中,我们描述了近似计算与并行计算的协同结合如何以最小且可控的精度损失,在graphlet计数运行时中实现乘法性能改进。具体来说,我们描述了两种新技术,即确保统计准确性的多阶段采样和进一步提高多机器运行性能的成本意识采样,这两种技术将大型图形的查询时间从几十小时减少到几分钟或几秒,相对误差仅<1%。

参考文献

  1. Nesreen K.Ahmed、Jennifer Neville、Ryan A.Rossi和Nick G.Duffield。大型网络的高效石墨线计数。2015年IEEE国际数据挖掘会议,2015年ICDM,美国新泽西州大西洋城,2015年11月14-17日,第1-10页,2015年。谷歌学者谷歌学者数字图书馆数字图书馆
  2. Leman Akoglu、Hanghang Tong和Danai Koutra。基于图形的异常检测和描述:综述。CoRR公司,abs/1404.46792014年。谷歌学者谷歌学者
  3. 卢卡·贝切蒂(Luca Becchetti)、保罗·博尔迪(Paolo Boldi)、卡洛斯·卡斯蒂略(Carlos Castillo)和阿里斯蒂德斯·吉奥尼斯(Aristides Gionis)。大规模图中局部三角形计数的高效半流算法。第14届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD'08,第16-24页,2008。谷歌学者谷歌学者数字图书馆数字图书馆
  4. 保罗·博尔迪、马可·罗萨、马西莫·桑蒂尼和塞巴斯蒂亚诺·维尼亚。分层标签传播:用于压缩社交网络的多分辨率无坐标排序。万维网,第587-596页。ACM出版社,2011年。谷歌学者谷歌学者数字图书馆数字图书馆
  5. Thang Nguyen Bui和Curt Jones。找到好的近似顶点和边分区是np困难的。信息处理。莱特。,42(3):153--1591992年5月。谷歌学者谷歌学者数字图书馆数字图书馆
  6. 罗杰·珀夫斯·大卫·弗里德曼(Roger Purves David Freedman)、罗伯特·皮萨尼(Robert Pisani)。统计学(第四版)。W.W.Norton&Company,2007年。谷歌学者谷歌学者
  7. 塔利亚·伊登(Talya Eden)、阿米特·列维(Amit Levi)、达娜·罗恩(Dana Ron)和C.塞沙赫里(C.Seshadhri)。近似计算次线性时间内的三角形。光纤通信系统, 2015.谷歌学者谷歌学者数字图书馆数字图书馆
  8. Inigo Goiri、Ricardo Bianchini、Santosh Nagarakatte和Thu D.Nguyen。Approshadoop:将近似引入mapreduce框架。第二十届程序设计语言和操作系统体系结构支持国际会议论文集ASPLOS’15,第383--397页,2015年。谷歌学者谷歌学者数字图书馆数字图书馆
  9. Joseph E.Gonzalez、Yucheng Low、Haijie Gu、Danny Bickson和Carlos Guestrin。Powergraph:自然图上的分布式图形并行计算。USENIX第十届操作系统设计与实现会议论文集,OSDI’12,第17-30页,2012年。谷歌学者谷歌学者数字图书馆数字图书馆
  10. Wayne Hayes、Kai Sun和Natasa Przulj。基于图形的度量适合于生物网络比较。生物信息学, 29(4):483--491, 2013.谷歌学者谷歌学者数字图书馆数字图书馆
  11. 斯特拉·普达尔·霍佐(Stela Pudar Hozo)、本杰明·朱尔贝戈维奇(Benjamin Djulbegovic)和伊兹托克·霍佐。根据样本的中位数、范围和大小估计平均值和方差。BMC医学研究方法学, 5(1):13, 2005.谷歌学者谷歌学者交叉引用交叉引用
  12. 托马斯·霍奇瓦尔和珍妮斯·德姆沙尔。石墨线计数的组合方法。生物信息学, 30(4):559--565, 2014.谷歌学者谷歌学者交叉引用交叉引用
  13. 乔治·卡里皮斯和维平·库马尔。不规则图的多级划分方案。J.平行分布计算。,48(1):96--1291998年1月。谷歌学者谷歌学者数字图书馆数字图书馆
  14. Dhanya R.Krishnan、Do Le Quoc、Pramod Bhatotia、Christof Fetzer和Rodrigo Rodrigues。Incaprox:用于增量近似计算的数据分析系统。第25届万维网国际会议记录,WWW’16,第1133-1144页,2016年。谷歌学者谷歌学者数字图书馆数字图书馆
  15. Aapo Kyrola、Guy Blelloch和Carlos Guestrin。Graphchi:在一台电脑上进行大规模图形计算第十届USENIX操作系统设计与实现会议记录,OSDI’12,第31-46页,2012年。谷歌学者谷歌学者数字图书馆数字图书馆
  16. Dominique Lasalle和George Karypis。多线程图分区。2013年IEEE第27届并行和分布式处理国际研讨会论文集IPDPS’13,第225-236页,2013年。谷歌学者谷歌学者数字图书馆数字图书馆
  17. Jure Leskovec和Andrej Krevl。SNAP数据集:斯坦福大学大型网络数据集收集。http://snap.stanford.edu/data,2014年6月。谷歌学者谷歌学者
  18. Yucheng Low、Joseph Gonzalez、Aapo Kyrola、Danny Bickson、Carlos Guestrin和Joseph M.Hellerstein。分布式图形实验室:云中机器学习的框架。PVLDB公司, 5(8):716--727, 2012.谷歌学者谷歌学者数字图书馆数字图书馆
  19. 格列戈兹·马莱维茨、马修·奥斯汀、阿尔特·J.C.比克、詹姆斯·德内特、伊兰·霍恩、纳蒂·雷瑟和格列戈兹·扎伊科夫斯基。Pregel:用于大规模图形处理的系统。2010年6月6日至10日在美国印第安纳州印第安纳波利斯举行的ACM SIGMOD国际数据管理会议记录,第135-146页,2010年。谷歌学者谷歌学者数字图书馆数字图书馆
  20. D.马库斯和Y.沙维特。Rage—用于大型网络的快速graphlet枚举器。计算。Netw公司。,56(2):810--819,2012年2月。谷歌学者谷歌学者数字图书馆数字图书馆
  21. M.E.J.纽曼。复杂网络的结构和功能。SIAM审查, 45:167--256, 2003.谷歌学者谷歌学者数字图书馆数字图书馆
  22. Natasa Przulj、Derek G.Corneil和Igor Jurisica。交互式多媒体建模:无尺度还是几何?生物信息学, 20(18):3508--3515, 2004.谷歌学者谷歌学者数字图书馆数字图书馆
  23. 马哈茂德·拉赫曼(Mahmudur Rahman)、曼苏鲁尔·布伊扬(Mansurul Bhuiyan)和穆罕默德·哈桑(Mohammad Al-Hasan)。Graft:用于大型图形分析的近似图形计数算法。第21届ACM信息与知识管理国际会议记录,CIKM’12,第1467--1471页,2012年。谷歌学者谷歌学者数字图书馆数字图书馆
  24. Ryan A.Rossi和Rong Zhou。在大型网络中利用多个gpu和cpu进行graphlet计数。第25届ACM国际信息与知识管理会议记录,CIKM’16,第1783-1792页,2016年。谷歌学者谷歌学者数字图书馆数字图书馆
  25. 阿弥陀佛罗伊、伊沃·米哈伊洛维奇和威利·兹瓦尼波尔。X-stream:使用流分区的边缘中心图形处理。ACM SIGOPS第24届操作系统原理研讨会,SOSP’13,美国宾夕法尼亚州法明顿,2013年11月3日至6日,第472-488页,2013年。谷歌学者谷歌学者数字图书馆数字图书馆
  26. Semih Salihoglu和Jennifer Widom。图形处理系统。第25届国际科学和统计数据库管理会议记录,SSDBM,第22:1--22:12页,2013年。谷歌学者谷歌学者数字图书馆数字图书馆
  27. 尚泽超(Zechao Shang)和杰弗里·徐宇(Jeffrey Xu Yu)。图形计算的自动逼近。程序。荷兰VLDB。2014年10月7日(14)。谷歌学者谷歌学者数字图书馆数字图书馆
  28. 朱利安·顺和卡纳特·唐王三。无需调整的多核三角形计算。第31届IEEE国际数据工程会议,ICDE 2015,韩国首尔,2015年4月13-17日,第149-160页,2015年。谷歌学者谷歌学者交叉引用交叉引用
  29. 斯特利奥斯·西迪罗格卢·杜斯科斯(Stelios Sidiroglou-Douskos)、萨萨·米塞洛维奇(Sasa Misailovic)、亨利·霍夫曼(Henry Hoffmann)和马丁·里纳德(Martin Rinard)。通过环形射孔实现性能与精度的权衡。第19届ACM SIGSOFT研讨会和第13届欧洲软件工程基础会议记录,ESEC/FSE’11,第124-134页,2011年。谷歌学者谷歌学者数字图书馆数字图书馆
  30. 菲尔·斯佩克特。S和S-Plus简介。Wadsworth出版社。Co.,加利福尼亚州贝尔蒙特,美国,第1版,1995年。谷歌学者谷歌学者数字图书馆数字图书馆
  31. 史蒂文·汤普森(Steven K.Thompson)。采样(第3版)。威利,2012年。谷歌学者谷歌学者
  32. 塞巴斯蒂安·韦尼克(Sebastian Wernicke)和弗洛里安·拉斯基(Florian Rasche)。Fanmod:一种快速网络主题检测工具。生物信息学,22(9):1152--1153,2006年5月。谷歌学者谷歌学者数字图书馆数字图书馆
  33. Da Yan、James Cheng、Yi Lu和Wilfred Ng。Blogel:在真实世界图形上进行分布式计算的以块为中心的框架。PVLDB公司, 7(14):1981--1992, 2014.谷歌学者谷歌学者数字图书馆数字图书馆
  34. 张鲁明、宋明丽、刘自成、刘小六、卜佳军和陈淳。概率图切割:利用空间结构线索进行弱监督图像分割。CVPR公司, 2013.谷歌学者谷歌学者数字图书馆数字图书馆

建议

评论

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

登录

完全访问权限

  • 发布于

    封面图片ACM会议
    CCGrid’18:第18届IEEE/ACM集群、云和网格计算国际研讨会论文集
    2018年5月
    731页
    国际标准图书编号:9781538658154

    出版商

    IEEE出版社

    出版历史

    • 出版:2018年5月1日

    检查更新

    限定符

    • 研究论文

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器