ANF公司 swMATH ID: 12276 软件作者: C.R.Palmer、P.B.Gibbons、C.Faloutsos 描述: ANF:一种快速且可扩展的工具,用于大规模图形中的数据挖掘。图形是一种越来越重要的数据源,其中包括互联网和Web等重要的图形。其他常见的图形包括CAD电路、电话记录、基因序列、城市街道、社交网络和学术引用。任何类型的关系,例如电影中出现的演员,都可以用图表表示。这项工作提出了一种称为ANF的数据挖掘工具,它可以快速回答关于图形显示数据的许多有趣问题,例如以下问题。互联网对失败的抵抗力如何?最有影响力的数据库论文是什么?电影外观模式是否存在性别差异?ANF的核心是基于一种快速且节省内存的方法来近似图的完整“邻域函数”。对于网络图(268K个节点),ANF的高精度近似比精确计算快700多倍。这将运行时间从近一天减少到大约一两分钟,允许用户执行特别的深入搜索任务,并重复回答有关更改数据源的问题。为了实现这种向下搜索,ANF采用了新的技术来近似具有不同节点和/或边的图的邻域类型函数。与现有最佳近似值相比,在相同的资源条件下,ANF的方法更快、更准确。此外,与以前的方法不同,ANF可以优雅地扩展以处理驻留在磁盘上的图形。最后,我们给出了使用ANF挖掘大型图的一些结果。 主页: http://dl.acm.org/citation.cfm?id=775059 相关软件: HyperLogLog(超级日志日志);gSpan(量程);WebGraph(网络图表);KronFit公司;SNAP(快照);鹦鹉螺;CloseGraph(关闭图形);CMAR公司;UCI-毫升;GraphChi公司;UbiCrawler浏览器;图;MetExplore公司;Pajek数据集;标签;糕点;和弦 引用于: 12文件 全部的 前5名45位作者引用 2 皮埃尔路易吉·克雷森齐 2 罗伯托·格罗西 2 莱昂纳多·兰齐 2 安德烈亚·马里诺 1 马延克巴瓦 1 奥雷尔·卡米 1 劳拉·卡皮(Laura C.Carpi)。 1 查克拉巴蒂,迪帕扬 1 程红 1 卡罗利·萨洛加尼 1 德奥,纳尔辛格 1 克里斯托斯·法洛索斯 1 达尼尔·福加拉斯 1 亚历杭德罗·弗雷。 1 赫克托·加西亚·莫利纳 1 佐宾·加赫拉马尼 1 阿里斯蒂德斯·吉奥尼斯 1 关晓红 1 米歇尔·哈比卜 1 黄欣 1 乔恩·迈克尔·克莱伯格 1 沃尔特·科斯特斯(Walter A.Kosters)。 1 陪审员莱斯科韦茨 1 李荣华 1 John C.S.Lui。 1 拉杰夫·莫特瓦尼 1 Rethnaswamy Nadarajan 1 尼尔马拉,P。 1 帕诺斯·帕达洛斯(Panos M.Pardalos)。 1 巴拉兹·拉茨 1 马丁·戈麦斯·拉维蒂 1 约翰·F·罗迪克。 1 罗索,奥斯瓦尔多A。 1 塔马斯·萨洛斯 1 蒂亚戈·阿尔维斯·希伯 1 尚泽超 1 弗兰克·W·塔克斯。 1 蒂拉加,M。 1 唐纳德·弗雷德·托斯利 1 Vijayalakshmi,R。 1 王平辉 1 伍德拉夫(David P.Woodruff)。 1 Yu,Jeffrey Xu先生 1 张,秦 1 赵俊洲 全部的 前5名10篇连载文章中引用 2 信息科学 1 《物理快报》。A类 1 计算机与系统科学杂志 1 网络 1 理论计算机科学 1 分布式计算 1 图形算法与应用杂志 1 机器学习研究杂志(JMLR) 1 互联网数学 1 算法 在4个字段中引用 8 计算机科学(68至XX) 7 组合数学(05-XX) 2 博弈论、经济学、金融和其他社会和行为科学(91-XX) 1 信息与通信理论、电路(94-XX) 按年份列出的引文