×

ANF公司

swMATH ID: 12276
软件作者: C.R.Palmer、P.B.Gibbons、C.Faloutsos
描述: ANF:一种快速且可扩展的工具,用于大规模图形中的数据挖掘。图形是一种越来越重要的数据源,其中包括互联网和Web等重要的图形。其他常见的图形包括CAD电路、电话记录、基因序列、城市街道、社交网络和学术引用。任何类型的关系,例如电影中出现的演员,都可以用图表表示。这项工作提出了一种称为ANF的数据挖掘工具,它可以快速回答关于图形显示数据的许多有趣问题,例如以下问题。互联网对失败的抵抗力如何?最有影响力的数据库论文是什么?电影外观模式是否存在性别差异?ANF的核心是基于一种快速且节省内存的方法来近似图的完整“邻域函数”。对于网络图(268K个节点),ANF的高精度近似比精确计算快700多倍。这将运行时间从近一天减少到大约一两分钟,允许用户执行特别的深入搜索任务,并重复回答有关更改数据源的问题。为了实现这种向下搜索,ANF采用了新的技术来近似具有不同节点和/或边的图的邻域类型函数。与现有最佳近似值相比,在相同的资源条件下,ANF的方法更快、更准确。此外,与以前的方法不同,ANF可以优雅地扩展以处理驻留在磁盘上的图形。最后,我们给出了使用ANF挖掘大型图的一些结果。
主页: http://dl.acm.org/citation.cfm?id=775059
相关软件: HyperLogLog(超级日志日志);gSpan(量程);WebGraph(网络图表);KronFit公司;SNAP(快照);鹦鹉螺;CloseGraph(关闭图形);CMAR公司;UCI-毫升;GraphChi公司;UbiCrawler浏览器;;MetExplore公司;Pajek数据集;标签;糕点;和弦
引用于: 12文件

按年份列出的引文