FlexibleQL

FlexibleQL:一种灵活可扩展的数据挖掘查询语言新兴的数据挖掘工具和系统自然而然地需要一种强大的数据挖掘语言。近年来,人们做了一些工作,开发了一些数据挖掘语言,但似乎这些语言的目标并不是以下几个方面:1)语言的灵活性,i、 现有的语言支持一组预定义的算法,因此强制使用这些预定义的算法。2) 语言的可扩展性,即语言不能以新的数据挖掘特性和算法来回答新的查询来满足组织需求的方式进行扩展。3) 这些挖掘算法都是为了支持不同类型的数据挖掘而设计的,这些决策树的目标似乎不支持这些决策。4) 在这些语言中,对已发现的模式进行后期处理以供以后使用以及对要挖掘的数据进行预处理似乎很薄弱。在本文中,我们试图在我们的灵活挖掘查询语言FlexibleQL的设计中考虑以下几点。我们展示了FlexibleQL在用户可以选择和配置他们想要的数据挖掘过程的场景中是灵活的。此外,FlexibleQL是可扩展的,语言系统的管理员可以扩展语言,以便使用新的挖掘算法和工具来回答更多的归纳查询。因此,可以满足新的组织和管理要求。此外,FlexibleQL还具有数据采样的能力,允许用户对大容量数据中随机选择的部分(而不是所有数据)运行数据挖掘算法,以提高挖掘过程的运行时性能。此外,FlexibleQL还以特殊格式保存数据挖掘结果,该格式可供用户(系统管理员)使用,并具有对挖掘出的规则进行后期处理以供以后使用的能力。