文件Zbl 1057.68742-zbMATH Open

并行和分布式学习的推进算法。（英语） Zbl 1057.68742号

分布式并行数据库 11，第2期，203-229（2002）.

摘要：可用信息的不断增加及其分布式和异构性对数据挖掘领域产生了重大影响。我们提出了一个并行和分布式增强算法的框架，旨在有效地集成在无法装入主计算机内存的超大、分布式和可能异构数据库上学习的专门分类器。Boosting是构建高精度分类器集合的一种流行技术，其中分类器是连续训练的，训练实例上的权重根据先前分类器的性能自适应设置。
我们的并行boosting算法是为具有少量处理器的紧耦合共享内存系统设计的，其目标是在比单个处理器上的boosting迭代次数更少的情况下实现最大的预测精度。在所有处理器在每轮提升中并行学习分类器后，根据预测的可信度将其组合。我们提出的分布式boosting算法主要用于在数据无法合并在一起时从几个不相交的数据点进行学习，尽管它也可以用于并行学习，其中将大量数据集划分为几个不相交的子集，以进行更有效的分析。
在每一轮提升中，该方法将来自所有站点的分类器组合在一起，并在每个站点上创建分类器集成。最后的分类器被构造为基于不相交数据集的所有分类器集合的集合。应用于多个数据集的新方法表明，与标准的顺序增压相比，并行增压可以达到相同甚至更好的预测精度。实验结果还表明，分布式boosting与标准boosting相比，分类精度有了相当或略有提高，但由于它使用的数据集较小，因此所需的内存和计算时间要少得多。

引用于6文件

MSC公司：

68周05	非数值算法
68单位99	计算方法和应用
第68页，共15页	数据库理论
68T05型	人工智能中的学习和自适应系统

关键词：

并联增压;分布式增压;异构数据库;培养专业专家

软件：

UCI-毫升;冲刺

PDF格式 BibTeX公司 XML格式引用

全文：内政部

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
输出	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
”ab c公司”	短语
(ab c公司)	圆括号

示例

字段

操作员

并行和分布式学习的推进算法。（英语） Zbl 1057.68742号

MSC公司：

关键词：

软件：

示例

字段

操作员

并行和分布式学习的推进算法。 （英语） Zbl 1057.68742号

MSC公司：

关键词：

软件：

并行和分布式学习的推进算法。（英语） Zbl 1057.68742号