彗星

彗星:在海量数据上学习和使用大集合的方法。COMET是一种用于大规模数据学习的单程MapReduce算法。它在分布的数据块上建立多个随机森林集合,并将它们合并成一个大集合。当从大到无法在一台机器上容纳的大规模数据中学习时,这种方法是合适的。为了获得最佳的准确率,应该使用IVoting而不是bagging来为随机森林中的每个决策树生成训练子集。在大样本(5GB)和5GB的训练数据上,比较了两种算法的精度。最后,我们提出了一种新的高斯方法,动态地决定每个数据点需要评估多少个集成成员,这可以使评估成本降低100倍以上。

此软件的关键字

这里的任何内容都将在支持canvas元素的浏览器上被替换


zbMATH中的参考文献(参考文献2条,1标准件)

显示结果1到2,共2个。
按年份排序(引用)

  1. Lopes,Miles E.:估计随机群的急剧收敛界(2020)
  2. 大教堂,查士丁D。;曼森,亚瑟先生;科尔达,塔玛拉G。;狄克逊,凯文R。;Kegelmeyer,W.Philip:彗星:在海量数据上学习和使用大集合的方法(2011)ioport公司