×

彗星

swMATH ID: 22899
软件作者: Basilico,J.D.、Munson,M.A.、Kolda,T.G.、Dixon,K.R.和Kegelmeyer,W.P。
描述: COMET:在海量数据上学习和使用大型集成的秘诀。COMET是一种用于大规模数据学习的单程MapReduce算法。它在分布式数据块上构建多个随机森林集合,并将它们合并为一个大型集合。当从单个机器上无法容纳的大规模数据中学习时,这种方法是合适的。为了获得最佳的准确性,应该使用IVoting而不是bagging来为随机森林中的每个决策树生成训练子集。使用两个大型数据集(5GB和50GB压缩)进行的实验表明,COMET在准确性和训练时间方面都优于使用串行算法对数据子样本进行学习。最后,我们提出了一种新的高斯延迟集成评估方法,该方法动态决定每个数据点要评估的集成成员数量,这可以将评估成本降低100倍或更多。
主页: https://ieeexplore.ieee.org/document/6137208/
相关软件: 随机森林;UCI-毫升;TensorFlow公司;GeneSrF公司;巴蒂;贝叶斯树;github;VSURF公司;Scikit公司;ggplot2;阿达·布斯特。MH公司
引用于: 2文件

标准条款

1出版物描述软件 年份
COMET:在海量数据上学习和使用大型信号群的方法
贾斯汀·巴西利科(Justin D.Basilico)。;Munson,M.Arthur;塔马拉·科尔达(Tamara G.Kolda)。;凯文·狄克逊(Kevin R.Dixon)。;W.Philip Kegelmeyer
2011

按年份列出的引文