主页

论文

提交

新闻

编辑部

诉讼

开源软件

搜索

统计

登录

常见问题解答

联系我们



RSS源

高维分类中的噪声积累与总信号指数

米丽亚姆·R·埃尔曼、杰西卡·米尼耶、张晓慧、崔东色; 21(36):12020年12月23日。

摘要

近年来,大数据越来越受到重视。这些数据为科学发现带来了希望,但也给分析带来了挑战。一个潜在的挑战是噪声积累。本文研究了高维两群分类中的噪声积累问题。首先,我们回顾了以前用主成分分析法对噪声积累的评估,得出了与最初确定的不同的判别能力阈值。然后我们将研究范围扩展到使用三种常用机器学习方法开发的分类器上——随机森林、支持向量机和增强分类树。我们模拟了四种不同信号强度的场景来评估每种方法。在确定噪声积累可能会影响这些分类器的性能之后,我们评估影响它的因素。我们通过改变样本大小、信号强度、与预测数成比例的信号强度以及随机森林分类器的信号幅度进行仿真。这些仿真结果表明,噪声积累会影响使用常用机器学习方法开发的高维分类器的识别能力,这些方法可以通过样本大小、信号强度和信号幅度进行修改。我们开发了测量总信号指数(TSI)来跟踪总信号和噪声累积的趋势。

[腹肌][pdf格式][围兜]      [代码]
©JMLR公司2020(编辑,贝塔)