×

兹马思-数学第一资源

高维分类和总信号指数中的噪声积累。(英语) Zbl 07255067
小结:近年来大数据备受关注。这些数据为科学发现带来了希望,但也给分析带来了挑战。一个潜在的挑战是噪声积累。在本文中,我们探讨了高维群噪声的分类。首先,我们回顾了以前用主成分分析法对噪声积累的评估,得出了与最初确定的不同的判别能力阈值。然后,我们将研究范围扩展到使用三种常用机器学习方法开发的分类器上——随机森林、支持向量机和增强分类树。我们模拟了四种不同信号强度的场景来评估每种方法。在确定噪声积累可能会影响这些分类器的性能之后,我们评估影响它的因素。我们通过改变样本大小、信号强度、与预测数成比例的信号强度以及随机森林分类器的信号幅度进行仿真。这些仿真结果表明,噪声积累会影响使用常用机器学习方法开发的高维分类器的识别能力,这些方法可以通过样本大小、信号强度和信号幅度进行修改。我们开发了测量总信号指数(TSI)来跟踪总信号和噪声累积的趋势。
理学硕士:
68T05型 人工智能中的学习与自适应系统
PDF格式 BibTeX公司 XML 引用
全文: 链接
参考文献:
[1] 利奥·布雷曼。随机森林。机器学习,45(1):5-32,2001·Zbl 1007.68152号
[2] 张志忠,林志珍。LIBSVM:支持向量机库,2011。可用网址:www.csie.ntu.edu.tw/cjlin/libsvm/。
[3] 科琳娜·科尔特斯和弗拉基米尔·瓦普尼克。支持向量机网络。机器学习,20(3):273-2971995·邮政编码:0831.68098
[4] 米丽亚姆·R·埃尔曼。高维分类代码噪声累积,2018年。可在https://github.com/sink-or-swim/noiseacumeration。
[5] 范剑卿。高置信度下大数据和稀疏解的特点。林希红,克里斯汀·根斯特、大卫·L·班克斯、吉尔特·莫伦伯格、大卫·W·斯科特和简·林·王编辑,《统计科学的过去、现在和未来》,第531-548页。查普曼和霍尔/CRC,纽约,纽约,美国,2014年。
[6] 范剑卿和樊莹莹。使用特征退火独立规则的高维分类。统计年鉴,36(6):2605-26372008·Zbl 1360.62327
[7] 范剑卿,方寒,刘汉。大数据分析的挑战。国家科学评论,1(2):293-314,2014。
[8] 陈志明,陈志明,等.加性逻辑回归:提升的统计观点.统计年鉴,28(2):337-4072000·Zbl 1106.62323
[9] 杰罗姆·H·弗里德曼。贪心函数逼近:梯度提升机。统计年鉴,29(5):1189-12322001·Zbl 1043.62034
[10] 彼得·霍尔、伊冯·皮特尔科和马来古什。小样本高维数据分类器相对性能的理论度量。皇家统计学会期刊:B系列(统计方法),70(1):159-1732008·Zbl 1400.62094
[11] 特雷弗·黑斯蒂,罗伯特·蒂比拉尼和杰罗姆·弗里德曼,《统计学习的要素》。统计学中的斯普林格级数。斯普林格,纽约,纽约,美国,2009年·Zbl 1273.62005
[12] 安迪·劳和马修·维纳。《随机森林分类与回归》,R News,2(3):18-22,2002。
[13] 大卫·迈耶、叶夫根尼娅·迪米特里亚杜、库尔特·霍尼克、安德烈亚斯·温格塞尔和弗里德里希·雷什。e1071:统计部其他职能,概率论组(原e1071),图维恩,2015。R程序包版本1.6-6。
[14] R核心团队。R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳,2017年。
[15] G、 Ridgeway.gbm:广义增强回归模型,2017年。R包版本2.1.3。
[16] 徐焕,康斯坦丁·卡拉曼尼斯,谢曼诺。支持向量机的鲁棒性和正则化.机器学习研究杂志,10(7月):1485-1510209·Zbl 1235.68209
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。