×

数据科学的光谱方法:统计学视角。 (英语) Zbl 1524.68267号

摘要:光谱方法已经成为从大量、有噪声和不完整的数据中提取信息的一种简单但令人惊讶的有效方法。简而言之,谱方法是指建立在由数据构建的一些适当设计的矩阵的特征值(对应奇异值)和特征向量(对应奇异向量)上的一组算法。在机器学习、成像科学、金融和经济计量建模以及信号处理中发现了多种应用,包括推荐系统、社区检测、排名、结构化矩阵恢复、张量数据估计、关节形状匹配、盲反褶积、金融投资、风险管理、,治疗评估、因果推断等。由于谱方法的简单性和有效性,它不仅被用作一个独立的估计器,而且经常被用来促进其他更复杂的算法来提高性能。
虽然谱方法的研究可以追溯到经典矩阵摄动理论和矩量法,但在过去十年中,借助于集中不等式和非渐近随机矩阵理论,通过统计建模的透镜,在揭开其功效的神秘性方面取得了巨大的理论进展。这本专著旨在从现代统计学的角度对光谱方法进行系统、全面、易懂的介绍,强调其在各种大规模应用中的算法含义。特别是,我们的论述围绕着几个跨越各种应用的中心问题展开:如何表征谱方法在达到统计精度目标水平时的采样效率,以及如何评估它们在面对随机噪声、缺失数据和对抗性腐败时的稳定性?除了传统的(ell_2)摄动分析外,我们还提出了特征空间和奇异子空间的系统(ell_infty)和(ell_2infty})摄动理论,由于强大的“leave-on-out”分析框架,该理论最近才可用。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
62兰特 大数据和数据科学的统计方面
68T09号 数据分析和大数据的计算方面
62-02 与统计有关的研究展览(专著、调查文章)
68-02 与计算机科学有关的研究博览会(专著、调查文章)
PDF格式BibTeX公司 XML格式引用