×

多模态数据分析的综合因子回归及其推论。 (英语) Zbl 1515.62061号

摘要:多模态数据,即从同一主题收集不同类型数据的数据,在各种科学应用中迅速涌现。因子分析通常用于多模态数据的综合分析,对于克服高维性和高相关性的灾难特别有用。然而,对于基于因子分析的多模态数据监督建模的统计推断工作很少。在本文中,我们考虑一个基于从多模态数据中提取的潜在因素的综合线性回归模型。我们解决了三个重要问题:如何根据模型中的其他模式推断一种数据模式的重要性;如何从一种模态或跨不同模态推断变量组合的重要性;以及如何量化一种数据模式对其他数据模式的贡献,通过拟合优度来衡量。在回答每个问题时,我们都明确地描述了因素分析的好处和额外成本。据我们所知,尽管在综合多模态分析中广泛使用了因子分析,但这些问题尚未得到解决,我们的提案弥补了一个重要差距。我们通过仿真研究了我们的方法的经验性能,并通过多模态神经成像分析进一步加以说明。

MSC公司:

62H25个 因子分析和主成分;对应分析
62页第10页 统计学在生物学和医学中的应用;元分析
92 C55 生物医学成像和信号处理
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿尔茨海默病协会,“阿尔茨海默氏病事实和数字,阿尔茨海姆病和痴呆,14,367-429(2018)
[2] Bai,J。;李凯,“高维因子模型的统计分析”,《统计年鉴》,第40期,第436-465页(2012年)·Zbl 1246.62144号 ·doi:10.1214/11-AOS966
[3] Bai,J。;Ng,S.,“确定近似因子模型中的因子数,计量经济学,70191-221(2002)·兹比尔1103.91399 ·数字对象标识代码:10.1111/1468-0262.00273
[4] 陈,J。;Chen,Z.,“大模型空间模型选择的扩展贝叶斯信息标准,生物特征,95759-771(2008)·Zbl 1437.62415号 ·doi:10.1093/biomet/asn034
[5] 切尔诺朱科夫,V。;Chetverikov,D。;Kato,K.,“高维随机向量和最大值的高斯近似和乘数自举法,统计年鉴,412786-2819(2013)·Zbl 1292.62030 ·doi:10.1214/13-AOS1161
[6] Cai,T.T。;郭忠,《高维线性回归的置信区间:极小极大率和适应性》,《统计年鉴》,45615-646(2017)·Zbl 1371.62045号
[7] Cai,T.T。;马,Z。;Wu,Y.,“稀疏主成分分析:最优速率和自适应估计”,《统计年鉴》,第41期,第3074-3110页(2013年)·Zbl 1288.62099号
[8] Echávarri,C。;阿尔滕,P。;尤林斯,H.B。;雅各布斯,H.I。;维瑟,P.J。;Gronenschild,E.H。;Verhey,F.R。;Burgmans,S.,“海马旁回萎缩是阿尔茨海默病的早期生物标志物,脑结构和功能,215265-271(2011)·doi:10.1007/s00429-010-0283-8
[9] 范,J。;郭,S。;Hao,N.,“超高维回归中使用重新拟合交叉验证的方差估计”,《皇家统计学会杂志》,B辑,74,37-65(2012)·Zbl 1411.62199号 ·文件编号:10.1111/j.1467-9868.2011.01005.x
[10] 范,J。;Ke,Y。;Wang,K.,“因子调整正则化模型选择”,arXiv:1612.08490(2016)
[11] 范,J。;Liao,Y。;Mincheva,M.,“通过阈值主正交补体进行大协方差估计,皇家统计学会期刊,B辑,75,603-680(2013)·Zbl 1411.62138号 ·doi:10.1111/rssb.12016
[12] 范,J。;Lv,J.,“NP维度的非凹惩罚似然”,信息理论,IEEE汇刊,575467-5484(2011)·Zbl 1365.62277号 ·doi:10.1109/TIT.2011.2158486
[13] 加伊纳诺娃,I。;Li,G.,“多视图数据的结构学习和集成分解,生物统计学,75,1121-1132(2019)·Zbl 1448.62163号 ·doi:10.1111/biom.13108
[14] Greene,S.J。;Killiany,R.J.,“顶叶下叶亚区在阿尔茨海默病进展中受到影响,衰老的神经生物学,311304-1311(2011)·doi:10.1016/j.neurobiolaging.2010.04.026
[15] 爪哇马德,A。;Lee,J.D.,“高维假设检验的灵活框架,皇家统计学会期刊,B辑,82,685-718(2020)·Zbl 07554770号 ·doi:10.1111/rssb.12373
[16] Javanmard,A。;Montanari,A.,“高维回归的置信区间和假设检验”,《机器学习研究杂志》,第15期,第2869-2909页(2014年)·Zbl 1319.62145号
[17] Kneip,A。;Sarda,P.,“高维回归分析中的因子模型和变量选择,统计年鉴,392410-2447(2011)·Zbl 1231.62131号 ·doi:10.1214/11-AOS905
[18] 克鲁姆,S。;Kivisaari,S.L。;Probst,A。;Monsch,A.U。;莱因哈特,J。;Ulmer,S。;斯蒂皮奇,C。;克雷西格·R·W。;Taylor,K.I.,《极早期阿尔茨海默病中海马旁亚区的皮层变薄》,衰老的神经生物学,38,188-196(2016)·doi:10.1016/j.neurobiolaging.2015.11.001
[19] 李·G。;Gaynanova,I.,“异构数据关联分析的通用框架,应用统计学年鉴,121700-1726(2018)·Zbl 1405.62068号 ·doi:10.1214/17-AOAS1127
[20] 李·G。;Jung,S.,“将协变量纳入多视角数据的综合因子分析,生物统计学,731433-1442(2017)·Zbl 1405.62188号 ·doi:10.1111/biom.12698
[21] 李·G。;刘,X。;Chen,K.,“综合多视图降秩回归:桥接群体分析和低秩模型,生物计量学,75,593-602(2018)·Zbl 1436.62588号 ·doi:10.111/生物量13006
[22] 李强。;Cheng,G。;范,J。;Wang,Y.,“拥抱因子模型中维度的祝福,美国统计协会杂志,113,380-389(2018)·Zbl 1398.62137号 ·doi:10.1080/01621459.2016.1256815
[23] 李毅。;Wu,F.-X。;Ngom,A.,“多视图生物数据集成的机器学习原理综述”,《生物信息学简报》,19,325-340(2016)
[24] 锁,E.F。;霍德利,K.A。;Marron,J.S。;Nobel,A.B.,“多数据类型综合分析中的联合和个体变异解释(JIVE)”,《应用统计年鉴》,第7523-542页(2013年)·Zbl 1454.62355号 ·doi:10.1214/12-AOAS597
[25] 锁,E.F。;Li,G.,“监管多重因子分解”,《电子统计杂志》,121150(2018)·兹比尔1388.62176 ·doi:10.1214/18-EJS1421
[26] 林奇,M。;Walsh,B.,《数量性状的遗传学和分析》,1(1998年),马萨诸塞州桑德兰:西诺联合公司,马萨诸纳州桑德兰
[27] Ma,Z.,“稀疏主成分分析和迭代阈值”,《统计年鉴》,第41期,第772-801页(2013年)·Zbl 1267.62074号 ·doi:10.1214/13-AOS1097
[28] 宁,Y。;Liu,H.,“稀疏高维模型的假设检验和置信域的一般理论”,《统计学年鉴》,45,158-195(2017)·Zbl 1364.62128号 ·doi:10.1214/16-AOS1448
[29] 北卡罗来纳州帕里赫。;Boyd,S.,《优化中的近似算法、基础和趋势》,1127-239(2014)·数字对象标识代码:10.1561/24000003
[30] Raskutti,G。;Wainwright,M.J。;Yu,B.,球上高维线性回归的最小极大估计率,IEEE信息理论汇刊,576976-6994(2011)·Zbl 1365.62276号
[31] 理查森,S。;曾,G.C。;Sun,W.,“综合基因组学中的统计方法,统计及其应用年度回顾,3181-209(2016)·doi:10.1146/annurev-statistics-041715-033506
[32] 沈,R。;王,S。;Mo,Q.,“多Omics数据集的稀疏综合聚类,应用统计学年鉴,7,269-294(2013)·Zbl 1454.62398号 ·doi:10.1214/12-AOAS578
[33] 施,C。;宋,R。;陈,Z。;Li,R.,“高维广义线性模型的线性假设检验,统计年鉴(2019)·Zbl 1436.62355号 ·doi:10.1214/18-AOS1761
[34] Shu,H。;王,X。;Zhu,H.,“D-CCA:高维数据集的基于分解的典型相关分析,美国统计协会杂志,115,292-306(2020)·Zbl 1437.62211号 ·doi:10.1080/01621459.2018.1543599
[35] Sun,T。;Zhang,C.-H.,“用标度拉索进行稀疏矩阵反演”,《机器学习研究杂志》,14,3385-3418(2013)·Zbl 1318.62184号
[36] Tibshirani,R.,“通过拉索进行回归收缩和选择,皇家统计学会期刊,B辑,58,267-288(1996)·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x
[37] K.乌卢达格。;Roebroeck,A.,“多模神经影像数据融合优点概述,神经影像,102,3-10(2014)·doi:10.1016/j.neuroimage.2014.05.018
[38] Van de Geer,S。;Bühlmann,P。;Ritov,Y。;Dezeure,R.,“关于高维模型的渐近最优置信区和检验,统计年鉴,4211166-1202(2014)·Zbl 1305.62259号 ·doi:10.1214/14-AOS1221
[39] Van der Vaart,A.W.,《渐进统计》,3(2000),英国剑桥:剑桥大学出版社,英国剑桥·Zbl 0910.62001号
[40] 薛凤。;Qu,A.,在模型选择中整合多源区块缺失数据,美国统计协会杂志(2020年)
[41] 杨,Z。;Michailidis,G.,“检测异质Omics多模态数据中模块的非负矩阵分解方法”,生物信息学,32,1-8(2015)
[42] Zhang,C.-H.,“最小凹板惩罚下的几乎无偏变量选择,统计年鉴,38894-942(2010)·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[43] 张,C.-H。;Zhang,S.S.,“高维线性模型中低维参数的置信区间”,《皇家统计学会杂志》,B辑,76,217-242(2014)·Zbl 1411.62196号 ·doi:10.1111/rssb.12026
[44] 张博士。;Wang,Y。;周,L。;袁,H。;沈博士。;阿尔茨海默病神经成像倡议,“阿尔茨海默氏病和轻度认知障碍的多模式分类,神经影像,55,856-867(2011)·doi:10.1016/j.neuroimage.2011.01.008
[45] Zhang,Y。;Tang,N。;Qu,A.,“高维区块缺失数据的估算因子回归”,《中国统计》,第30期,第631-651页(2020年)·Zbl 1439.62233号 ·doi:10.5705/ss.202018.0008
[46] 朱,Y。;Bradic,J.,“测试一般高维假设的投影寻踪框架”,arXiv预印本1705.01024(2017)
[47] 朱,Y。;Bradic,J.,“密集高维线性模型中的线性假设检验”,美国统计协会杂志,113,1583-1600(2018)·兹比尔1409.62139
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。