×

因子分析中的非线性相互作用聚类。 (英语) Zbl 1458.62124号

摘要:因子分析是多元研究中降维的有力工具。本研究扩展了具有非线性相互作用的因子模型。我们工作的主要贡献是提出两种方法来聚类非线性相互作用,从而开发出新的模型,这些模型不限于所有非零相互作用不同或相同的极端场景。处理集群的第一个策略涉及退化组件的有限混合。第二个选项是通过Dirichlet进程指定的。开发了一项全面的模拟研究,以探索提案的性能。进行灵敏度分析,以评估估计高斯过程协方差函数中定义的平滑参数的优点,该函数建立了相互作用的非线性。在应用方面,通过分析与四个乳腺癌数据集相关的基因表达水平来说明该方法。属于不相交基因组区域的基因,具有拷贝数改变,与主因子相连,并估计和聚类它们的非线性相互作用。文献中很少发现这四个乳腺癌数据集的相互调查和比较。

MSC公司:

62H25个 因子分析和主成分;对应分析
62H30型 分类和区分;聚类分析(统计方面)
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Affymetrix:统计算法参考指南。Affymetrix技术报告(2001年)。http://tools.thermofisher.com/content/sfs/brouchsuals/statistical_reference_guide.pdf。2020年7月3日访问
[2] MC卡瓦略;Chang,J。;卢卡斯,JE;内文斯,JR;王,Q。;West,M.,《高维稀疏因子建模:在基因表达基因组学中的应用》,美国统计协会,103,1438-1456(2008)·Zbl 1286.62091号 ·doi:10.1198/0162145000000869
[3] Chin,K。;De Vriers,S。;Fridlyand,J。;斯佩尔曼,PT;罗伊达斯古普塔,R。;Kuo,WL;拉普克,A。;Neve,RM;钱,Z。;Ryder,T。;陈,F。;费勒,H。;东京都。;Esserman,L。;Albertson,DG;FM沃尔德曼;Gray,JW,《与乳腺癌病理生理相关的基因组和转录异常》,《癌症细胞》,10529-541(2006)·doi:10.1016/j.ccr.2006.10.009
[4] Eddelbuettel,D.,《无缝R和C++与Rcpp的集成》(2013),纽约:Springer,纽约·Zbl 1283.62001号
[5] Eddelbuettel,D.,Francois,R.:Rcpp:无缝R和C++集成。J.统计软件。40(8), 1-18 (2011). http://www.jstatsoft.org/v40/i08/。2020年7月3日处理
[6] Eddelbuettel,D。;Sanderson,C.,RcppArmadillo:使用高性能C++线性代数加速R,计算。统计数据分析。,71, 1054-1063 (2014) ·Zbl 1471.62055号 ·doi:10.1016/j.csda.2013.02.005
[7] Gamerman,D。;Lopes,HF,马尔可夫链蒙特卡罗:贝叶斯推断的随机模拟(2006),博卡拉顿:查普曼和霍尔/CRC,博卡拉通·Zbl 1137.62011年
[8] Gelman,A。;卡林,JB;斯特恩,HS;邓森,DB;Vehtari,A.公司。;罗宾,DB,贝叶斯数据分析(2013),博卡拉顿:查普曼和霍尔/CRC,博卡拉顿
[9] Geman,S。;Geman,D.,《随机松弛、吉布斯分布和图像的贝叶斯恢复》,IEEE Trans。模式分析。机器。整数。,6, 721-741 (1984) ·Zbl 0573.62030号 ·doi:10.1109/TPAMI.1984.4767596
[10] 黑斯廷斯,WK,使用马尔可夫链的蒙特卡罗采样方法及其应用,《生物特征》,57,97-109(1970)·Zbl 0219.65008号 ·doi:10.1093/biomet/57.1.97
[11] 虹膜,RA;霍布斯,B。;科林,F。;Beazer-Barclay,YD;安东内利斯,KJ;谢尔夫,美国。;高密度寡核苷酸阵列探针水平数据的速度、TP、探索、归一化和总结,生物统计学,4249-264(2003)·Zbl 1141.62348号 ·doi:10.1093/biostatistics/4.2.249
[12] Ishwaran,H。;James,L.,Gibbs《破胶前的取样方法》,美国统计协会,96,161-173(2001)·Zbl 1014.62006年 ·doi:10.1198/016214501750332758
[13] 约翰逊,RA;Wichern,DW,应用多元统计分析(2007),《上鞍河:皮尔逊/普伦蒂塞尔霍尔》,上鞍河·Zbl 1269.62044号
[14] 卢卡斯,JE;卡瓦略,C。;王,Q。;图片,A。;尼文斯,JR;韦斯特,M。;穆勒,KDP;Vannucci,M.,基因表达基因组学中的稀疏统计建模,基因表达和蛋白质组学的贝叶斯推断,155-176(2006),剑桥:剑桥大学出版社,剑桥·Zbl 1182.62050
[15] JE卢卡斯;龚,HN;Chin,JT,基因组生物标记物的交叉研究预测:癌症基因组学评估,PLoS Compute。生物,6,e1000920(2010)·doi:10.1371/journal.pcbi.1000920
[16] 弗吉尼亚州梅林克;Lucas,JE,具有交互作用的稀疏潜在因子模型:基因表达分析,Ann.Appl。Stat.,7,2,799-822(2013)·Zbl 1288.62164号 ·doi:10.1214/12-AOAS607
[17] 弗吉尼亚州梅林克;Lucas,JE,《带交互作用的稀疏潜在因子模型的补充:基因表达分析》,Ann.Appl。统计(2013)·doi:10.1214/12-AOAS607SUPP文件
[18] 弗吉尼亚州梅林克;Lucas,JE,检测基因表达数据中相干模式的贝叶斯因子模型,Braz。J.遗嘱认证。统计,29,1,1-33(2015)·兹比尔1329.92089 ·doi:10.1214/13-BJPS226
[19] 北卡罗来纳州大都会。;罗森布鲁斯,AW;明尼苏达州罗森布鲁斯;出纳员,AH;Teller,E.,《快速计算机器的状态方程计算》,J.Chem。物理。,21, 1087-1092 (1953) ·Zbl 1431.65006号 ·数字对象标识代码:10.1063/1.1699114
[20] DL米勒;Smeds,J。;乔治,J。;织女星,VB;Vergara,L。;Ploner,A。;帕维坦,Y。;霍尔,P。;克拉尔,S。;刘,ET;Bergh,J.,人类乳腺癌中p53状态的表达特征预测突变状态、转录效应和患者生存,Proc。国家。阿卡德。科学。美国,11213550-13555(2005)·doi:10.1073/pnas.0506230102
[21] 波拉克,JR;Sorlie,T。;佩罗,CM;加利福尼亚州里斯;SS杰弗里;朗宁,PE;Tibshirani,R。;博茨坦,D。;戴尔,ALB;Brown,PO,微阵列分析揭示了DNA拷贝数改变在人类乳腺肿瘤转录程序中的主要直接作用,Proc。国家。阿卡德。科学。美国,99,20,12963-12968(2002)·doi:10.1073/pnas.162471999
[22] R核心团队:R:统计计算语言和环境。R统计计算基金会,维也纳(2020年)。http://www.r-project.org/。2020年7月3日访问
[23] 罗伯茨,GO;Gelman,A。;Gilks,WR,随机游走Metropolis算法的弱收敛性和最优尺度,Ann.Appl。概率。,7, 1, 110-120 (1997) ·Zbl 0876.60015号 ·doi:10.1214/aoap/1034625254
[24] 马里兰州鲁埃达;Uriarte,RD,灵活准确地检测aCGH的基因组拷贝数变化,PLoS Compute。生物学,3,6,e122(2007)·doi:10.1371/journal.pcbi.0030122
[25] Sethuraman,J.,Dirichlet过程先验的建设性定义,Stat.Sin。,2, 639-650 (1994) ·兹比尔0823.62007
[26] Sotiriou,C。;Wirapati,P。;Loi,S。;A.哈里斯。;福克斯,S。;Smeds,J。;诺德格伦,H。;农民,P。;普拉兹,V。;凯恩斯,伯克希尔哈撒韦;Desmedt,C。;Larsimont博士。;卡多佐,F。;彼得斯,H。;Nuyten,D。;Buyse,M。;Vijver,MJVD;J.Bergh。;皮卡特,M。;Delorenzi,M.,《乳腺癌基因表达谱分析:了解组织学分级的分子基础以改善预后》,J.Natl。癌症研究所,98,262-272(2006)·doi:10.1093/jnci/djj052
[27] 施皮格尔(Spiegelhalter),DJ;最佳,NG;范德林德,BPCA,模型复杂性和拟合的贝叶斯度量,J.R.Stat.Soc.Ser。B、 64、583-639(2002)·Zbl 1067.62010年 ·数字对象标识代码:10.1111/1467-9868.00353
[28] 王,Y。;Klijn,JGM;Zhang,Y。;Sieuwert,AM;看,议员;杨,F。;塔兰托夫,D。;蒂默曼斯,M。;盖尔德,MEMV;Jatkoe,T。;EMJJ伯恩斯;阿特金斯,D。;Foekens,JA,预测淋巴结阴性原发性乳腺癌远处转移的基因表达谱,柳叶刀,365671-679(2005)·doi:10.1016/S0140-6736(05)17947-1
[29] Watanabe,S.,Bayes交叉验证的渐近等价性和奇异学习理论中广泛适用的信息准则,J.Mach。学习。第11号决议,3571-3594(2010年)·Zbl 1242.62024号
[30] 韦斯特,M。;Bernardo,J。;巴亚里,M。;J.伯杰。;Dawid,A。;赫克曼,D。;A.史密斯。;West,M.,大p,小n范式中的贝叶斯因子回归模型,贝叶斯统计,723-732(2003),牛津:牛津大学出版社,牛津
[31] 吴,Z。;虹膜,RA;R先生。;穆里略,FM;Spencer,F.,《寡核苷酸表达阵列的基于模型的背景调整》,美国统计协会,99,909-917(2004)·Zbl 1055.62129号 ·doi:10.1198/016214500000683
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。