×

用潜在混合高斯copula模型分解混合变量的变化。 (英语) Zbl 1522.62186号

摘要:许多生物医学研究从多组受试者收集混合类型变量的数据。其中一些研究旨在发现所有这些变量之间的群体特异性和共同变异。尽管以前的一些工作已经研究过类似的问题,但他们的方法主要依赖于皮尔逊相关性,无法处理混合数据。为了解决这个问题,我们提出了一个潜在的混合高斯copula(LMGC)模型,该模型可以在一个统一的框架中量化二进制、序数、连续和截断变量之间的相关性。我们还提供了一个工具,通过求解正则化\(M\)-估计问题。我们进行了大量的仿真研究,以显示我们提出的方法相对于基于皮尔逊相关的方法的优势。我们还证明,通过联合求解多组上的(M)-估计问题,我们的方法比逐组分解变异更好。我们还将我们的方法应用于沙眼衣原体生殖道感染研究,以证明如何利用它来发现区分患者的信息性生物标记物。
{©2022国际生物识别学会。}

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ahn,S.C.和Horenstein,A.R.(2013)因子数量的特征值比率测试。《计量经济学》,811203-1227·Zbl 1274.62403号
[2] Alter,O.,Brown,P.O.和Botstein,D.(2003)两种不同生物体基因组表达数据集比较分析的广义奇异值分解。《美国国家科学院院刊》,1003351-3356。
[3] Amar,D.、Safer,H.和Shamir,R.(2013)《通过差异共表达改变疾病中调控网络的剖析》。PLoS计算生物学,9,e1002955。
[4] Andrew,D.W.,Cochrane,M.,Schripsema,J.H.,Ramsey,K.H.,Dando,S.J.,O'Meara,C.P.等人(2013)IL-17敲除小鼠的muridarum衣原体生殖道感染持续时间和相关的慢性病理变化减少,但免疫并没有进一步增加保护作用。公共图书馆One,8,e76664。
[5] Candès,E.J.和Recht,B.(2009)通过凸优化实现精确矩阵补全。计算数学基础,9717-772·Zbl 1219.90124号
[6] Candès,E.J.和Tao,T.(2010)凸松弛的力量:近最优矩阵完成。IEEE信息理论汇刊,562053-2080·Zbl 1366.15021号
[7] Choi,Y.和Kendziorski,C.(2009)基因集共表达分析的统计方法。生物信息学,252780-2786。
[8] Darville,T.、Albritton,H.L.、Zhong,W.、Dong,L.、O'Connell,C.M.、Poston,T.B.等人(2019)抗衣原体IgG和IgA不足以预防女性子宫内膜衣原体感染,抗衣原体抗体IgG的增加与偶发感染的风险增加相关。美国生殖免疫学杂志,81,e13103。
[9] De Vito,R.、Bellio,R.,Trippa,L.和Parmigiani,G.(2019)多研究因素分析。生物统计学,75,337-346·Zbl 1436.62538号
[10] Fan,J.,Liu,H.,Ning,Y.和邹,H.(2017)混合数据的高维半参数潜在图形模型。英国皇家统计学会杂志:B辑,79,405-421·Zbl 1414.62179号
[11] Feng,Q.,Jiang,M.,Hannig,J.和Marron,J.(2018)解释了基于角度的联合和个体变异。多元分析杂志,166,241-265·Zbl 1408.62113号
[12] Feng,H.和Ning,Y.(2019)有序数据的高维混合图形模型:参数估计和统计推断。载:《第二十二届国际人工智能与统计会议论文集》,第89卷,第654-663页。
[13] Ha,M.J.,Baladadayuthapani,V.和Do,K.-A。(2015)DINGO:基因组学中的差异网络分析。生物信息学,313413-3420·Zbl 1335.46011号
[14] Huang,M.,Müller,C.L.和Gaynanova,I.(2021)latentcor:估计混合数据类型潜在相关性的R包。开源软件杂志,6,3634-3638。
[15] Iwakura,Y.和Ishigame,H.(2006)炎症中的IL-23/IL-17轴。临床研究杂志,1161218-1222。
[16] Keates,S.、Han,X.、Kelly,C.P.和Keates、A.C.(2007)巨噬细胞炎性蛋白-3α通过金属蛋白酶依赖性释放角蛋白介导Caco‐2结肠上皮细胞中表皮生长因子受体反式激活和ERK1/2 MAPK信号。免疫学杂志,1788013-8021。
[17] Kivia,N.、Wolner‐Hanssen,P.、Eschenbach,D.、Wasserheit,J.、Paavonen,J.和Bell,T.等人(1990),经培养证实的上生殖道感染和腹腔镜诊断的急性输卵管炎患者的子宫内膜组织病理学。美国外科病理学杂志,14,167-175。
[18] Lam,C.和Yao,Q.(2012)高维时间序列的因子建模:因子数量推断。《统计年鉴》,40694-726·Zbl 1273.62214号
[19] Li,G.和Gaynanova,I.(2018)异质数据关联分析的一般框架。应用统计学年鉴,1217000-1726·兹比尔1405.62068
[20] Lijek,R.S.、Helble,J.D.、Olive,A.J.、Seiger,K.W.和Starnbach,M.N.(2018)沙眼衣原体感染后的病理学是由不同于保护性人群的非保护性免疫细胞驱动的。《美国国家科学院院刊》,115,2216-2221。
[21] Liu,H.,Lafferty,J.和Wasserman,L.(2009)《非规范:高维无向图的半参数估计》。机器学习研究杂志,102295-2328·Zbl 1235.62035号
[22] Lock,E.F.、Hoadley,K.A.、Marron,J.S.和Nobel,A.B.(2013年),多数据类型综合分析的联合和个体差异解释(JIVE)。应用统计年鉴,7523-542·Zbl 1454.62355号
[23] Löfstedt,T.和Trygg,J.(2011)OnPLS-一种用于预测和正交变化建模的新型多块方法。化学计量学杂志,25,441-455。
[24] Marino,J.、Furmento,V.A.、Zotta,E.和Roguin,L.P.(2009)粒细胞集落刺激因子的瘤周给药可诱导小鼠乳腺癌的凋亡反应。癌症生物学与治疗,81737-1743。
[25] Mazumder,R.、Hastie,T.和Tibshirani,R.(2010)学习大型不完备矩阵的谱正则化算法。机器学习研究杂志,112287-2322·Zbl 1242.68237号
[26] Nastase,M.V.、Zeng‐Brouwers,J.、Beckmann,J.,Tredup,C.、Christen,U.、Radeke,H.H.等人(2018)Biglycan,Th1和Th17细胞募集到肾脏的新触发因素。矩阵生物学,68,293-317。
[27] Ponnapalli,S.P.、Saunders,M.A.、Van Loan,C.F.和Alter,O.(2011)用于比较多种生物体的全球mRNA表达的高阶广义奇异值分解。公共科学图书馆One,6,e28072。
[28] Poston,T.B.,Lee,D.E.,Darville,T.,Zhong,W.,Dong,L.,O'Connell,C.M.等人(2019)与沙眼衣原体敏感性和保护相关的宫颈细胞因子。《传染病杂志》,220330-339。
[29] Quan,X.、Booth,J.G.和Wells,M.T.(2018)基于排名的方法,用于估计混合序数数据中的相关性。arXiv预印arXiv:1809.06255。
[30] Rahmatallah,Y.、Emmert‐Streib,F.和Glazko,G.(2014)《基因集净相关分析:基因集的多元差异共表达测试》。生物信息学,30360-368。
[31] Rangel‐Moreno,J.、Carragher,D.M.、de laLuz Garcia‐Hernandez,M.、Hwang,J.Y.、Kusser,K.、Hartson,L.等人(2011)诱导性支气管相关淋巴组织的发育依赖于IL-17。《自然免疫学》,第12639-646页。
[32] Russell,A.N.,Zheng,X.,O'Connell,C.M.,Taylor,B.D.,Wiesenfeld,H.C.,Hillier,S.L.等人(2016)《沙眼衣原体生殖道感染驱动因素和上升感染因素分析及血清抗体在沙眼衣藻感染中的作用》。传染病杂志,213523-531。
[33] Shabalin,A.A.(2012)矩阵eQTL:通过大型矩阵运算进行超快速eQTL-分析。生物信息学,281353-1358。
[34] Shin S.Y.、Lee D.H.、Lee J.、Choi C.、Kim J.Y.、。,Nam,J.‐S。等(2017)C‐C基序趋化因子受体1(CCR1)是乳腺癌细胞EGF‐AKT‐mTOR‐STAT3信号轴的靶点。Oncotarget,8,94591-94605。
[35] Shu,H.,Wang,X.和Zhu,H.(2020)D‐CCA:高维数据集的基于分解的典型相关分析。美国统计协会杂志,115,292-306·兹比尔1437.62211
[36] Tesson,B.M.,Breitling,R.和Jansen,R.C.(2010)DiffCoEx:一种寻找差异共表达基因模块的简单而灵敏的方法。BMC生物信息学,11497-505。
[37] Tibshirani,R.(1996)通过套索进行回归收缩和选择。英国皇家统计学会杂志:B辑,58267-288·Zbl 0850.62538号
[38] vanDam,S.、Vosa,U.、van derGraaf,A.、Franke,L.和deMagalhaes,J.P.(2018)功能分类和基因疾病预测的基因共表达分析。生物信息学简报,19575-592。
[39] Watson,M.(2006)CoXpress:基因表达数据中的差异共表达。BMC生物信息学,7509-520。
[40] Yoon,G.,Carroll,R.J.和Gaynanova,I.(2020)混合类型数据的稀疏半参数典型相关分析。生物特征,107,609-625·Zbl 1451.62051号
[41] Yoon,G.和Gaynanova,I.(2021)混合CCA:高维混合数据的稀疏典型相关分析。R软件包版本1.4.6。
[42] Zhao,T.,Roeder,K.和Liu,H.(2014)基于秩的正半定相关矩阵估计及其在半参数图估计中的应用。计算与图形统计杂志,23895-922。
[43] Zhong,W.,Dong,L.,Poston,T.B.,Darville,T.,Spracklen,C.N.,Wu,D.等人(2020)使用有向非循环图从混合观测数据推断监管网络。遗传学前沿,11,8。
[44] Zhou,G.,Cichocki,A.,Zhang,Y.和Mandic,D.P.(2015)多块数据的组分分析:常见和个别特征提取。IEEE神经网络和学习系统汇刊,27,2426-2439。
[45] Zhu,H.,Li,G.和Lock,E.F.(2020)具有块缺失结构的多类型数据的广义综合主成分分析。生物统计学,21,302-318。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。