摘要
最近的证据强调了DNA甲基化(DNAm)生物标记物在流行病学研究和随机试验中作为暴露于非传染性疾病风险因素的替代物的有用性。DNAm变异性已被证明与生活方式行为和暴露于环境风险因素密切相关,最终为个人健康状态提供了一个公正的代表。目前,DNAm替代物的创建依赖于单变量惩罚回归模型,而弹性网络正则化器是完成任务的金标准。然而,在研究样本中存在结构依赖模式的多变量结果时,需要更先进的建模程序。在这项工作中,我们提出了一个在高维预测因子存在下混合效应多任务学习的一般框架,以从多中心研究中开发出多元DNAm生物标记物。基于期望最大化算法,设计了一种惩罚估计方案,在拟合过程中可以方便地纳入固定效应模型的任何惩罚准则。我们应用所提出的方法创建新的DNAm替代生物标记物,用于心血管疾病和共病的多个相关风险因素。我们表明,提出的方法将多个结果建模在一起,在预测能力和结果的生物分子解释方面都优于最先进的替代方法。
致谢
作者感谢三位匿名审稿人、主编和副主编对原稿的全面审查以及他们宝贵的建设性意见。他们的投入大大提高了工作质量。作者还感谢EPIC意大利研究小组(Carlotta Sacerdote、Vittorio Krogh、Domenico Palli、Salvatore Panico、Rosario Tumino、Paolo Vineis及其合作者)提供了本研究中使用的数据。Francesca Ieva承认她与Human Technopole的关系(https://humantechopole.it/en/)担任健康数据科学中心副主任(francesca.ieva@fht.org).
引用
下载引文
安德烈亚·卡波佐(Andrea Cappozzo)。
弗朗西丝卡·伊娃。
乔瓦尼·菲奥里托。
“惩罚混合效应多任务学习的一般框架,以及DNA甲基化替代生物标记创建的应用。”
附录申请。斯达。
17
(4)
3257 - 3282,
2023年12月。
https://doi.org/10.1214/23-AOAS1760
问询处
收到日期:2022年4月1日;修订日期:2023年2月1日;发布日期:2023年12月
首次在欧几里得项目中提供:2023年10月30日
数字对象标识符:10.1214/23-AOAS1760
关键词:EM算法,混合效应模型,多任务学习,多元回归,惩罚估计,个性化医疗
版权所有©2023数学统计研究所