×

使用耦合潜在变量模型进行个体化预测的综合分析。 (英语) 兹伯利1404.68117

总结:复杂的慢性病(如孤独症、狼疮和帕金森氏症)在个体间存在显著的异质性。这种异质性使得护理人员难以进行治疗,因为他们无法准确预测疾病的进展方式,以指导治疗决策。因此,有助于预测这些复杂慢性病发展轨迹的工具可以帮助提高卫生保健质量。为了构建这样的工具,我们可以利用患者首次出现时在基线时收集的临床标记,并在随访期间纵向收集。由于复杂的慢性疾病通常是系统性的,因此纵向标记物通常跟踪多器官系统的疾病进展。在本文中,我们的目标是预测一个时间函数,该函数模拟跟踪感兴趣疾病过程的单目标临床标记物的未来轨迹。我们希望利用许多相关临床标记物的历史作为输入来进行这些预测。我们提出的解决方案解决了几个关键挑战。首先,我们可以轻松处理不规则和稀疏采样的标记,这些标记是临床数据中的标准标记。其次,参数的数量和学习我们模型的计算复杂性随着模型中包含的标记类型的数量线性增长。这使得我们的方法适用于随着时间的推移记录了许多不同标记的疾病。最后,我们的模型解释了影响疾病表达的潜在因素,而标准回归模型仅依赖于观察到的特征来解释变异性。此外,我们的方法可以在连续时间内动态应用,并在任何新数据可用时更新其预测。我们将我们的方法应用于预测硬皮病(一种复杂的自身免疫性疾病)的肺部疾病轨迹问题。我们表明,我们的模型在预测准确性方面优于最先进的基线,并且我们对模型的输出进行了定性分析。最后,硬皮病疾病表现的可变性使得临床试验招募具有挑战性。我们表明,综合多种常规收集的纵向数据的预后工具可用于识别快速进展风险最大的个体,并针对试验招募。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62M40型 随机字段;图像分析
62页第10页 统计学在生物学和医学中的应用;元分析
92 C50 医疗应用(通用)
PDF格式BibTeX公司 XML格式引用
全文: 链接

参考文献:

[1] Y.Allanore、R.Simms、O.Distler、M.Trojanowska、J.Pope、C.P.Denton和J.Varga,《系统性硬化》。《Nature Reviews Disease Primers》,2015年。
[2] G.安德鲁和J.高。l1-正则化对数线性模型的可伸缩训练。在2007年国际机器学习会议(ICML)上。
[3] K.H.Brodersen、F.Gallusser、J.Koehler、N.Remy和S.L.Scott。使用贝叶斯结构时间序列模型推断因果影响。应用统计年鉴,9(1):247–2742015·兹比尔1454.62473
[4] S.Chib和B.H.Hamilton。纵向数据处理模型的半参数贝叶斯分析。《计量经济学杂志》,110(1):67-892002·2017年10月30日
[5] R.Y.Coley、A.J.Fisher、M.Mamawala、H.B.Carter、K.J.Pienta和S.L.Zeger。从多个数据源预测潜在健康状态的贝叶斯层次模型及其在前列腺癌主动监测中的应用。生物计量学,2016年·Zbl 1372.62063号
[6] F.S.Collins和H.Varmus。一项关于精确医学的新倡议。《新英格兰医学杂志》,372(9):793–7952015。32
[7] J.克雷格。复杂疾病:研究和应用。自然教育,1(1):1842008。
[8] A.P.Dempster、N.M.Laird和D.B.Rubin。通过em算法从不完整数据中获得最大似然。英国皇家统计学会杂志。B系列(方法学),第1-38页,1977年·Zbl 0364.62022号
[9] F.Doshi-Velez、Y.Ge和I.Kohane。孤独症谱系障碍中的共病集群:电子健康记录时间序列分析。儿科,133(1):e54–e63,2014年。
[10] R.D“urichen、M.A.F.Pimentel、L.Clifton、A.Schweikard和D.A.Clifton。多元生理时间序列分析的多任务高斯过程。生物医学工程,IEEE汇刊,62(1):314–3222015。
[11] P.H.C Eilers和B.D.Marx。具有b样条和惩罚的灵活平滑。《统计科学》,第89-102页,1996年·Zbl 0955.62562号
[12] J.Friedman、T.Hastie和R.Tibshirani。统计学习的要素。斯普林格,2001年·Zbl 0973.62007号
[13] A.Gelman、J.B.Carlin、H.S.Stern和D.B.Rubin。贝叶斯数据分析。Taylor&Francis,2014年·Zbl 1279.62004号
[14] M.R Hassan和B.Nath。利用隐马尔可夫模型进行股市预测:一种新方法。《智能系统设计与应用》,第五届国际会议,第192–196页。IEEE,2005年。
[15] G.M.James和C.A.Sugar。稀疏采样功能数据的聚类。《美国统计协会杂志》,98(462):397–4082003·Zbl 1041.62052号
[16] D.Khanna、C.H Tseng、N.Farmani、V.Steen、D.E.Furst、P.J.Clements、M.D.Roth、J.Goldin、R.Elashoff、J.R.Seibold、R.Saggar和D.P.Tashkin。硬皮病和间质性肺病患者的肺生理临床过程:硬皮病-肺研究安慰剂组的分析。关节炎与风湿病,63(10):3078–30852011。
[17] S.Kleinberg和G.Hripcsak。生物医学信息学因果推理综述。生物医学信息学杂志,44(6):1102–11122011。
[18] J.M.Lange、R.A.Hubbard、L.Y.T Inoue和V.N.Minin。多州疾病过程和随机信息观察时间的联合模型,应用于电子病历数据。生物计量学,71(1):90-1012015·兹比尔1419.62384
[19] M.L'azaro-Gredilla、S.Varenbergh和N.D.Lawrence。数据关联问题中高斯过程的重叠混合。模式识别,45(4):1386–13952012·Zbl 1231.62179号
[20] D.S.Lee、P.C.Austin、J.L.Rouleau、P.P.Liu、D.Naimark和J.V.Tu。预测因心力衰竭住院患者的死亡率:临床模型的推导和验证。美国医学会杂志,290(19):2581–25872003。33
[21] S.J.G.Lewis、T.Foltynie、A.D.Blackwell、T.W.Robbins、A.M.Owen和R.A.Barker。使用数据驱动方法研究帕金森病早期临床阶段的异质性。神经病学、神经外科与精神病学杂志,76(3):343–3482005。
[22] R.J.A.Little和D.B.Rubin.缺失数据的统计分析。John Wiley&Sons,2014年·Zbl 0665.62004号
[23] Z.Liu和M.Hauskrecht。《临床时间序列预测:走向层次动态系统框架》,《医学中的人工智能》,2014年。
[24] J.L“otvall、C.A.Akdis、L.B.Bacharier、L.Bjermer、T.B.Casale、A.Custovic、R.F.Lemanske、A.J.Wardlaw、S.E.Wenzel和P.A.Greenberger。哮喘内切型:哮喘综合征疾病实体分类的新方法。《过敏与临床免疫学杂志》,127(2):355–360,2011年。
[25] K.P.墨菲。动态贝叶斯网络:表示、推理和学习。加州大学伯克利分校博士论文,2002年。
[26] K.P.墨菲。机器学习:概率的观点。麻省理工学院出版社,2012年·Zbl 1295.68003号
[27] J.B.Oliva、W.Neiswanger、B.P'oczos、E.P.Xing、H.Trac、S.Ho和J.G.Schneider。快速函数到函数回归。在人工智能和统计会议(AISTATS)上,2015年。
[28] C.Proust-Lima、M.S'ene、J.M.G Taylor和H.Jackmin-Gadda。纵向和时间到事件数据的联合潜在类模型:综述。医学研究中的统计方法,23(1):74-902014。
[29] J.A.Quinn、C.K.Williams和N.McIntosh。因子切换线性动力系统应用于生理状态监测。模式分析与机器智能,IEEE汇刊,31(9):1537–15512009。
[30] R.Raina、Y.Shen、A.Mccallum和A.Y.Ng。用杂交生殖/鉴别模型进行分类。《神经信息处理系统进展》,2003年。
[31] J.O.拉姆齐。功能数据分析。威利在线图书馆,2006年。
[32] C.E.拉斯穆森和C.K.威廉姆斯。机器学习的高斯过程。麻省理工学院出版社,2006年·兹比尔1177.68165
[33] D.里佐普洛斯。纵向和时间-事件数据联合模型中的动态预测和预期精度。生物统计学,67(3):819-8292011·Zbl 1226.62124号
[34] D.Rizopoulos和P.Ghosh。多纵向结果和时间-事件的贝叶斯半参数多元联合模型。医学统计,30(12):1366–13802011。
[35] S.Roberts、M.Osborne、M.Ebden、S.Reece、N.Gibson和S.Aigrine。时间序列建模的高斯过程。《皇家学会哲学学报A:数学、物理和工程科学》,371(1984):201105502013。34 ·Zbl 1353.62103号
[36] K.R.Rosenbloom、C.A.Sloan、V.S.Malladi、T.R.Dreszer、K.Learnd、V.M.Kirkup、M.C.Wong、M.Maddren、R.Fang、S.G.Heitner、B.T.Lee、G.P.Barber、R.A.Harte、M.Diekhans、J.C.Long、S.P.Wilder、A.S.Zweig、D.Karolchik、R.M.Kuhn、D.Haussler和W.J.Kent。在UCSC基因组浏览器中编码数据:第5年更新。核酸研究,41(D1):D56–D632013年。
[37] D.B.鲁宾。推断和缺失数据。《生物特征》,63(3):581-5921976年·Zbl 0344.62034号
[38] 萨里亚(S.Saria)和戈登伯格(A.Goldenberg)。亚型:它是什么及其在精确医学中的作用。IEEE智能系统,2015年30月。
[39] P.F.Schulam和S.Saria。利用多分辨率结构对疾病轨迹进行个性化预测的框架。《神经信息处理系统进展》(NIPS),第748-756页,2015年。
[40] P.F.Schulam、F.Wigley和S.Saria。从电子健康数据聚类纵向临床标记轨迹:在表型和内型发现中的应用。在人工智能会议(AAAI)上,2015年。
[41] J.Q.Shi、R.Murray-Smith和D.M.Titterington。回归的分层高斯过程混合。统计与计算,15(1):31-412005。
[42] 史勇强、王斌、E.J.Will和R.M.West。混合效应高斯过程函数回归模型及其在剂量-反应曲线预测中的应用。医学统计,31(26):3165–31772012。
[43] D.P.Tashkin等人。环磷酰胺与安慰剂在硬皮病肺部疾病中的比较。新英格兰医学杂志,354(25):2655–26662006。
[44] J.Varga、C.P.Denton和F.M.Wigley。硬皮病:从发病机制到综合治疗。施普林格科学与商业媒体,2012年。
[45] H.Wang、F.Nie、H.Huang、J.Yan、S.Kim、S.Risacher、A.Saykin和L.Shen。高阶多任务特征学习识别阿尔茨海默病进展预测的纵向表型标记。《神经信息处理系统进展》(NIPS),第1277-1285页,2012年。
[46] Xu Y.Xu和S.Saria。估计个体化治疗反应曲线的贝叶斯非参数方法。arXiv预印arXiv:1608.051822016。
[47] J.Zhou、L.Yuan、J.Liu和J.Ye。预测疾病进展的多任务学习公式。在2011年知识发现和数据挖掘国际会议(KDD)上,第814-822页。35
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。