×

鲁比克

swMATH ID: 30094
软件作者: Y.Wang、R.Chen、J.Ghosh、J.C.Denny、A.Kho、Y.Chen、B.A.Malin、J.Sun
描述: Rubik:健康数据分析的知识引导张量分解和完成。计算表型是将异构电子健康记录(EHR)转换为有意义的临床概念的过程。无监督表型分析方法有潜力利用大量标记EHR数据进行表型发现。然而,现有的无监督表型分析方法并没有结合当前的医学知识,无法直接处理缺失或噪声数据。我们提出了Rubik,一种用于表型分析的约束非负张量因子分解和完成方法。Rubik包含了1)指导约束以与现有医学知识保持一致,以及2)成对约束以获得不同的、不重叠的表型。Rubik还具有内置的张量补全功能,可以显著减轻噪声和缺失数据的影响。我们利用乘数交替方向法(ADMM)框架进行张量分解和完成,这可以通过并行计算轻松缩放。我们在两个EHR数据集上评估了Rubik,其中一个包含7744名门诊患者的647118条记录,另一个是包含472645名患者的1018614条CMS索赔记录的公共数据集。我们的结果表明,与基线相比,Rubik可以发现更多有意义和独特的表型。特别是,通过使用知识指导约束,Rubik还可以发现几种主要疾病的亚表型。Rubik的运行速度也是当前最先进的张量方法的7倍左右。最后,Rubik可扩展到包含数百万EHR记录的大型数据集。
主页: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6709413/
相关软件: SDPLR公司Genten公司githubMatlab公司DFacTo公司分裂弗罗斯特理想配偶Vc公司科科斯算法862张量工具箱
引用于: 2文件

按年份列出的引文