鲁比克 swMATH ID: 30094 软件作者: Y.Wang、R.Chen、J.Ghosh、J.C.Denny、A.Kho、Y.Chen、B.A.Malin、J.Sun 描述: Rubik:健康数据分析的知识引导张量分解和完成。计算表型是将异构电子健康记录(EHR)转换为有意义的临床概念的过程。无监督表型分析方法有潜力利用大量标记EHR数据进行表型发现。然而,现有的无监督表型分析方法并没有结合当前的医学知识,无法直接处理缺失或噪声数据。我们提出了Rubik,一种用于表型分析的约束非负张量因子分解和完成方法。Rubik包含了1)指导约束以与现有医学知识保持一致,以及2)成对约束以获得不同的、不重叠的表型。Rubik还具有内置的张量补全功能,可以显著减轻噪声和缺失数据的影响。我们利用乘数交替方向法(ADMM)框架进行张量分解和完成,这可以通过并行计算轻松缩放。我们在两个EHR数据集上评估了Rubik,其中一个包含7744名门诊患者的647118条记录,另一个是包含472645名患者的1018614条CMS索赔记录的公共数据集。我们的结果表明,与基线相比,Rubik可以发现更多有意义和独特的表型。特别是,通过使用知识指导约束,Rubik还可以发现几种主要疾病的亚表型。Rubik的运行速度也是当前最先进的张量方法的7倍左右。最后,Rubik可扩展到包含数百万EHR记录的大型数据集。 主页: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6709413/ 相关软件: SDPLR公司;Genten公司;github;Matlab公司;DFacTo公司;分裂;弗罗斯特;理想配偶;Vc公司;科科斯;算法862;张量工具箱 引用于: 2文件 4位作者引用 1 穆罕默德·易卜拉欣(Mohamed Ibrahim Assoweh) 1 塔玛拉·吉布森·科尔达 1 埃里克·T·菲普斯。 1 布拉希姆·塔马达兹特 2篇连载文章中引用 1 计算与应用数学杂志 1 SIAM科学计算杂志 在2个字段中引用 2 线性代数和多线性代数;矩阵理论(15-XX) 2 数值分析(65-XX) 按年份列出的引文