×

基于半正交非负矩阵分解的分诊笔记主题建模。 (英语) Zbl 1506.62446号

摘要:急诊科拥挤是一个影响医院管理效率和患者护理质量的普遍健康问题。当医生做出入院决定之前,患者的病房申请被推迟时,经常会发生急诊室拥挤。在这个案例研究中,我们构建了一个分类器,使用阿尔伯塔省医疗中心提供的在分诊期间收集的手动打印的护士笔记来预测患者的处置情况。这些预测可能会被纳入早期床位协调和快速跟踪流策略中,以缓解急诊室的过度拥挤和等待时间。然而,这些分诊记录涉及高维、噪声和稀疏文本数据,这使得模型构建和解释变得困难。为了解决这个问题,我们提出了一种新的半正交非负矩阵因式分解方法,用于连续和二进制预测器,以降低维数并导出单词主题。然后,分类注释可以解释为正交基主题向量的非收缩线性组合。我们的实际数据分析表明,分诊记录包含了对某些医疗投诉(如意识改变或中风)患者的处置进行分类的强大预测信息。此外,我们还表明,通过我们的方法生成的文档-图片向量可以用作特征,以进一步提高不同医疗投诉的分类准确率高达1%,例如,中风症状患者的准确率为74.3%–75.3%。这种改进可能对某些患者产生临床影响,特别是当医院患者规模较大时。此外,由于正交公式,生成的文字-图像向量在每个主题下提供了双聚类解释,这有助于医院更好地了解患者就诊背后的症状和原因。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
68T05型 人工智能中的学习和自适应系统
90B50型 管理决策,包括多个目标
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abdi,H。;Williams,L.J.,“主成分分析,威利跨学科评论:计算统计,2433-459(2010)·doi:10.1002/wics.101
[2] 阿加瓦尔,C.C。;Reddy,C.K.,《数据聚类:算法和应用》(2013),佛罗里达州博卡拉顿:CRC出版社,佛罗里达州波卡拉顿
[3] Anantharaman,V.,“卫生保健系统干预对新加坡急诊科使用和过度拥挤的影响,国际急诊医学杂志,1,11-20(2008)·doi:10.1007/s12245-008-0004-8
[4] 巴雷特,L。;福特,S。;Ward-Smith,P.,“急诊科过度拥挤的床位管理策略”,《护理经济学》,30,82(2012)
[5] Boutsidis,C。;Gallopoulos,E.,“基于SVD的初始化:非负矩阵分解的先行者,模式识别,411350-1362(2008)·Zbl 1131.68084号 ·doi:10.1016/j.patcog.2007.09.010
[6] Breiman,L.,“随机森林,机器学习,45,5-32(2001)·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[7] 查尔芬,D.B。;Trzeciak,S。;Likourezos,A。;Baumann,B.M。;Dellinger,R.P.,“危重病患者从急诊室延迟转移到重症监护室的影响”,危重病医学,351477-1483(2007)
[8] Cichocki,A。;Phan,A.-H.,“大规模非负矩阵和张量因子分解的快速局部算法,电子、通信和计算机科学基础IEICE汇刊,92,708-721(2009)·doi:10.1587/transfun。E92.A.708型
[9] Cichocki,A。;扎杜克,R。;阿玛里,S.-I.,169-176(2007),斯普林格
[10] 丁·C·H。;李·T。;Jordan,M.I.,“凸矩阵和半连通矩阵分解,IEEE模式分析和机器智能汇刊,32,45-55(2010)·doi:10.10109/TPAMI.2008.277
[11] 丁,C。;李·T。;彭,W。;Park,H.,用于聚类的正交非负矩阵t-因子分解,第12届ACM SIGKDD国际会议(2006)·doi:10.1145/1150402.1150420
[12] 杜马,M.J。;德雷克,C.A。;O’Dochartaigh,D。;Smith,K.E.,“改善城市急诊室护理及时性的护士启动方案的实用随机评估”,《急诊医学年鉴》,68,546-552(2016)·doi:10.1016/j.annemergmed.2016.06.019
[13] Dudani,S.A.,“距离加权k-最近邻规则,IEEE系统、人与控制论汇刊,4325-327(1976)·doi:10.1109/TSMC.1976.5408784
[14] 埃卡特,C。;Young,G.,“低阶矩阵对一个矩阵的逼近”,《心理测量学》,121-218(1936)·doi:10.1007/BF02288367
[15] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,“通过坐标下降的广义线性模型的正则化路径”,《统计软件杂志》,33,1-22(2010)·doi:10.18637/jss.v033.i01
[16] Gillis,N。;Vavasis,S.A.,“可分离非负矩阵分解的快速稳健递归算法,IEEE模式分析和机器智能汇刊,36,698-714(2013)·doi:10.1109/TPAMI.2013.226
[17] 关,Y。;Dy,J.,稀疏概率主成分分析,人工智能与统计,185-192(2009)
[18] 古普塔,V。;Lehal,G.S.,“文本挖掘技术和应用的调查”,《网络智能新兴技术期刊》,1,60-76(2009)·doi:10.4304/jetwi.1.1.60-76
[19] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《推断与预测》,《统计学习的要素:数据挖掘》(2009),纽约:斯普林格出版社,纽约·Zbl 1273.62005年
[20] Hong,W.S。;Haimovich,A.D。;Taylor,R.A.,“使用机器学习预测急诊科分诊入院人数,PLOS ONE,13,e0201016(2018)·doi:10.1371/journal.pone.201016
[21] Hoyer,P.O.,“具有稀疏约束的非负矩阵分解,机器学习研究杂志,51457-1469(2004)·Zbl 1222.68218号
[22] 谢长杰。;Dhillon,I.S.,非负矩阵因式分解的变量选择快速坐标下降法,第17届ACM SIGKDD国际会议(2011年)·doi:10.1145/2020408.2020577
[23] 耶拉西,S。;Digiusto,E。;桑塔格,P。;丹恩,L。;Fox,D.,“案例复杂性流媒体:急诊科快速通道模型评估”,澳大利亚急诊医学,20,241-249(2008)
[24] Kim,J。;Park,H.,技术报告,“用于聚类的稀疏非负矩阵因子分解”,(2008),佐治亚理工学院
[25] Kimura,K。;田中,Y。;Kudo,M.,“正交非负矩阵因子分解的快速分层交替最小二乘算法”,《第六届亚洲机器学习会议论文集》,129-141(2015)
[26] Kuhn,M.,“使用插入符号包在R中构建预测模型,统计软件杂志,28,1-26(2008)·doi:10.18637/jss.v028.i05
[27] A.N.兰维尔。;梅耶,C.D。;奥尔布赖特·R。;考克斯,J。;Duling,D.,“非负矩阵因式分解的初始化”,第十二届ACM SIGKDD国际知识发现和数据挖掘会议论文集,23-26(2006)
[28] ---(2014),“非负矩阵分解的算法、初始化和收敛”,arXiv编号1407.7299。
[29] Lee,D.D。;Seung,H.S.,“通过非负矩阵分解学习对象的各个部分”,《自然》,401,788-791(1999)·Zbl 1369.68285号 ·doi:10.1038/44565
[30] ---,“非负矩阵分解算法,神经信息处理系统进展,556-562(2001)
[31] 李毅。;朱,R。;Qu,A.,“一揽子‘矩阵事实’”(2019年)
[32] Lin,C.-J.,“非负矩阵分解的投影梯度法,神经计算,192756-2779(2007)·Zbl 1173.90583号 ·doi:10.1162/neco.2007.19.10.2756
[33] Mareiniss,D.P.,“即将到来的风暴:Covid-19,流行病和我们压倒一切的急诊科”,《美国急诊医学杂志》,38,1293-1294(2020)·doi:10.1016/j.ajem.2020.03.033
[34] Meyer,D.、Dimitriadou,E.、Hornik,K.、Weingessel,A.、Leich,F.、Chang,C.-C.和Lin,C.-C(2014),“e1071:统计部的其他职能(e1071),TU Wien,”R包版本,1。
[35] 莫利,C。;Unwin,M。;彼得森,G.M。;斯坦科维奇,J。;Kinsman,L.,“急诊部拥挤:原因、后果和解决方案的系统审查,PLOS ONE,13,e0203316(2018)·doi:10.1371/journal.pone.0203316
[36] Paatero,P。;Tapper,U.,“正矩阵分解:数据值误差估计最佳利用的非负因子模型”,环境计量学,5,111-126(1994)·doi:10.1002/env.3170050203
[37] Peck,J.S。;Benneyan,J.C。;南丁格尔,D.J。;Gaehde,S.A.,“预测急诊科住院人数以改善同一天的患者流量,学术急诊医学,19,E1045-E1054(2012)·doi:10.1111/j.1553-2712.2012.01435.x
[38] Pines,J.M。;J.A.希尔顿。;韦伯,E.J。;Alkemade,A.J。;Al-Shabanah,H。;安德森,P.D。;伯恩哈德,M。;贝尔蒂尼,A。;Gries,A。;费兰迪斯,S。;Kumar,V.A.,“急诊科拥挤的国际视角,学术急诊医学,18,1358-1370(2011)·doi:10.1111/j.1553-2712.2011.01235.x
[39] 鲍威尔,E.S。;哈雷,R.K。;Venkatesh,A.K。;Van Roo,B.D。;亚当斯·J·G。;Reinhardt,G.,“住院患者出院时间与急诊科就医的关系”,《急诊医学杂志》,第42期,186-196页(2012年)·doi:10.1016/j.jemermed.2010.06.028
[40] 乔,H.,“基于SVD的非负矩阵分解新初始化策略,模式识别快报,63,71-77(2015)·doi:10.1016/j.patrec.2015.05.019
[41] 邱,S。;Chinnam,R.B。;Murat,A。;Batarse,B。;Neemuchwala,H。;Jordan,W.,“一种成本敏感的住院床位预订方法,以减少急诊部的登机时间,《医疗管理科学》,18,67-85(2015)·doi:10.1007/s10729-014-9283-1
[42] RColorBrewer,S。;Liaw,M.A.,“包‘randomforest’”,(2018),加利福尼亚大学:加利福尼亚大学伯克利分校,加利福尼亚州伯克利市,美国
[43] Recht,B。;关于C。;Tropp,J。;Bittorf,V.,用线性程序分解非负矩阵,神经信息处理系统的进展,1214-1222(2012)
[44] Ripley,B.、Venables,W.和Ripley(M.B.)(2015年),“软件包‘类’”,《综合R档案网络》。
[45] Saghafian,S。;霍普,W.J。;Van Oyen,医学博士。;德斯蒙德,J.S。;Kronick,S.L.,“患者流作为提高急诊科反应能力的一种机制,运筹学,601080-1097(2012)·Zbl 1262.90206号 ·doi:10.1287/opre.1120.1096
[46] 萨尔顿,G。;Wong,A。;Yang,C.-S.,“自动索引的向量空间模型,ACM通信,18,613-620(1975)·Zbl 0313.68082号 ·数字对象标识代码:10.1145/361219.361220
[47] 沙赫特纳,R。;波普尔,G。;Lang,E.W.,“二进制测试数据的非负盲源分离模型,IEEE电路和系统汇刊I:常规论文,571439-1448(2010)·doi:10.1109/TCSI.2010.2048778
[48] Schein,A.I。;Saul,L.K。;Ungar,L.H.,“二进制数据主成分分析的广义线性模型,AISTATS,2,10(2003)
[49] Shahnaz,F。;Berry,M.W。;Pauca,V.P。;Plemmons,R.J.,“使用非负矩阵分解的文档聚类,信息处理与管理,42,373-386(2006)·Zbl 1087.68104号
[50] 斯拉夫斯基,M。;海因,M。;Lutsik,P.,二元成分矩阵分解,神经信息处理系统进展,3210-3218(2013)
[51] Sprivulis,P.C。;Da Silva,J.-A。;雅各布斯,I.G。;杰利内克,G.A。;Frazer,A.R.,“医院过度拥挤与西澳大利亚急诊科住院患者死亡率之间的关系,澳大利亚医学杂志,184208-212(2006)·文件编号:10.5694/j.1326-5377.2006.tb00203.x
[52] 太阳,不列颠哥伦比亚省。;夏瑞云(Xia,R.Y.)。;韦斯,R.E。;Zingmond,D。;Liang,L.-J。;Han,W。;McCreath,H。;Asch,S.M.,“急诊科拥挤对入院患者预后的影响”,《急诊医学年鉴》,61605-611(2013)·doi:10.1016/j.annemergmed.2012.10.026
[53] 孙,Y。;Heng,B.H.先生。;Tay,S.Y。;Seow,E.,“使用常规管理数据预测急诊科分诊的入院人数,学术急诊医学,1844-850(2011)·doi:10.1111/j.1553-2712.2011.01125.x
[54] 苏肯斯,J.A。;Vandewalle,J.,“最小二乘支持向量机分类器,神经处理快报,9293-300(1999)·doi:10.1023/A:1018628609742
[55] Tibshirani,R.,“通过拉索进行回归收缩和选择,皇家统计学会期刊,B辑,58,267-288(1996)·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x
[56] A.汤姆。;沙赫特纳,R。;维格纳龙,V。;Puntonet,C。;Lang,E.,“二进制数据集、多维系统和信号处理的逻辑非负矩阵分解方法,26,125-143(2015)·doi:10.1007/s11045-013-0240-9
[57] Wall,M.E。;Rechsteiner,A。;罗查,L.M。;Berrar,D.P。;杜比茨基,W。;Granzow,M.,《微阵列数据分析、奇异值分解和主成分分析的实用方法》,91-109(2003),马萨诸塞州波士顿:斯普林格
[58] Wang,W。;Yang,D。;陈,F。;Pang,Y。;黄,S。;Ge,Y.,“使用正交自动编码器进行聚类,IEEE Access,762421-62432(2019)·doi:10.1109/ACCESS.2019.2916030
[59] 温,Z。;Yin,W.,“带正交约束的可行优化方法,数学规划,142,397-434(2013)·Zbl 1281.49030号 ·doi:10.1007/s10107-012-0584-1
[60] 薛,Y。;Tong,C.S。;陈,Y。;Chen,W.S.,“基于聚类的非负矩阵因式分解初始化,应用数学与计算,205,525-536(2008)·Zbl 1152.68506号 ·doi:10.1016/j.amc.2008.05.106
[61] Yaram,S.,《文档聚类和欺诈检测的机器学习算法》,2016年国际数据科学与工程会议(ICDSE)(2016)·doi:10.1109/ICDSE.2016.7823950
[62] Yoo,J。;Choi,S.,IDEAL,“正交非负矩阵分解:Stiefel流形上的乘法更新”,140-147(2008),Springer
[63] 张,X。;关,N。;兰·L。;陶,D。;Luo,Z.,Box-Constrained Projective Non-negative Matrix Factorization via Augmented Lagrangian Method,2014国际神经网络联合会议(IJCNN)(2014)·doi:10.1109/IJCNN.2014.6889928
[64] 张,X。;Kim,J。;Patzer,R.E。;S.R.皮特斯。;Patzer,A。;Schrager,J.D.,“基于自然语言处理和神经网络的急诊科住院预测,医学信息方法,56,377-389(2017)·文件编号:10.3414/ME17-01-0024
[65] 张,Z。;李·T。;丁,C。;Zhang,X.,391-400(2007年)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。