×

基于大尺度回归的模式发现:筛选世卫组织全球药物安全数据库的示例。 (英语) Zbl 07260244号

摘要:对共同发生事件模式的兴趣度的大多数度量都基于对主要关注事件的列联表的数据预测。作为替代方案,本文介绍了用于大规模模式发现的收缩逻辑回归的第一个实现,并评估了其在实际二进制事务数据中的有用性。回归解释了可能混淆或扭曲关联的其他协变量的影响。考虑的应用是国际药物不良反应(ADR)监测,在该监测中,对大量可疑ADR的报告进行筛选,寻找值得临床随访的有趣报告模式。我们的结果表明,基于回归的模式发现确实具有实际优势。具体来说,它可以消除由于其他协变量导致的假阳性和假阴性。此外,它比基于应急表的措施更早地确定了一些既定的药物安全问题。虽然回归具有明显的概念优势,但我们的结果表明,基于列联表的方法将继续在药品不良反应监测中发挥关键作用,原因有二:回归未能在当前使用的措施中尽早确定一些既定的药物安全问题,以及估计回归系数的程序相对缺乏透明度。这表明收缩回归应与ADR监测和其他大规模模式发现应用中的现有感兴趣度测量并行使用。

MSC公司:

62至XX 统计
68倍 计算机科学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] D.J.Hand和R。J.Bolton,《模式发现与检测:统一统计方法》,《应用统计杂志》31(8)(2004),889-924·Zbl 1121.62390号
[2] R.Agrawal、H.Mannila、R.Srikant、H.Toivonen和A.I.Verkamo,关联规则的快速发现,知识发现和数据挖掘的进展,美国加利福尼亚州门洛帕克,美国人工智能协会,1996307-328。
[3] P.-N.Tan、V.Kumar和J.Srivastava,为关联模式选择正确的有趣度度量,KDD'02:第八届ACM SIGKDD知识发现和数据挖掘国际会议论文集,加拿大阿尔伯塔省埃德蒙顿,ACM,2002,32-41。
[4] G.Das、H.Mannila和P.Ronkainen,外部探针属性的相似性,KDD’98:第四届ACM SIGKDD知识发现和数据挖掘国际会议论文集,AAAI出版社,1998年,23-29。
[5] O.R.Zaiane、M.Xin和J.Han,《通过将OLAP和数据挖掘技术应用于网络日志来发现网络访问模式和趋势》,载于ADL’98:IEEE数字图书馆研究与技术进步国际论坛论文集,加利福尼亚州圣巴巴拉,美国,1998年,19-29。
[6] I.D.Melamed,《自动构建干净广泛覆盖的翻译词典》,载于《AMTA’96:1996年美洲机器翻译协会会议记录》,加拿大魁北克省蒙特利尔,1996年。
[7] A.Bate、M.Lindquist和I.R.Edwards,《数据库中知识发现在上市后药物安全中的应用:WHO数据库示例》,基金临床药理学22(2)(2008),127-140。
[8] P.Purcell和S.Barty,信号生成的统计技术澳大利亚经验,药物安全25(6)415-421,(2002)。
[9] E.R.Omiecinski,数据库中采矿协会的替代利益衡量,IEEE Trans Knowl Data Eng 15(1)(2003),57-69。
[10] E.H.Simpson,《列联表中相互作用的解释》,J R Stat Soc Ser。,B 13(2)(1951),238-241·Zbl 0045.08802号
[11] W.DuMouchel,《大频率表中的贝叶斯数据挖掘及其在FDA自发报告系统中的应用》,《美国统计》53(3)(1999),177-190。
[12] G.N.Nor´en、A.Bate、R.Orre和I.R.Edwards,将用于筛选世界卫生组织药物安全数据库的方法扩展到复杂关联的分析,并提高罕见事件的准确性,Stat Med 25(21)(2006),3740-3577。
[13] J.Hopstadius,G.N.Nor´en,A.Bate和I.R.Edwards,药物不良反应监测分层的影响,《药物安全》31(11)(2008),1035-1052。
[14] R.Srikant和R.Agrawal,《在大型关系表中挖掘定量关联规则》,SIGMOD’96:《1996年ACM国际数据管理会议论文集》,加拿大魁北克省蒙特利尔,ACM,1996,1-12。
[15] C.C.Aggarwal和P.S.Yu,《集体力量法采矿协会》,IEEE Trans Knowl Data Eng 13(6)(2001),863-873。
[16] A.Bate、M.Lindquist、I.R.Edwards、S.Olsson、R.Orre、A.Lansner和R.M.De Freitas,《产生药物不良反应信号的贝叶斯神经网络方法》,《欧洲临床药理学杂志》54(4)(1998),315-321。
[17] G.N.Nor´en、R.Sundberg、A.Bate和I.R.Edwards,药物与药物相互作用监测的统计学方法,《统计医学》27(16)(2008),3057-3070。
[18] S.J.W.Evans、P.C.Waller和S.Davis,使用比例报告比率(PRR)从自发药物不良反应报告中生成信号,药物流行病学药物安全10(6)(2001),483-486。
[19] S.J.W.Evans,《统计学:安全性数据的分析和呈现》,《Stephen’S Detection of New Adverse Drug Reactions》,J.Talbott和P.Waller,eds.Chichester,英格兰:John Wiley&Sons出版社,2004年,第301-328页。
[20] A.Genkin、D.D.Lewis和D.Madigan,文本分类的大尺度贝叶斯逻辑回归,《技术计量学》49(3)(2007),291-304。
[21] S.K.Shevade和S.S.Keerthi,《使用稀疏逻辑回归进行基因选择的简单高效算法》,生物信息学19(17)(2003),2246-2253。
[22] P.Komarek和A.W.Moore,使用TR-IRLS将逻辑回归作为核心数据挖掘工具,ICDM’05:第五届IEEE数据挖掘国际会议论文集,美国德克萨斯州休斯顿,IEEE计算机学会,2005,685-688。
[23] K.Koh、S.-J.Kim和S.Boyd,大规模l(1)正则化逻辑回归的内点方法,J Mach Learn Res 8(2007),1519-1555·Zbl 1222.62092号
[24] B.Krishnapuram、L.Carin、M.A.T.Figueiredo和A.J.Hartemink,稀疏多项式逻辑回归:快速算法和泛化界限,IEEE Trans-Pattern Ana Mach Intell 27(6)(2005),957-968。
[25] J.Friedman、T.Hastie和R.Tibshirani,通过坐标下降法实现广义线性模型的正则化路径,J Stat Softw 33(1)(2010),1-22。
[26] W.DuMouchel和D.Pregibon,多项目关联的经验贝叶斯筛选,KDD'01:第七届ACM SIGKDD知识发现和数据挖掘国际会议论文集,美国加利福尼亚州旧金山,ACM,2001,67-76。
[27] R.Orre、A.Bate、G.N.Nor´en、E.Swahn、S.Arnborg和I.R.Edwards,用于大型不完整数据集中无监督模式识别的贝叶斯递归神经网络,国际神经系统杂志15(3)207-222,(2005)。
[28] G.N.Nor´en、R.Orre、A.Bate和I.R.Edwards,药物不良反应监测中的重复检测,数据挖掘知识发现14(3)(2007),305-328。
[29] M.D.Rawlins,药物不良反应的自发报告。ii:用途,《英国临床药理学杂志》26(1)(1988),7-11。
[30] R.Orre、A.Lansner、A.Bate和M.Lindquist,《数据挖掘中应用置信度估计的贝叶斯神经网络》,《计算统计数据分析》34(4)(2000),473-493·Zbl 1061.62561号
[31] G.N.Nor´en,《药物不良反应监测中知识发现的统计方法》。斯德哥尔摩大学数学系博士论文,2007年。
[32] D.W.Hosmer和S.Lemeshow,《应用逻辑回归》,纽约,John Wiley&Sons出版社,1989年·Zbl 0967.62045号
[33] R.Tibshirani,通过套索进行回归收缩和选择,J R Stat Soc Ser。,B 58(1)(1996),267-288·Zbl 0850.62538号
[34] T.Hastie、R.Tibshirani和J.Friedman,《统计学习的要素》,纽约,施普林格出版社,2001年·Zbl 0973.62007号
[35] M.Lindquist、M.St˚ahl、A.Bate、I.R.Edwards和R.H.Meyboom,《数据挖掘方法的回顾性评估,以帮助在WHO国际数据库中发现新的药物不良反应信号》,《药物安全》23(6)(2000),533-542。
[36] M.Hauben和L.Reich,数据挖掘算法在早期检测潜在致命/致残药物不良反应中的潜在效用:回顾性评估,《临床药理学杂志》45(4)(2005),378-384。
[37] K.E.Lasser、P.D.Allen、S.J.Woolhandler、D.U.Himmelstein、S.M.Wolfe和D.H.Bor,新黑盒警告的时机和处方药物的退出,美国医学协会杂志287(17)(2002),2215-2220。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。