×

使用Knockoffs的贝叶斯变量选择及其在基因组学中的应用。 (英语) Zbl 07800940号

摘要:鉴于HIV药物治疗研究的成本高昂,重要的是不仅要通过识别哪些遗传标记物与耐药性相关来最大限度地提高真阳性率(TPR),还要通过减少与耐药性无关的错误标记物数量来最大限度地降低假发现率(FDR)。在本研究中,我们提出了一种多重测试程序,该程序统一了计算统计学中的关键概念,即无模型敲击、贝叶斯变量选择和局部错误发现率。我们开发了一种算法,该算法利用增广的数据Knockoff矩阵并实现Bayesian Lasso。然后,我们使用基于马尔可夫链蒙特卡罗输出和局部错误发现率的测试统计量来识别信号。我们针对非贝叶斯方法(如Benjamini-Hochberg(BHq)和Lasso回归)对我们提出的方法进行了TPR和FDR方面的测试。通过数值研究,我们表明,在某些情况下,如低维和等维情况下,与BHq和Lasso相比,该方法产生的FDR更低。我们还讨论了HIV-1数据集的应用,其目的是在未来的工作中分析菲律宾与耐药HIV相关的遗传标记。

MSC公司:

62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 理发师,RF;Candès,EJ,《通过仿冒品控制虚假发现率》,Ann Stat(2015)·Zbl 1327.62082号 ·doi:10.1214/15-aos1337
[2] Y.本杰米尼。;Hochberg,Y.,《控制错误发现率:一种实用而有效的多重测试方法》,《皇家统计学会期刊B(方法学)》,57,1,289-300(1995)·Zbl 0809.62014号 ·doi:10.1111/j.2517-6161.1995.tb02031.x
[3] 比亚克,J。;布莱恩特,J.,《贝叶斯之后250年的贝叶斯人口统计学》,《大众研究》,70,1,1-19(2016)·doi:10.1080/00324728.2015.1122826
[4] 坎迪斯,E。;范,Y。;Janson,L。;Lv,J.,《淘金:高维受控变量选择的‘model-x’仿制品》,J Royal Stat Soc Ser B(Stat Methodol),80,3,551-577(2018)·Zbl 1398.62335号 ·doi:10.1111/rssb.12265
[5] Dudoit,S。;夏弗,JP;Block,JC,微阵列实验中的多假设检验,统计科学,18,1,71-103(2003)·Zbl 1048.62099号 ·数字对象标识代码:10.1214/ss/1056397487
[6] Efron,B.,《尺寸、功率和错误发现率》,Ann Stat(2007)·兹比尔1123.62008 ·doi:10.1214/009053606000001460
[7] Efron,B.,《同时推断:什么时候应该合并假设检验问题?》?,Ann Appl Stat(2008年)·Zbl 1137.62010年 ·doi:10.1214/07-aoas141
[8] Efron,B.,《大尺度推断:估计、测试和预测的经验贝叶斯方法》(2012),剑桥:剑桥大学出版社,剑桥·Zbl 1256.62007年
[9] 埃夫隆,B。;Tibshirani,R。;Storey,J。;Tusher,V.,微阵列实验的经验贝叶斯分析,J Am Stat Assoc,96,456,1151-1160(2001)·Zbl 1073.62511号 ·doi:10.1198/016214501753382129
[10] Gimenez JR、Ghorbani A、Zou J(2018)《大规模敲诈:具有虚假发现保证的新功能重要性统计》。arXiv预打印arXiv:1807.06214
[11] 关,Y。;Stephens,M.,全基因组关联研究和其他大规模问题的贝叶斯变量选择回归,Ann Appl Stat,5,3,1780-1815(2011)·Zbl 1229.62145号 ·doi:10.1214/11-aoas455
[12] Jaymalin M(2018)抗药性艾滋病毒呈上升趋势。菲律宾之星。https://www.philstar.com/headlines/2018/01/31/1783140/drug-resistant-hiv-rise。2020年3月12日访问
[13] Korthauer,K。;Kimes,PK;杜瓦莱特,C。;雷耶斯,A。;Subramanian,A。;滕,M。;舒克拉,C。;报警,EJ;希克斯,SC,计算生物学中控制错误发现方法的实用指南,基因组生物学,20,1,1-21(2019)·doi:10.1186/s13059-019-1716-1
[14] Kuritzkes,DR,HIV-1耐药性,Curr Opin Virol,1,6,582-589(2011)·doi:10.1016/j.coviro.2011.10.020
[15] Macan JG(2019)Dost-pchrd支持开发更经济、更容易获得的艾滋病毒耐药性诊断工具。菲律宾卫生研究与发展委员会网站。http://pchrd.dost.gov.ph/index.php/news/6453-dost-pchrd-supports-development-of-a-more-affordable-accessible-hiv-drug-resistance-dinagnostic-tool-2。2020年5月14日访问
[16] 弗吉尼亚州麦克库西克;FH,Ruddle,《一门新学科,一个新名称,一份新杂志》,《基因组学》,1,1,1-2(1987)·doi:10.1016/0888-7543(87)90098-x
[17] Metzner,KJ,HIV全基因组测序:回答仍然存在的问题,临床微生物学杂志,54,4834-835(2016)·doi:10.1128/jcm.03265-15
[18] IA纳西尔;埃梅里贝,澳大利亚;奥杰米伦,I。;Adekola,HA,《人类免疫缺陷病毒耐药性测试技术及其在非洲资源有限环境中的适用性》,传染病治疗,10117863371774959(2017)·doi:10.1177/1178633717749597
[19] 美国国立卫生研究院(2020)《了解艾滋病毒/艾滋病的耐药性》。美国卫生与公共服务部。https://aidsinfo.nih.gov/understanding-hiv-aids/fact-sheets/21/56/耐药。2020年4月15日访问
[20] 奥哈拉,RB;Sillanpää,MJ,《贝叶斯变量选择方法综述:什么、如何以及是什么,贝叶斯分析》(2009)·Zbl 1330.62291号 ·doi:10.1214/09-ba403
[21] 帕克,T。;Casella,G.,《贝叶斯套索》,美国统计协会期刊,第103、482、681-686页(2008年)·Zbl 1330.62292号 ·doi:10.1198/016214500000037
[22] 李,SY;费塞尔,WJ;佐洛帕,AR;Hurley,L。;刘,T。;泰勒,J。;Nguyen,DP;斯洛姆,S。;克莱因,D。;霍伯格,M。;弗拉姆,J。;Follansbee,S。;夏皮罗,JM;Shafer,RW,HIV-1蛋白酶和反转录酶突变:与b亚型分离株抗逆转录病毒治疗的相关性及其对耐药性监测的影响,《传染病杂志》,192,3,456-465(2005)·doi:10.1086/431601
[23] 罗伯特·C。;Casella,G.,《马尔可夫链蒙特卡罗简史:不完整数据的主观回忆》,《统计科学》,26,1,102-115(2011)·Zbl 1222.65006号 ·doi:10.1214/10-sts351
[24] 田纳西州信德湖;Feroze,N。;Aslam,M.,一类改进的信息先验,用于双删失数据失效时间分布双成分混合贝叶斯分析,J Stat Manag Syst,20,5,871-900(2017)·doi:10.1080/097201510.2015.1121597
[25] 田纳西州信德湖;侯赛因,Z。;Aslam,M.,《关于两个Topp-Lieon分布截尾混合的贝叶斯分析》,斯里兰卡应用统计杂志,19,1,13(2019)·doi:10.4038/sljastats.v19i1.7993
[26] Tibshirani,R.,《通过套索进行回归收缩和选择》,J Roy Stat Soc Ser B(Methodol),58,1,267-288(1996)·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x
[27] 宾夕法尼亚州韦斯特福尔。;Young,SS,《基于重采样的多重测试:p值调整的示例和方法》(1993),纽约:威利,纽约·Zbl 0850.62368号
[28] 世界卫生组织(2018)世卫组织和联合国艾滋病规划署联合问答菲律宾的艾滋病毒菌株和耐药性。世界卫生组织网站。https://www.who.int/philippines/news/feature-stories/detail/joint-who-and-unaids-questions-and-answers-to-hiv-strain-and-duge-resistance-in-the-philippine。2020年6月8日访问
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。