×

从混合诊断样本中识别分子菌株的贝叶斯框架。 (英语) Zbl 1397.92217号

摘要:我们提供了一个数学公式,并开发了一个计算框架,用于从混合DNA样本中识别多种微生物菌株。我们的方法适用于有效识别病原体至关重要的公共卫生领域,例如监测疾病暴发。我们将菌株识别作为一个逆问题,其目的是同时估计二进制矩阵(编码每个菌株中是否存在突变)和实值向量(代表菌株的混合物),使其乘积近似等于测量的数据向量。目前的问题与盲反褶积具有类似的结构,除了我们在方法中强制实施的二进制约束。根据贝叶斯方法,我们导出了后验密度。我们提出了两种求解非凸极大值的计算方法后部估计问题。第一种是局部优化方法,它通过将问题解耦为较小的独立子问题来提高效率和可扩展性,而第二种方法通过将问题转化为凸混合整数二次规划问题来获得全局极小值。解耦方法还提供了一种有效的后向积分方法。这提供了有关未确定问题的模糊性以及与数值解相关的不确定性的有用信息。我们评估了框架的潜力和局限性生物信息学使用合成和实验数据以及可用的基本事实。

MSC公司:

92C40型 生物化学、分子生物学
92C60型 医学流行病学
92-04 生物相关问题的软件、源代码等
90立方厘米 混合整数编程
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Galinsky,K.,《COIL:使用单核苷酸多态性数据的可能性评估疟疾感染复杂性的方法》,《疟疾杂志》,14,4,(2015)·doi:10.1186/1475-2875-14-4
[2] Tenover,F。;Arbeit,R。;Goering,R.,《如何选择和解释细菌感染流行病学研究的分子菌株分型方法:对卫生保健流行病学家的综述》,感染控制医院,流行病学。,18, 426-439, (1997) ·doi:10.1086/647644
[3] 朱,S。;Almagro-Garcia,J。;McVean,G.,多重感染的反褶积恶性疟原虫来自高通量测序数据,生物信息学,34,9-15,(2018)·doi:10.1093/bioinformatics/btx530
[4] Daniels,R.,基于SNP的通用分子条形码恶性疟原虫识别和跟踪,《疟疾杂志》,7,223,(2008)·doi:10.1186/1475-2875-7-223
[5] Nadon,C.,PulseNet international:全球食源性疾病监测中全基因组测序(WGS)的实施愿景,欧洲监测,22,(2017)·doi:10.2807/1560-7917.ES.2017.22.23.30544
[6] Maiden,M。;范伦斯堡,M.J。;布雷,J。;厄尔,S。;福特,S。;Jolley,K。;McCarthy,N.,MLST重温:细菌基因组学的逐基因方法,《微生物自然评论》。,11, 728-736, (2013) ·doi:10.1038/nrmicro3093
[7] 奎诺,S。;库伦,J。;van Hijum,S。;Huynen,M。;梅尔切斯,W。;van Schaik,W。;Wertheim,H.,《细菌病原体的全基因组测序:医院暴发分析的未来》,临床。微生物。版次:301015-1063(2017)·doi:10.1128/CMR.0016-17号文件
[8] 辛格·R。;Mayer,A。;Hanson,T。;Isaacson,R.,微生物相互作用和培养基会降低沙门氏菌监测系统和疫情调查的准确性吗?,食品保护杂志。,72, 707-713, (2009) ·文件编号:10.4315/0362-028X-72.4.707
[9] Döpfer,D。;布伊斯特,W。;Soyer,Y。;穆尼奥斯,M。;扎多克斯,R。;Geue,L。;Engel,B.,评估从胃肠道和环境样品中分离的细菌物种的遗传异质性:需要多少个菌株?,申请。环境。微生物。,74, 3490-3496, (2008) ·doi:10.1128/AEM.02789-07
[10] 雅各布,M。;Almes,K。;施,X。;Sargeant,J。;Nagaraja,T.、。,大肠杆菌O157:H7在牛粪便样本中的遗传多样性,食品保护杂志。,74, 1186-1188, (2011) ·doi:10.4315/0362-028X。JFP-11-022型
[11] Sacchi,C.,将实时PCR纳入巴西圣保罗培养阴性细菌性脑膜炎的常规公共卫生监测,《公共科学图书馆·综合》,6,(2011)·doi:10.1371/journal.pone.0020675
[12] Langley,G.,《非培养诊断试验对未来新发感染项目监测的影响》,《突发传染病》。,21, 1582-1588, (2015) ·doi:10.3201/eid2109.150570
[13] Vollmers,J。;威根,S。;Kaster,A-K,从微生物学家的角度比较和评估宏基因组组装工具——不仅仅是尺寸问题!,《公共科学图书馆·综合》,12,e0169662,(2017)·doi:10.1371/journal.pone.0169662
[14] 凯皮奥,J。;Somersalo,E.,《统计与计算反问题》(2006),纽约:Springer,纽约·Zbl 0927.35134号
[15] Calvetti,D。;Somersalo,E.,《贝叶斯科学计算导论》(2007),纽约:Springer,纽约·Zbl 1137.65010号
[16] Diamantaras,K。;Chassioti,E.,盲分离N个一次观测的双星源:确定性方法,93-98,(2000)
[17] Diamantaras,K.,用于从单个线性混合物中盲分离多个有限字母序列的聚类方法,信号处理。,86, 877-891, (2006) ·Zbl 1163.94327号 ·doi:10.1016/j.sigpro.2005.06.014
[18] Belouchrani,A。;Abed-Meraim,K。;卡多佐,J-F;Moulines,E.,使用二阶统计的盲源分离技术,IEEE Trans。信号处理。,45, 434-444, (1997) ·数字对象标识代码:10.1109/78.554307
[19] Talwar,S。;维伯格,M。;Paulraj,A.,使用天线阵列对多个同频道数字信号进行盲估计,IEEE信号处理。莱特。,1, 29-31, (1994) ·doi:10.1109/97.300310
[20] 贝尔,M。;Munk,A.,多个有限字母线性混合物盲源分离的可识别性,IEEE Trans。Inf.理论,63,5506-5517,(2017)·Zbl 1374.94040号 ·doi:10.1109/TIT.2017.2717586
[21] Lin,C-J,非负矩阵分解的投影梯度法,神经计算。,19, 2756-2779, (2007) ·Zbl 1173.90583号 ·doi:10.1162/neco.2007.19.10.2756
[22] 斯拉夫斯基,M。;海因,M。;Lutsik,P.,二元成分矩阵分解,神经信息处理系统进展,3210-3218,(2013)
[23] 你,Y。;Kaveh,M.,《联合模糊识别和图像恢复的正则化方法》,IEEE Trans。图像处理。,5, 416-428, (1996) ·数字对象标识代码:10.1109/83.491316
[24] Chan,T。;Wong,C.,全变分盲反褶积,IEEE Trans。图像处理。,7, 370-375, (1998) ·数字对象标识代码:10.1109/83.661187
[25] Chan,T。;王,C.,盲反褶积交替极小化算法的收敛性,线性代数应用。,316, 259-285, (2000) ·Zbl 0993.65149号 ·doi:10.1016/S0024-3795(00)00141-5
[26] 莱尔德,C。;比格勒,L。;van Bloemen Waanders,B.,水网络源反演中获得独特解的混合积分方法,J.water Resour。计划。管理。,132, 242-251, (2006) ·doi:10.1061/(ASCE)0733-9496(2006)132:4(242)
[27] 贝洛蒂,P。;柯奇斯,C。;Leyffer,S。;林德拉斯,J。;卢埃特克,J。;Mahajan,A.,《混合整数非线性优化》,《数值学报》。,22, 1-131, (2013) ·Zbl 1291.65172号 ·文件编号:10.1017/S0962492913000032
[28] Talwar,S。;维伯格,M。;Paulraj,A.,使用天线阵列对同步同信道数字信号进行盲分离。I.算法,IEEE Trans。信号处理。,44, 1184-1197, (1996) ·数字对象标识代码:10.1109/78.502331
[29] Mahajan,A。;Leyffer,S。;林德拉斯,J。;卢埃特克,J。;Munson,T.,Minotaur:混合整数非线性优化工具箱ANL/MCS-P8010-0817,阿贡国家实验室,(2017)
[30] Gurobi优化器参考手册(2016)
[31] 李毅。;Cichocki,A。;张,L.,二进制信源的盲分离与提取,IEICE Trans。芬达姆。电子。Commun公司。计算。科学。,86, 580-589, (2003)
[32] Nocedal,J。;Wright,S.,数值优化,(2006),纽约:Springer,纽约·Zbl 1104.65059号
[33] 哈马里克,美国。;Kaltenbacher,B。;美国康罗。;Resmerita,E.,Banach空间中离散化的正则化,反问题,32,(2016)·Zbl 1342.65136号 ·doi:10.1088/0266-5611/32/3/035004
[34] Hansen,P.,《离散逆问题》(2010),宾夕法尼亚州费城:SIAM,宾夕法尼亚州,费城
[35] IBM ILOG CPLEX优化工作室:CPLEX用户手册,(2016)
[36] 古普特,A。;艾哈迈德,S。;Cheon,M。;Dey,S.,使用MILP公式求解混合整数双线性问题,SIAM J.Optim。,23, 721-744, (2013) ·Zbl 1300.90021号 ·doi:10.1137/110836183
[37] 古普特,A。;艾哈迈德,S。;戴伊·S。;Cheon,M.,池问题的松弛和离散化,J.Glob。最佳。,67, 631-669, (2017) ·Zbl 1392.90117号 ·doi:10.1007/s10898-016-0434-4
[38] 舒马赫,K。;陈,R-Y;Cohn,A.,《需求不确定性和线路故障下智能开关输电扩建》,能源系统。,8, 549-580, (2017) ·doi:10.1007/s12667-016-0213-9
[39] McCormick,G.,可分解非凸程序全局解的可计算性:第一部分-凸低估问题,数学。程序。,10, 147-175, (1976) ·Zbl 0349.90100号 ·doi:10.1007/BF01580665
[40] 雅各德,J。;Protter,P.,《概率概要》(2004),柏林:施普林格出版社,柏林·Zbl 1014.60004号
[41] Bezanson,J。;Edelman,A。;卡宾斯基,S。;Shah,V.B.,Julia:数值计算的新方法,SIAM Rev.,59,65-98,(2017)·Zbl 1356.68030号 ·数字对象标识代码:10.1137/141000671
[42] 邓宁,I。;哈切特,J。;Lubin,M.,JuMP:数学优化建模语言,SIAM Rev.,59,295-320,(2017)·Zbl 1368.90002号 ·doi:10.1137/15M1020575
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。