×

未标记点集的统计分析:化学信息学中的比较分子。 (英语) Zbl 1122.62090号

摘要:我们考虑使用贝叶斯方法比较两个或多个未标记点集。将该技术应用于一组类固醇分子表明了其潜在的效用,包括化学信息学和生物信息学中分子的比较。我们首先匹配一对分子,其中一个分子被视为随机,另一个被视为固定。针对点集坐标,提出了一种混合模型,其分布参数为标记矩阵(表示匹配的点对)和浓度参数。似然的一个重要性质是,它在数据的旋转和平移下是不变的。利用马尔可夫链蒙特卡罗模拟对参数进行了贝叶斯推断,结果表明该方法对类固醇数据有效。由于存在多个局部模式,很难从中模拟后验分布,我们还使用了额外的数据(原子上的部分电荷)来帮助完成这项任务。为了加速模拟算法,考虑了近似,并且近似快速算法导致与我们的数据的精确方法下的推断基本相同。还介绍了对多分子比对的扩展,并描述了一种在类固醇数据集上也很有效的算法。在所有类固醇分子匹配后,进行探索性数据分析,以检查哪些分子相似。此外,还考虑了多重比对问题的进一步贝叶斯推断。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
2015年1月62日 贝叶斯推断
92C40型 生物化学、分子生物学
65立方厘米 马尔可夫链的数值分析或方法
62J15型 配对和多重比较;多次测试

软件:

PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Bookstein,《地标数据的形态测量工具:几何和生物学》(1991)·Zbl 0770.92001号
[2] Chui,IEEE生物医学图像分析数学方法研讨会(MMBIA),第190页–(2000)
[3] Chui,一种新的非刚性配准点匹配算法,计算机视觉和图像理解89 pp 114–(2003)·Zbl 1053.68123号 ·doi:10.1016/S1077-3142(03)00009-2
[4] Coats,《CoMFA类固醇作为3D QSAR方法开发的基准数据集》,《药物发现和设计展望》,第12页,119–(1998)·doi:10.1023/A:1017050508855
[5] 交叉,用双步EM算法进行图形匹配,IEEE模式分析和机器智能汇刊20页1236–(1998)·doi:10.1009/34.730557
[6] Dryden,里程碑数据的大小和形状分析,Biometrika 79第57页–(1992)·Zbl 0753.62037号 ·doi:10.1093/biomet/79.1.57
[7] 德莱顿,统计形状分析(1998)
[8] 埃斯波西托,化学信息学。药物发现的概念、方法和工具第131页–(2004)
[9] Gold,《二维和三维点匹配的新算法:姿态估计和对应》,模式识别31 pp 1019–(1998)·doi:10.1016/S0031-3203(98)80010-1
[10] 分子相似矩阵的良好构效关系,《药物化学杂志》36页433–(1993)·doi:10.1021/jm00056a002
[11] Goodall,Procrustes形状统计分析方法(含讨论),《皇家统计学会杂志》,B辑53第285页–(1991)·Zbl 0800.62346号
[12] Gower,广义Procrustes分析,《心理测量学》40第33页–(1975)·Zbl 0305.62038号 ·doi:10.1007/BF02291478
[13] 绿色,使用层次模型的贝叶斯比对,在蛋白质生物信息学中的应用,Biometrika 93第235页–(2006)·Zbl 1153.62020年 ·doi:10.1093/biomet/93.2235
[14] 格罗斯,图论及其应用(1999)
[15] 汉弗莱(Humphrey),VMD-可视分子动力学,《分子图形学杂志》(Journal of molecular Graphics),14 pp 33–(1996)·doi:10.1016/0263-7855(96)00018-5
[16] Kendall,形状流形,Procrustean度量和复射影空间,伦敦数学学会公报16,第81页–(1984)·Zbl 0579.62100号 ·doi:10.1112/blms/16.281
[17] 肯德尔,形状和形状理论(1999)·doi:10.1002/9780470317006
[18] Kent,《形状、切线投影和双侧对称性》,Biometrika 88 pp 469–(2001)·Zbl 0985.62041号 ·doi:10.1093/生物技术/88.2.469
[19] Kent,LASR2004论文集:生物信息学、图像和小波第33页–(2004)
[20] Le,《欧几里德形状空间的黎曼结构:一个新的统计环境》,《统计年鉴》第21卷第1225页–(1993)·Zbl 0831.62003号 ·doi:10.1214/aos/1176349259
[21] Lemmen,分子结构排列的计算方法,《计算机辅助分子设计杂志》,14页,215–(2000)·Zbl 0916.92016号 ·doi:10.1023/A:1008194019144
[22] Mardia,多元分析(1979)
[23] Melville,《关于CoMFA模型的稳定性》,《化学信息与计算机科学杂志》44页1294–(2004)·doi:10.1021/ci049944o
[24] Melville,组合催化剂库的计算筛选,《化学通讯》第1410页–(2004)·doi:10.1039/b402378a
[25] Moss,S.Hancock,E.R.1996使用EM算法注册不完整雷达图像第七届英国机器视觉会议论文集R.B.Fisher E.Trucco 685 694英国机器视觉协会
[26] R开发核心团队,R:统计计算的语言和环境(2005)
[27] Rangarajan,医学成像信息处理,第29页–(1997)·doi:10.1007/3-540-63046-53
[28] Richmond,使用图像识别算法对三维分子进行校准,《分子图形与建模杂志》23页199–(2004)·doi:10.1016/j.jmgm.2004.04.004
[29] Small,《形状的统计理论》(1996)·doi:10.1007/978-1-4612-4032-7
[30] Stoyan,分形,随机形状和点场:几何统计方法(1994)
[31] Taylor,LASR2003论文集:随机几何、生物结构和图像第19页–(2003)
[32] Van Drie,《测定药效学3D数据库查询的策略》,《计算机辅助分子设计杂志》11第39页–(1997)·doi:10.1023/A:1008019326401
[33] Wagener,通过神经网络模拟皮质类固醇结合球蛋白和细胞溶质Ah受体活性的分子表面特性自相关,美国化学学会杂志117 pp 7769–(1995)·doi:10.1021/ja00134a023
[34] Walker,G.1999用于匹配空间点模式的鲁棒、非参数和自动方法
[35] 沃德,优化目标函数的分层分组,《美国统计协会杂志》58页236–(1963)·doi:10.1080/01621459.1963.10500845
[36] Wu,多元蛋白质结构的回归分析,《计算生物学杂志》5 pp 585–(1998)·doi:10.1089/cmb.1998.585
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。