跳到主要内容
10.1145/2975167.2975182acm会议文章/章节视图摘要出版物页面密克罗尼西亚联邦会议记录会议集合
研究论文

计算分子建模中不确定性量化的统计框架

出版:2016年10月2日出版历史

摘要

计算分子建模通常涉及噪声数据,包括模型参数的不确定性、计算近似值等,所有这些都会传播到所有计算量(QOI)的不确定性。这是一个经常被忽视或处理得不够严格的基本问题。在本文中,我们介绍了一个统计框架,用于建模此类不确定性,并为几个QOI提供准确性证书。我们的框架将不确定性源视为具有已知分布的随机变量,并提供了将这些不确定性传播到QOI(也被建模为随机变量)的理论和经验技术。此外,该框架还可以对多步骤管道中的不确定性进行建模,其中一步的结果级联到下一步。虽然有许多不确定性来源,但在本文中,我们仅将我们的框架应用于高分辨率模型中原子的位置不确定性,以及B因子形式及其在计算分子属性中的影响。经验方法要求在随机变量的联合空间内进行充分采样。我们表明,使用新的伪随机数生成技术,可以用很少的样本实现所需的覆盖。我们还开发了直观的可视化模型来分析分子建模不同阶段的不确定性。我们坚信,该框架在评估预测计算模型方面具有巨大价值,并为其准确性提供了统计保证。

工具书类

  1. K.Azuma。某些相依随机变量的加权和。《德国数学杂志》,19:357-3671967年。谷歌学者谷歌学者交叉引用交叉引用
  2. C.Bajaj、A.Bhowmick、E.Chattopadhyay和D.Zuckerman。关于运动组乘积空间中的低差异抽样。arXiv预印arXiv:1411.77532014。谷歌学者谷歌学者
  3. C.Bajaj、S.-C.Chen和A.Rand。基于Poisson-Boltzmann的分子静电的高效高阶快速多极边界元解。SIAM J.科学。计算。,33(2):826--848, 2011.谷歌学者谷歌学者数字图书馆数字图书馆
  4. C.Bajaj、P.Djeu、V.Siddavanahalli和A.Thane。TexMol:大型柔性多组分分子复合物的交互式可视化探索。程序中。IEEE可视化。Conf.,第243-250页,德克萨斯州奥斯汀,2004年。谷歌学者谷歌学者数字图书馆数字图书馆
  5. C.Bajaj、H.Lee、R.Merkert和V.Pascucci。基于NURBS的大分子B-rep模型及其特性。程序中。交响乐团。实体模型。申请。,第217至228页,1997年。谷歌学者谷歌学者数字图书馆数字图书馆
  6. C.Bajaj、V.Pascucci、A.Shamir、R.Holt和A.Netravali。分子表面的动态维护和可视化。离散应用程序。数学。,127:23--51, 2003.谷歌学者谷歌学者数字图书馆数字图书馆
  7. C.Bajaj和V.Siddavanahalli。F2Dock:一种基于傅里叶变换的快速错误边界蛋白质-蛋白质对接方法。CS技术报告TR-06-57,德克萨斯大学奥斯汀分校,德克萨斯州奥斯汀,美国德克萨斯州78712,2006年11月。谷歌学者谷歌学者
  8. C.Bajaj和W.Zhao。快速分子溶剂化能量学和力计算。SIAM J.科学。计算。,31(6):4524--4552, 2010.谷歌学者谷歌学者数字图书馆数字图书馆
  9. D.Bashford和D.A.Case。大分子溶剂化效应的广义Born模型。每年。物理版。化学。,51:129--152, 2000.谷歌学者谷歌学者交叉引用交叉引用
  10. G.E.Box和M.E.Muller。关于生成随机正态偏差的注记。《数理统计年鉴》,(29):610--6111958。谷歌学者谷歌学者
  11. A.T.Briinger。自由R值:用于评估晶体结构准确性的新统计量。《自然》,355:472--4751992年。谷歌学者谷歌学者交叉引用交叉引用
  12. B.T.Burnley、P.V.Afonine、P.D.Adams和P.Gros。通过系综精细化模拟蛋白质晶体结构的动力学。Elife,1:e003112012年。谷歌学者谷歌学者交叉引用交叉引用
  13. D.A.Case、T.E.Cheatham、T.Darden、H.Gohlke、R.Luo、K.M.Merz、A.Onufriev、C.Simmerling、B.Wang和R.J.Woods。琥珀生物分子模拟程序。计算化学杂志,26(16):1668-16882005。谷歌学者谷歌学者交叉引用交叉引用
  14. H.切尔诺夫。基于观测值总和的假设检验的渐近有效性度量。《数理统计年鉴》,23(4):493--5071952。谷歌学者谷歌学者交叉引用交叉引用
  15. R.Chowdhury、D.Keidel、M.Moussalem、M.Rasheed、A.Olson、M.Sanner和C.Bajaj。蛋白质与F2 Dock 2.0和GB对接——重新储存。生物物理学。J.,8(3):2013年1月19日。谷歌学者谷歌学者
  16. M.康诺利。分析分子表面计算。J.应用。克里斯特。,16:548--558, 1983.谷歌学者谷歌学者交叉引用交叉引用
  17. W.D.Cornell、P.Cieplak、C.I.Bayly、I.R.Gould、K.M.Merz、D.M.Ferguson、D.C.Spellmeyer、T.Fox、J.W.Caldwell和P.A.Kollman。用于模拟蛋白质、核酸和有机分子的第二代力场。美国化学学会杂志,117(19):5179-51971995。谷歌学者谷歌学者交叉引用交叉引用
  18. D.克鲁克申克。关于蛋白质结构精度的备注。《结晶学学报》第D节:生物结晶学,55(3):583--6011999。谷歌学者谷歌学者交叉引用交叉引用
  19. T.多林斯基、J.尼尔森、J.麦卡蒙和N.贝克。Pdb2pqr:用于设置泊松-玻尔兹曼静电计算的自动管道。核酸研究,32:665-6672004。谷歌学者谷歌学者交叉引用交叉引用
  20. D.艾森伯格和A.麦克拉克伦。蛋白质折叠和结合中的溶解能。《自然》(伦敦),319:199--2031986年。谷歌学者谷歌学者交叉引用交叉引用
  21. N.Eswar、B.Webb、M.A.Marti-Renom、M.S.Madhusudhan、D.Eramian、M.-Y.Shen、U.Pieper和A.Sali。使用MODELLER进行比较蛋白质结构建模。货币。保护。《蛋白质科学》,第2章:第2.9单元,2007年。谷歌学者谷歌学者
  22. M.Feig和C.Brooks。隐式溶剂模型在生物分子模拟中的发展和应用的最新进展。《结构生物学的当前观点》,14:217,2004年。谷歌学者谷歌学者交叉引用交叉引用
  23. P.Gopalan、R.Meka、O.Reingold和D.Zuckerman。组合形状的伪随机生成器。SIAM J.计算。,42(3):1051--1076, 2013.谷歌学者谷歌学者数字图书馆数字图书馆
  24. M.Habeck、M.Nilges和W.Rieping。贝叶斯推断在大分子结构测定中的应用。《物理评论》E,72(3):0319122005。谷歌学者谷歌学者交叉引用交叉引用
  25. W.霍夫丁。有界随机变量和的概率不等式。《美国统计协会杂志》,58(301):13-301963年。谷歌学者谷歌学者交叉引用交叉引用
  26. H.Hwang、T.Vreven、J.Janin和Z.Weng。蛋白质——蛋白质对接基准版本4.0。《蛋白质:结构、功能和生物信息学》,78(15):3111--3114,2010年。谷歌学者谷歌学者
  27. F.James、J.Hoogland和R.Kleiss。准蒙特卡罗、差异和误差估计。方法,第9页,1996年。谷歌学者谷歌学者
  28. A.Kuzmanic、N.S.Pannu和B.Zagrovic。X射线精细化大大低估了生物分子晶体中微观异质性的水平。《自然通讯》,2014年5月。谷歌学者谷歌学者
  29. A.Kuzmanic和B.Zagrovic。测定实验b因子的系综平均成对根均方偏差。生物物理杂志,98(5):861--8712010。谷歌学者谷歌学者交叉引用交叉引用
  30. P.T.Lang、H.-L.Ng、J.S.Fraser、J.E.Corn、N.Echols、M.Sales、J.M.Holton和T.Alber。自动电子密度采样揭示了蛋白质中普遍存在的构象多态性。蛋白质科学,19(7):1420--14312010。谷歌学者谷歌学者交叉引用交叉引用
  31. H.Lei、X.Yang、B.Zheng、G.Lin和N.A.Baker。定量生物分子溶剂化中构象不确定性的影响。arXiv预打印arXiv:1408.56292014。谷歌学者谷歌学者
  32. Y.Lei和R.R.Mettu。x射线晶体学数据模型拟合的置信度。《生物信息学、计算生物学和生物医学信息学国际会议论文集》,第489页。ACM,2013年。谷歌学者谷歌学者数字图书馆数字图书馆
  33. C.麦克迪米德。关于有界差分法。组合数学调查,141(141):148-1881989。谷歌学者谷歌学者
  34. H.尼德雷特。准蒙特卡罗方法。《量化金融百科全书》,24(1):55-61990。谷歌学者谷歌学者
  35. M.Nina、D.Beglov和B.Roux。基于分子动力学自由能模拟的连续静电计算的原子半径。《物理学杂志》。化学。B、 101:5239--52481997年。谷歌学者谷歌学者交叉引用交叉引用
  36. A.Onufriev、D.Bashford和D.Case。修正了适用于大分子的广义Born模型。《物理学杂志》。化学。B、 104:3712--372000年。谷歌学者谷歌学者交叉引用交叉引用
  37. J.菲利普。盒子中两个随机点之间距离的概率分布。KTH数学,瑞典斯德哥尔摩皇家理工学院,2007年。谷歌学者谷歌学者
  38. M.Rasheed、N.Clement、A.Bhowmick和C.Bajaj。量化和可视化分子模型中的不确定性。arXiv预印arXiv:1508.038822015。谷歌学者谷歌学者
  39. F.理查兹。面积、体积、包装和蛋白质结构。每年。生物物理版。生物工程。,6:151--176, 1977.谷歌学者谷歌学者交叉引用交叉引用
  40. W.Rieping、M.Habeck和M.Nilges。推理结构确定。《科学》,309(5732):303--3062005。谷歌学者谷歌学者交叉引用交叉引用
  41. T.R.施耐德。我们可以从各向异性温度因子中学到什么。《CCP4研究周末会议录》(Dodson,E.,Moore,M.,Ralph,A.&Bailey,S.编),第133-144页,1996年。谷歌学者谷歌学者
  42. Schrödinger,LLC.PyMOL分子图形系统,版本1.3r1。PyMOL PyMOL-Molecular Graphics System,1.3版,Schrödinger,LLC.,2010年8月。谷歌学者谷歌学者
  43. N.J.斯隆。整数序列在线百科全书(OEIS),2014年。http://oeis.org/A103986。谷歌学者谷歌学者
  44. W.G.Touw和G.Vriend。Bdb:具有一致b-factors的pdb文件的数据库。蛋白质工程与设计,27(11):457-4622014年11月。谷歌学者谷歌学者交叉引用交叉引用
  45. O.Trott和A.J.Olson。Autodock葡萄酒。J.计算。化学。,31:445--461, 2010.谷歌学者谷歌学者
  46. K.Trueblood、H.-Bürgi、H.Burzlaff、J.Dunitz、C.Gramaccioli、H.Schulz、U.Shmueli和S.Abrahams。原子扩散参数命名法。原子位移参数命名小组委员会的报告。《结晶学学报A辑:结晶学基础》,52(5):770--781996。谷歌学者谷歌学者交叉引用交叉引用

索引术语

  1. 计算分子建模中不确定性量化的统计框架

                建议

                评论

                登录选项

                请检查您是否可以通过登录凭据或您的机构访问此文章以获得完全访问权限。

                登录

                完全访问权限

                • 发布于

                  封面图片ACM会议
                  BCB’16:第七届ACM生物信息学、计算生物学和健康信息学国际会议论文集
                  2016年10月
                  675页
                  国际标准图书编号:9781450342254
                  内政部:10.1145/2975167

                  版权所有©2016 ACM

                  如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布、在服务器上发布或重新分发到列表,需要事先获得特定许可和/或收取费用。向请求权限[电子邮件保护]

                  出版商

                  计算机协会

                  美国纽约州纽约市

                  出版历史

                  • 出版:2016年10月2日

                  权限

                  请求有关此文章的权限。

                  请求权限

                  检查更新

                  限定符

                  • 研究论文
                  • 研究
                  • 推荐有限公司

                  接受率

                  总体验收率254属于885提交文件,29%

                PDF格式

                以PDF文件查看或下载。

                PDF格式

                电子阅读器

                使用eReader联机查看。

                电子阅读器