×

分子动力学数据的主嵌套形状空间分析。 (英语) Zbl 1435.62216号

摘要:分子动力学模拟产生了大量的分子时间序列数据集。有趣的是,以简洁、低维的方式总结分子的形状演变。然而,欧几里德技术(如主成分分析(PCA))可能存在问题,因为数据可能远离平面流形。主嵌套球体对数据进行了与通常基于欧几里德子空间的PCA完全不同的分解[S.Jung先生等,《生物特征99》,第3期,551-568(2012;Zbl 1437.62507号)]. 以反向方式将连续较低维的子空间拟合到数据中,目的是在每个阶段保留信号并消除噪声。我们将该方法应用于三维子形状空间,并提供了一些实用的拟合算法。该方法用于肽的聚类分析,可以识别不同状态的分子。此外,还探讨了集群状态之间的时间转换。

MSC公司:

62H25个 因子分析和主成分;对应分析
62H30型 分类和区分;聚类分析(统计方面)
62华氏35 多元分析中的图像分析
62页99 统计学的应用
62兰特 歧管统计
92E10型 分子结构(图形理论方法、微分拓扑方法等)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Cootes,T.F.、Taylor,C.J.、Cooper,D.H.和Graham,J.(1994)。使用从多组示例生成的灵活形状模型进行图像搜索。《统计学与图像》,第2卷(K.V.Mardia编辑)111-139。牛津卡尔法克斯。
[2] Damon,J.和Marron,J.S.(2014)。向后主成分分析和主嵌套关系。数学杂志。成像视力50 107-114·Zbl 1308.62124号 ·doi:10.1007/s10851-013-0463-2
[3] Dryden,I.L.(2018)。形状包装。奥地利维也纳R统计计算基金会,贡献包,1.2.4版。
[4] Dryden,I.L.和Mardia,K.V.(2016)。统计形状分析,及其在R中的应用,第二版,Wiley,Chichester·Zbl 1381.62003年
[5] Fletcher,P.T.、Lu,C.、Pizer,S和Joshi,S(2004)。用于形状非线性统计研究的主测地线分析。IEEE传输。医学图像。23 995-1005.
[6] Goodall,C.(1991)。Procrustes形状统计分析方法。J.罗伊。统计师。Soc.系列。乙53 285-339·Zbl 0800.62346号 ·doi:10.1111/j.2517-6161.1991.tb01825.x
[7] 高尔,J.C.(1975年)。广义Procrustes分析。《心理测量学》40 33-51·Zbl 0305.62038号 ·doi:10.1007/BF02291478
[8] Huckemann,S.、Hotz,T.和Munk,A.(2010年)。内禀形状分析:黎曼流形模等距李群作用的测地PCA。统计师。Sinica 20 1-100号·Zbl 1180.62087号
[9] Huckemann,S.和Ziezold,H.(2006)。黎曼流形的主成分分析及其在三角形状空间中的应用。申请中的预付款。普罗巴伯。38 299-319. ·Zbl 1099.62059号 ·doi:10.1239/aap/1151337073
[10] Jolliffe,I.T.(2002)。主成分分析,第二版,《统计学中的斯普林格系列》。纽约州施普林格·Zbl 1011.62064号
[11] Jung,S.、Dryden,I.L.和Marron,J.S.(2012)。分析主要嵌套球体。生物特征99 551-568·Zbl 1437.62507号 ·doi:10.1093/biomet/ass022
[12] Kendall,D.G.(1984)。形状流形、Procrustean度量和复杂射影空间。牛市。伦敦。数学。Soc.16 81-121·Zbl 0579.62100号 ·doi:10.1112/blms/16.281
[13] Kenobi,K.、Dryden,I.L.和Le,H.(2010年)。形状曲线和测地线建模。生物特征97 567-584·Zbl 1195.62110号 ·doi:10.1093/biomet/asq027
[14] Kent,J.T.(1994)。复杂的宾厄姆分布和形状分析。J.罗伊。统计师。Soc.系列。乙56 285-299·Zbl 0806.62040号 ·doi:10.1111/j.2517-6161.1994.tb01978.x
[15] Kent,J.T.和Mardia,K.V.(2001年)。形状、Procrustes切线投影和双侧对称。生物特征88 469-485·兹伯利0985.62041 ·doi:10.1093/biomet/88.2.469
[16] Le,H.L.(1991)。关于欧几里德形状空间中的测地线。J.隆德。数学。Soc.(2)44 360-372·Zbl 0766.53038号 ·doi:10.1112/jlms/s2-44.2.360
[17] Le,H.L.和Kendall,D.G.(1993年)。欧几里德形状空间的黎曼结构:一个新的统计环境。安。统计师。21 1225-1271. ·Zbl 0831.62003号 ·doi:10.1214/aos/1176349259
[18] Margulis,C.J.、Stern,H.A.和Berne,B.J.(2002)。显式溶剂中小(α)螺旋的螺旋展开和分子内氢键动力学。《物理学杂志》。化学。乙106 10748-10752。
[19] Marron,J.S.和Alonso,A.M.(2014)。面向对象数据分析概述。生物。期刊56 732-753·Zbl 1309.62008号 ·doi:10.1002/bimj.201300072
[20] Panaretos,V.M.、Pham,T.和Yao,Z.(2014)。主要流量。J.Amer。统计师。协会109 424-436·Zbl 1367.62187号 ·doi:10.1080/01621459.2013.849199
[21] Pennec,X.(2018)。流形上的重心子空间分析。安。统计师。46 2711-2746. ·Zbl 1410.60018号 ·doi:10.1214/17-AOS1636
[22] Salomon-Ferrer,R.、Case,D.A.和Walker,R.C.(2013年)。琥珀生物分子模拟软件包概述。威利跨学科评论:计算分子科学3 198-210。
[23] Wang,H.和Marron,J.S.(2007年)。面向对象的数据分析:树集。安。统计师。35 1849-1873. ·Zbl 1126.62002号 ·doi:10.1214/009053607000000217
[24] Ward,J.H.Jr.(1963年)。分层分组以优化目标函数。J.Amer。统计师。协会58 236-244。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。