×

\(伽马)-SUP:一种用于非对称粒子低温电子显微镜图像的聚类算法。 (英语) Zbl 1454.62527号

摘要:低温电子显微镜(Cryo-EM)最近已成为获取天然状态下生物大分子三维结构的有力工具。用于进行有意义重建的最小低温电子显微镜图像数据集由数千个用少量电子拍摄的相同粒子的随机定向投影组成。从二维投影计算三维结构需要聚类,聚类的目的是通过对方向相似的图像进行分组来提高每个视图中的信噪比。然而,主流的聚类技术往往受到低温EM数据的三个特征的影响:高噪声含量、高维度和大量聚类。此外,由于聚类需要通过二维对齐将方向相似的图像注册到相同的像素坐标中,因此希望聚类算法能够将未对齐的图像标记为离群值。在这里,我们引入了一种聚类算法(gamma)-SUP,用(q)-高斯混合模型对数据进行建模,并采用最小(gamma-散度)进行估计,然后使用自更新过程获得数值解。我们将γ-SUP应用于两种基准大分子RNA聚合酶II和核糖体的低温电子显微镜图像。在前一种情况下,选择模拟图像将聚类与对齐解耦,以证明(gamma)-SUP比cryo-EM社区中使用的现有聚类方法对偏差离群值更为稳健。在后一种情况下,通过我们的γ-SUP方法对真实低温电子显微镜数据进行聚类,消除了许多视图中的噪声,从而在投影水平上揭示了核糖体的真实结构特征。

MSC公司:

第62页,第35页 统计学在物理学中的应用
62英尺35英寸 鲁棒性和自适应程序(参数推断)
62H25个 因子分析和主成分;对应分析
62H30型 分类和区分;聚类分析(统计方面)

软件:

XMIPP公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Adrian,M.、Dubochet,J.、Lepault,J.和McDowall,A.W.(1984)。病毒的冷冻电子显微镜。《自然》308 32-36。
[2] Amari,S.-i.和Ohara,A.(2011年)。概率分布(q)-指数族的几何。熵13 1170-1185·Zbl 1306.62073号 ·doi:10.3390/e13061170
[3] Banfield,J.D.和Raftery,A.E.(1993年)。基于模型的高斯和非高斯聚类。生物统计学49 803-821·Zbl 0794.62034号 ·doi:10.2307/2532201
[4] Basu,A.、Harris,I.R.、Hjort,N.L.和Jones,M.C.(1998年)。通过最小化密度功率发散,实现稳健高效的估计。生物特征85 549-559·Zbl 0926.62021号 ·doi:10.1093/biomet/85.3549
[5] Bracewell,R.N.(1956年)。射电天文学中的带状积分。南方的。《物理学杂志》。9 198-217. ·Zbl 0071.21304号 ·doi:10.1071/PH560198
[6] Carreira-Perpiñán,M.A.(2006年)。高斯模糊均值漂移快速非参数聚类。第23届国际机器学习会议论文集153-160。宾夕法尼亚州匹兹堡ACM。
[7] Chang,W.-H.,Chiu,M.-K.,Chen,C.-Y.,Yen,C.-F.,Lin,Y.-C.,Weng,Y.-P.,Chang,J.-C.,Wu,Y.-M.,Cheng,H.,Fu,J.和Tu,I.-P.(2010)。Zernike相板低温电子显微镜有助于对未染色的不对称蛋白质复合物进行单粒子分析。结构18 17-27。
[8] Chen,T.-L.(2013)。关于模糊均值漂移过程的收敛性和一致性。可从获取。1305.1040
[9] Chen,T.-L.和Shiu,S.-Y.(2007)。一种基于自更新过程的聚类算法。在JSM会议记录中,统计计算第2034-2038节。美国统计协会,犹他州盐湖城。
[10] Cheng,Y.(1995)。均值转移、模式搜索和聚类。IEEE模式分析和机器智能汇刊17 790-799。
[11] Cichocki,A.和Amari,S.-i.(2010年)。α-β-和γ-差异家族:灵活而稳健的相似性度量。熵12 1532-1568·Zbl 1229.94030号 ·doi:10.3390/e12061532
[12] Crowther,R.A.、Amos,L.A.、Finch,J.T.、De Rosier,D.J.和Klug,A.(1970年)。通过电子显微照片的傅里叶合成对球形病毒进行三维重建。自然226 421-425。
[13] Dubochet,J.(2012年)。Cryo-EM-第一个三十年。《微生物学杂志》。245 221-224.
[14] Eguchi,S.、Komori,O.和Kato,S.(2011年)。投影功率熵和最大Tsallis熵分布。熵13 1746-1764·Zbl 1301.82002号 ·doi:10.3390/e13101746
[15] Field,C.和Smith,B.(1994年)。稳健估计:加权最大似然法。《国际统计评论》62 405-424·Zbl 0825.62428号 ·doi:10.2307/1403770
[16] Frank,J.(2002)。用低温电子显微镜对大分子进行单粒子成像。每年。生物物理学评论。生物摩尔。结构。31 303-319.
[17] Frank,J.(2009)。电子显微镜中生物大分子的单粒子重建——30年。Q.生物物理学评论。42 139-158.
[18] Frank,J.(2012)。mRNA-tRNA易位期间的中间状态。货币。操作。结构。生物。22 778-785。
[19] Frank,J.、Radermachera,M.、Penczeka,P.、Zhua,J.,Li,Y.、Ladjadj,M.和Leitha,A.(1996)。蜘蛛和网络:三维电子显微镜和相关领域的图像处理和可视化。结构生物学杂志116 190-199。
[20] Frigyik,B.A.、Srivastava,S.和Gupta,M.R.(2008)。函数Bregman散度和分布的Bayes估计。IEEE传输。通知。理论54 5130-5139·Zbl 1319.62137号 ·doi:10.1109/TIT.2008.929943
[21] Fujisawa,H.和Eguchi,S.(2008)。对严重污染具有小偏差的稳健参数估计。《多元分析杂志》。99 2053-2081. ·Zbl 1169.62010号 ·doi:10.1016/j.jmva.2008.02.004
[22] Fukunaga,K.和Hostetler,L.D.(1975年)。密度函数梯度的估计,在模式识别中的应用。IEEE传输。通知。理论IT-21 32-40·Zbl 0297.62025号 ·doi:10.1109/TIT.1975.1055330
[23] Gneiting,T.和Raftery,A.E.(2007年)。严格正确的评分规则、预测和评估。J.Amer。统计师。协会102 359-378·Zbl 1284.62093号 ·doi:10.1198/0162145000001437
[24] 好,I.J.(1971)。评论“测量信息和不确定性”,《统计推断基础》(V.P.Godambe和D.A.Sprott,eds.)265-273。霍尔特,里哈特和温斯顿,多伦多。
[25] Grassucci,R.、Taylor,D.和Frank,J.(2011)。低温电子显微镜用大分子复合物的制备。自然协议2 3239-3246。
[26] Hall,R.J.、Nogales,E.和Glaeser,R.M.(2011)。单粒子低温电子显微镜图像的精确建模量化了使用Zernike相位对比度的预期收益。J.结构。生物174 468-475。
[27] Hartigan,J.A.(1975年)。聚类算法。纽约威利·兹伯利0372.62040
[28] Henderson,R.(1995)。中子、电子和X射线用于未染色生物分子的原子分辨显微镜的潜力和局限性。Q.生物物理学评论。28 171-193.
[29] Hung,H.、Wu,P.、Tu,I.和Huang,S.(2012年)。关于二阶张量的多重线性主成分分析。生物特征99 569-583·Zbl 1437.62500号 ·doi:10.1093/biomet/ass019
[30] Jiang,W.,Baker,M.L.,Jakana,J.,Weigele,P.R.,King,J.和Chiu,W..(2008)。电子冷冻显微镜显示感染性epsilon15病毒衣壳的主干结构。自然451 1130-1134。
[31] Lepault,J.、Booy,F.P.和Dubochet,J.(1983年)。冷冻生物悬浮液的电子显微镜。《微生物学杂志》。129 89-102.
[32] Liu,H.、Jin,L.、Koh,S.B.S.、Atanasov,I.、Schein,S.、Wu,L.和Zhou,Z.H.(2010)。通过冷冻电镜观察人类腺病毒的原子结构,揭示蛋白质网络之间的相互作用。科学329 1038-1043。
[33] Lloyd,S.P.(1982)。PCM中的最小二乘量化。IEEE传输。通知。理论28 129-137·Zbl 0504.94015号 ·doi:10.1109/TIT.1982.1056489
[34] Lu,H.、Plataniotis,K.N.K.和Venetsanopoulos,A.N.(2008)。MPCA:张量对象的多线性主成分分析。IEEE传输。神经系统。Netw公司。19 18-39.
[35] Manning,C.、Raghavan,P.和Schtze,H.(2008)。信息检索导论。剑桥大学出版社,纽约·Zbl 1160.68008号
[36] McQueen,J.(1967)。多元观测值分类和分析的一些方法。第五届伯克利数理统计与概率研讨会论文集291-297。加利福尼亚大学出版社,加利福尼亚州伯克利。
[37] Mollah,M.N.H.、Sultana,N.、Minami,M.和Eguchi,S.(2010年)。用最小β-散度方法稳健地提取局部结构。神经网络23 226-238·Zbl 1396.68100号
[38] Saibil,H.R.(2000)。用低温电子显微镜测定大分子结构。《结晶学学报》第D节——生物结晶学56 1215-1222。
[39] Shiu,S.-Y.和Chen,T.-L.(2012)。通过自我更新过程进行聚类。可从获取。1201.1979
[40] Singer,A.、Coifman,R.R.、Sigworth,F.J.、Chester,D.W.和Shkolnisky,Y.(2010年)。通过投票检测低温电子显微镜中的一致共线。J.结构。生物.169 312-322。
[41] Sorzano,C.O.S.、Marabini,R.、Velázquez-Muriel,J.、Bilbao-Castro,J.R.、Scheres,S.H.W.、Carazo,J.M.和Pascual-Montano,A.(2004)。XMIPP:新一代用于电子显微镜的开源图像处理软件包。J.结构。生物。148 194-204。
[42] Sorzano,C.O.S.、Bilbao-Castro,J.R.、Shkolnisky,Y.、Alcorlo,M.、Melero,R.、Caffarena-Fernandez,G.、Li,M.,Xu,G.,Marabini,R.和Carazo,J.M.(2010)。电子显微镜中单粒子投影多参考比对的聚类方法。结构生物学杂志171 197-206。
[43] Tibshirani,R.、Walther,G.和Hastie,T.(2001)。通过间隙统计估计数据集中的簇数。J.R.统计社会服务。B统计方法。63 411-423. ·Zbl 0979.62046号 ·数字对象标识代码:10.1111/1467-9868.00293
[44] van Heel,M.(1987)。角度重建:3D重建投影方向的后验分配。超微显微镜21 111-124。
[45] van Heel,M.、Gowen,B.、Matadeen,R.、Orlova,E.V.、Finn,R.、Pape,T.、Cohen,D.、Stark,H.、Schmidt,R.、Schatz,M.和Patwardhan,A.(2000年)。单粒子电子冷冻显微镜:朝向原子分辨率。Q.生物物理学评论。33 307-369.
[46] Wilsome,D.和Cate,J.(2012年)。真核核糖体的结构和功能。《冷泉港生物学展望》4a011536。
[47] Windham,M.P.(1995)。稳健的模型拟合。J.R.统计社会服务。B统计方法。57 599-609·Zbl 0827.62030号
[48] Yang,Z.、Fang,J.、Chittuluru,J.,Asturias,F.J.和Penczek,P.A.(2012)。二维透射电子显微镜图像的迭代稳定对齐和聚类。结构20 237-247。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。