研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

IUCrJ大学
第7卷| 第2部分| 2020年3月| 第253-267页
国际标准编号:2052-2525

从低温电子显微镜数据集估计高阶像差和各向异性放大率RELION公司-3.1

十字标记_颜色_方形_文本.svg

英国剑桥CB2 0QH医学研究委员会分子生物学实验室b条瑞士巴塞尔大学Biozentrum
*通信电子邮件:scheres@mrc-lmb.cam.ac.uk

(2019年10月30日收到; 2020年1月6日接受; 在线2020年2月11日)

提出了检测单粒子冷冻EM数据集中三种类型像差的方法:对称和反对称光学像差以及放大各向异性。由于这些方法仅取决于数据的初步三维重建的可用性,因此可以用于校正任何给定低温电子显微镜数据集的这些像差,后部使用五个公开可用的数据集,结果表明,考虑这些像差可以在存在这些影响时提高3D重建的分辨率。这些方法在开源软件包的3.1版中实现RELION公司.

1.简介

结构确定使用电子冷冻显微镜(cryo-EM)对生物大分子进行检测,主要受到样品在被破坏之前可能暴露的辐射剂量的限制。由于电子剂量低,低温电子显微镜不得不依赖于非常嘈杂的图像。近年来,电子探测器技术和处理算法的进步使得分子结构的重建分辨率足以满足从头开始原子模型(Fernandez-Leiro&Scheres,2016【Fernandez-Leiro,R.&Scheres,S.H.W.(2016),《自然》,537339-346。】). 随着分辨率的提高,显微镜光学系统施加的限制变得越来越重要。本文中,我们提出了估计三种光学效应(对称和反对称像差以及放大各向异性)的方法,当在重建过程中考虑这些效应时,可以提高可达到的分辨率。

为了增加对比度,低温电子显微镜图像通常是在离焦的情况下采集的,这会在电子束的散射和未散射组件之间引入相移。这种相移随空间频率而变化,并产生对比度传递函数(CTF)。由于样品的电子散射势对应于一个实值函数,因此其傅里叶空间表示具有弗里德尔对称性:复数的振幅结构系数在空间频率k个结构系数频率为−k个传统上,假设这两个频率的相移相同,这对应于实际值的CTF。然而,光学系统的缺陷会产生不对称相移,从而破坏散射波的弗里德尔对称性。这样做的效果是,CTF必须表示为复值函数,它不仅影响结构因子的振幅,还影响它们的相位。

一对相应空间频率的相移可以分离成对称分量(它们的平均位移)和反对称分量(与平均值的偏差)。在本文中,我们将把反对称分量称为反对称像差。相移的对称分量有时也会偏离无像差CTF模型预测的分量(Hawkes&Kasper,1996【Hawkes,P.W.和Kasper,E.(1996),《电子光学原理》,第3卷。纽约:学术出版社。]). 这样做的结果是,CTF并不总是由一组交替符号的椭圆环来充分表示,但这些所谓的Thon环可以呈现稍微不同的形状。我们将这种与传统CTF模型的偏差称为对称像差.

除了反对称像差和对称像差外,记录的图像本身还可能在两个垂直方向上被不同的放大倍数所扭曲。这称为各向异性放大。通过测量多晶试样功率谱的椭圆度,可以检测各向异性放大率(Grant&Grigorieff,2015【Grant,T.&Grigorieff,N.(2015),《结构生物学》192204-208。】). 这具有提供绝对放大率校准的优点,但需要额外的实验,显微镜校准可能会在这些实验之间漂移。对于几个二十面体病毒数据集,在比较未失真三维参考图的投影与单个粒子图像(Yu等。, 2016[Yu,G.,Li,K.,Liu,Y.,Chen,Z.,Wang,Z..,Yan,R.,Klose,T.,Tang,L.&Jiang,W.(2016).结构生物学杂志.195,207-215。]).

由于反对称像差和对称像差以及各向异性放大率产生不同的影响,我们提出了三种不同且独立的方法来估计它们。我们最近提出了一种方法来估计由倾斜电子束(Zivanov等。, 2018[Zivanov,J.,Nakane,T.,Forsberg,B.O.,Kimanius,D.,Hagen,W.J.,Lindahl,E.&Scheres,S.H.W.(2018).电子生活,7,e42166]). 在本文中,我们提出了该方法的一个扩展,它允许我们估计表示为泽尼克多项式线性组合的任意反对称像差(泽尼克,1934[Zernike,F.(1934),《物理学》,第1689-704页。]). 估计对称像差和各向异性放大率的方法是新颖的。与反对称像差校正的方法类似,对称像差校正方法也使用Zernike多项式对估计的像差进行建模。选择Zernike多项式作为基础在某种程度上是任意的,这里描述的方法可以稍作修改,以使用任何其他函数作为基础。特别地,我们没有利用Zernike多项式的正交性,因为它们仅被定义为在整个均匀加权单位圆盘上正交。在我们的情况下,证据在傅立叶空间中分布不均匀,并且考虑到这一事实破坏了多项式的正交性。

材料科学界对电子显微镜中的光学像差进行了广泛的研究(Batson等。, 2002【Batson,P.E.,Dellby,N.&Krivanek,O.L.(2002),《自然》,418617-620。】; 克里瓦内克等。, 2008【Krivanek,O.,Corbin,G.,Dellby,N.,Elston,B.,Keyse,R.,Murfitt,M.,Own,C.,Szilagyi,Z.&Woodruff,J.(2008)。超微显微镜,108,179-195。】; 萨克斯顿,1995年[Saxton,W.(1995),《显微镜杂志》179201-213。], 2000【Saxton,W.(2000),超微显微镜,81,41-45。】; 迈耶等。, 2002【Meyer,R.、Kirkland,A.和Saxton,W.(2002)。超微显微镜,92,89-109。】). 然而,到目前为止,他们的估计需要具有已知结构和比生物样品更大的抗辐射性的特定测试样品。本文中提出的方法直接适用于生物样品的低温电子显微镜单粒子数据集,从而可以在收集数据后估计影响,而无需对特定测试样品进行额外实验。使用EMPIAR数据库中公开的数据集(Iudin等。, 2016[Iudin,A.、Korir,P.K.、Salavert-Torres,J.、Kleywegt,G.J.和Patwardhan,A.(2016)。《自然方法》,第13期,第387-388页。]),我们说明了当这些光学效应出现时,它们的校正会导致分辨率增加的重建。

2.材料和方法

2.1、。观测模型

我们正在研究一个由大量粒子图像组成的单粒子冷冻EM数据集。我们假设我们已经有一个达到一定分辨率的粒子的初步3D参考图,并且我们知道所有观察到的粒子的近似观察参数。这使我们能够预测每个粒子图像,进而通过将这些预测图像与观测图像进行比较,来估计光学效果的参数。

X(X)第页,k个[{\bb C}]是粒子观测图像的复振幅第页[{\bb N}]用于2D空间频率k个[{\bb Z}^2]在不损失一般性的情况下,我们可以假设观察到的图像发生了偏移,从而使粒子的中心出现在图像的原点。我们可以通过沿着适当的观看方向在3D参考上进行积分来获得相应的预测图像。根据中心切片定理,相应的复振幅第页,k个[{\bb C}]预测粒子图像的

[V_{p,{\bf-k}}=W(A_p{\bf k}),\eqno(1)]

哪里[W:{\bb R}^3\mapsto{\bb-C}]是傅里叶空间中的3D参考地图A类第页是由视角产生的3×2投影矩阵。由于2D像素的反向投影位置k个主要位于参考地图的3D体素之间,我们确定W公司(A类第页k个)使用线性插值。

此外,我们假设我们估计了每个粒子的离焦和像散,以及显微镜的球差,从而也可以预测CTF。因此我们可以写

[X_{p,{\bf k}}=\exp(i\varphi_{\bf k}){\rm CTF}_{p,{\bf k}}V_{p,{\bf k}}+n_{p,{\bf k}},\eqno(2)]

哪里φk个是由反对称像差CTF引起的相移角第页,k个是CTF的真正组成部分n个第页,k个表示噪声。

下面介绍的三种方法都是为了通过最小化X(X)第页,k个和exp(φk个)CTF公司第页,k个第页,k个。这相当于最大似然假设所有n个第页,k个从相同的正态分布中得出。

2.2. 反对称像差

反对称像差改变了观测图像中的相位,并用角度表示φk个在(2)中[链接]。我们假设φk个对于足够多的粒子来说是常数。这种假设是必要的,因为在存在典型的强噪声的情况下,我们需要来自大量粒子图像的信息来获得可靠的估计。

我们建模φk个以反对称泽尼克多项式为基础,

[\varphi_{\bf-k}({\bf c})=\textstyle\sum\limits_b c_b Z_b

哪里c(c)b条[{\bb R}]描述像差的未知系数和Z轴b条(k个)是反对称泽尼克多项式的子集。为了清楚起见,省略了这些多项式的通常的双指数排序。这组多项式总是包含一阶项Z轴1−1(k个)和Z轴11(k个)对应于2D中的刚性运动。在估计过程中考虑这些项是至关重要的,因为它们捕捉到了粒子位置中的任何系统误差,这些误差是在不对称像差下估计位置时出现的,特别是在光束倾斜引起的轴向彗差下。在这种情况下,粒子被错误地移动,以中和中频范围内的彗差,从而过度补偿低频范围内的相移。因此,测量的相移是轴向彗差和平移的叠加,因此必须进行建模。

系数c(c)b条通过最小化以下所有粒子的平方差之和来确定,

[E_{\rm asymm}=\textstyle\sum\limits_{p,{\bf k}}f_{\bf-k}}\big|X_{p

哪里(f)k个是重构的FSC给出的启发式权重项;其目的是抑制频率的贡献|k个|其参考不太可靠。

由于典型数据集包含10个4和106粒子,每个粒子图像通常由10个以上的粒子组成4傅里叶像素,优化(4)中的非线性表达式[链接]直接读取是非常不切实际的,尤其是因为在每次迭代中都可能需要从光盘重新加载图像。相反,我们采用两步走的方法。首先,我们将上述二次函数和的和减少为二次函数的单个和,每个Fourier空间像素一个k个,

[E_{\rm asymm}=\textstyle\sum\limits_{\bf k}w_{\ff k}|\exp[i\varphi_{\ffk k}({\ff c})]-q_{\ff-k}|^2+k,\eqno(5)]

哪里K(K)是一个常数,不会影响c(c)b条.每像素最佳相移q个k个[{\bb C}]和重量w个k个[{\bb R}]由提供

[\eqalignno{q_{\bf k}&=\textstyle\sum\limits_p(X_{p,{\bf-k}}{\rm CTF}_{p、{\bfk}}V_{p和{\bv-k}}^*)/\textstyle\sum\simits_p{\rm-CTF}_{p,{\bf-k}{2|V_{p,{bf-k{}|^2,&(6)\cr-w_{\bf k}&=f_{\bf k}\textstyle\sum\limits_p{\rm CTF}_{p,{\bf k}}^2|V_{p、{\bf-k}}|^2.&(7)}]

这与我们在RELION公司-3.0(齐瓦诺夫等。, 2018[Zivanov,J.,Nakane,T.,Forsberg,B.O.,Kimanius,D.,Hagen,W.J.,Lindahl,E.&Scheres,S.H.W.(2018).电子生活,7,e42166]); 光束倾斜实际上只是反对称像差的可能来源之一。计算q个k个w个k个只需要对数据集中的所有图像进行一次迭代,对于这里显示的数据集,在24核2.9 GHz Intel Xeon工作站上需要大约一个小时的时间。

一旦q个k个w个k个已知,最佳c(c)b条通过使用Nelder–Mead下坡单纯形(Nelder&Mead,1965【Nelder,J.A.&Mead,R.(1965),《计算杂志》第7期,第308-313页。】)方法,

[{\bf-c}={\rm argmin}_{{\bf c}^\prime}\textstyle\sum\limits_{\bfk}w_{\bf k}\big|\exp[i\varphi_{\baf k}({\bfc})]-q_{\bof k}\ big|^2。\等式(8)]

此步骤只需要几秒钟的计算时间。除了使问题易于处理外,这种分为两个步骤的分离还允许我们检查每像素最优的相位角q个k个直观地确定数据集中存在的反对称像差类型。

在最佳反对称像差系数之后c(c)它们用于反转所有观测图像的相移X(X)从中重建三维地图时。

2.3. 对称像差

与反对称像差不同,对称像差作用于CTF的绝对值。在这种像差存在的情况下,CTF不再由严格意义上的交替符号椭圆环组成,而是可以采取更不寻常的形式。在我们的实验中,我们专门观察到椭圆变形为略呈方形的形状。为了估计对称像差,我们需要确定隐藏在测量的噪声像素下面的CTF的最可能变形。由于低温电子显微镜数据集中的显微照片通常是在不同的离焦度下采集的,因此测量整个数据集的集体功率谱是不够的;相反,我们需要确定应用于不同的CTF。

RELION公司-3.1,CTF定义为

[\eqaligno{{\rm CTF}_{p,{\bf k}}&=-\sin(\gamma_{p、{\bf-k}}),&(9)\cr\gamma_{p,}

哪里D类第页是粒子的实对称2×2像散散焦矩阵第页,C是显微镜的球差,λ是电子波长χ第页是振幅对比度和相位板(如果使用相位板)引起的相移给出的恒定偏移。我们之所以选择这种像散公式,是因为它在处理各向异性放大时更简洁,也更实用,如第2.4节所示[链接].在附录中A类[链接],我们定义D类第页我们证明这与更常见的公式等价(Mindell&Grigorieff,2003【Mindell,J.A.和Grigorieff,N.(2003),《结构生物学杂志》第142期,第334-347页。】).

我们通过偏移来模拟CTF在对称像差下的变形γ,

[{\rm CTF}_{p,{\bf k}}=-\sin[\gamma_p,{\bf k}}+\psi_{\bv k}({\bf-d})],\eqno(11)]

哪里ψk个(d日)使用对称泽尼克多项式和一组系数进行建模d日[{\bb R}^B]描述了畸变,

[\psi_{{\bf-k}}({\bf d})=\textstyle\sum\limits_b d_b Z_b({\bf-k}).\eqno(12)]

的最佳值d日b条通过最小化另一个平方差之和来确定,

[\eqaligno{E_{rm-symm}&=\textstyle\sum\limits_{p,{\bf-k}}f_{{\bf k}}\big|X_{p{垂直}_{p,{\bfk}}\big|^2&(13)\cr&=\textstyle\sum\limits_{p,}\bfk}}f{{\bf k}}\ big|X{p,[\bf k}}+\sin[\gamma_{p{垂直}_{p,{\bf k}}\big|^2,&(14)}]

其中预测的复数振幅[\widetilde公司{垂直}_{p,{\bf k}}]包含由反对称像差引起的相移(如果已知),

[\widetilde公司{垂直}_{p,{\bfk}}=\exp[i\varphi({\bf k})]V{p,}。\等式(15)]

这又是一个含有大量项的非线性方程。为了使其最小化易于处理,我们执行以下替换,

[\sin[\gamma_{p,{\bf k}}+\psi_{\bf k}({\bf d})]={\bf r}_{p,{\bf k}}^\top{\bf t}_{\bf k}}({\bf d}),\ekno(16)]

使用已知的列向量第页第页,k个[{\bb R}^2]由提供

[{\bfr}{p,{\bfk}}=\left[\matrix{\cos(\gamma{p,}\bfk}})\cr\sin(\gamma{p

和未知t吨k个(d日) ∈[{\bb R}^2]通过

[{\bft}{{\bfk}}({\bfd})=\left\{\matrix{\sin[\psi{{\Bfk}(}\bfd{)]\cr\cos[\psi.{\bf k}}}[{\bf-d})]}\right\}。\等号(18)]

这允许我们转换每个像素的一维非线性项k个变成二维线性项,

[E_{rm-symm}=\textstyle\sum\limits_{p,{\bf-k}}f_{{\bf k}}\Big|X_{p{垂直}_{p,{\bfk}}{\bfr}_{p,}^\top{\bft}_{{\bf-k}}({\bfd})\Big|^2。\等式(19)]

以这种形式,我们可以分解E类对称转换为所有像素上的二次函数之和k个这相当于(5)中的转换[链接],仅在两个真实维度而不是一个复杂维度中,

[E_{\rm symm}=\textstyle\sum\limits_{\bf k}f_{\bf k}[{\bf-t}_{\bf k}

其中实对称2×2矩阵R(右)k个由提供

[R_{\bf k}=\textstyle\sum\limits_p|\widetilde{垂直}_{p,{\bfk}}|^2{\bfr}{p,}{\bf r}{p

以及相应的像素优化[\hat{{\bf t}}_{{\bf k}}\in\mathbb{R}^2]通过

[\eqalinno{\hat{\bf t}_{\bf k}&=-R_{\bf k}^{-1}\tau_{\bf k},&(22)\cr\tau_{\bf k}&=\textstyle\sum\limits_p{\rm Re}(X^*_{p,{\bf k})\宽波浪{垂直}_{p,{\bfk}}){\bfr}{p,}。&(23)}]

同样,计算R(右)k个[\hat{{\bf t}}{{\bf k}}]只需要对数据集进行一次迭代,其中对于每个像素k个每个粒子需要更新五个数字第页:三个不同的元素R(右)k个(矩阵对称)和τk个.一次R(右)k个[\hat{\bf-t}_{\bf k}]已知最佳Zernike系数d日通过最小化来确定E类对称在(20)[链接]使用Nelder–Mead下坡单纯形算法。类似于反对称像差的情况,目视检查最佳像差ψk个(d日)对于每个像素,我们可以检查像差的类型,而无需将其投影到Zernike基中。像素的CTF相移估计k个由提供[\tan^{-1}[\hat{t}(t)_{\bf k}^{(1)}/\hat{t}(t)_{\bf k}^{(2)}]],其中[\hat(帽子){t}(t)_{\bf k}^{(1)}][\hat(帽子){t}(t)_{\bf k}^{(2)}]参考的两个组成部分t吨k个.

一旦系数d日对称像差的已知值,它们用于校正在中计算的任何CTFRELION公司-3.1.

2.4. 各向异性放大

为了确定放大率的各向异性,我们再次将预测图像与观测图像进行比较。我们假设3D参考图W公司通过平均从均匀分布绘制的平面内旋转角度的粒子视图获得。这是一个现实的假设,因为与粒子和冰表面之间的角度不同,粒子通常显示首选方向,粒子不注意相机像素网格的方向。因此对于足够大小的数据集,单个图像中的各向异性取平均值,得到的参考图描绘了粒子的各向同性缩放3D图像(尽管粒子外围的高频信息被平均值模糊了)。因此,我们可以通过确定必须应用于预测图像的最佳变形来估计各向异性,以最佳拟合观测图像。

我们只是在寻找图像的线性失真。这种失真可以在实空间或傅里叶空间中等效表示:如果实空间图像被2×2矩阵失真M(M),则相应的傅里叶空间图像被M(M)-1吨。我们选择在傅里叶空间中操作,因为这样可以确定预测图像的变形,而不会扭曲CTF。我们假设此时已知的CTF参数已经适合图像中观察到的Thon环,因此我们只变形粒子本身。

形式上,我们定义了复振幅第页,k个(M(M))由2×2矩阵变形的预测图像M(M)通过

[V_{p,{\bfk}}(M)=W(A_pM{\bf k}),\eqno(24)]

我们的目标是确定这样一个矩阵M(M)使其最小化

[E_{\rm mag}=\textstyle\sum\limits_{p,{\bf k}}\Big|X_{p,{\bf k}}-{\rm CTF}_{p,{\bf k}}\宽波浪号{垂直}_{p,{\bf k}}(M)\Big|^2,\eqno(25)]

哪里[\widetilde{V}]再次指(15)中定义的相移复振幅[链接]。我们没有假设M(M)必须是对称的,这使得它能够表示出各向异性放大之外的倾斜分量。计算机视觉应用中常用的模型考虑了这种倾斜效应(Hartley,1994[Hartley,R.I.(1994),《ECCV’94:第三届欧洲计算机视觉会议论文集》,J.-O.Eklundh编辑,第471-478页。柏林:施普林格-弗拉格。]; Hartley&Zisserman,2003年[Hartley,R.I.&Zisserman,A.(2003),《计算机视觉中的多视图几何》,第二版,剑桥大学出版社。]),但不是在cryo-EM中。我们还决定对歪斜分量进行建模,以防它出现在数据集中。

(25)中给出的表达式[链接]是对大量非线性项的又一个求和。为了获得线性项平方的和,我们首先用以下公式表示变形M(M)作为一组像素位移δk个[{\bb R}^2],

[M{\bfk}={\bf k}+\delta_{\bf-k}.\eqno(26)]

接下来,我们对W公司围绕A类第页k个。我们知道W公司适用于所有频率k个其中参考地图包含任何信息,因为位移δk个可能小于一个体素。如果它们明显较大,则会妨碍在这些频率下成功计算参考图的复杂振幅,除非要考虑大量粒子。线性近似值如下所示

[\widetilde公司{五} (p)({\bfk}+\delta{\bf k})\simeq\widetilde{垂直}_{p,{\bfk}}+{\bf-g}{p,}\bf-k}}^\top\delta{{\bf k}},\eqno(27)]

其中梯度第页,k个[{\bb C}^2]是通过向前投影的3D梯度来计算的列向量W公司(由线性插值给出),

[{\bf g}_{p,{\bf-k}}=\exp[i\varphi({\bf-k})]A_p^\top\nabla W(A_p{\bv-k}。\等式(28)]

计算是很重要的第页,k个这样,因为从已经投影的图像中用数字计算它第页,k个将导致梯度的系统低估(由于插值),从而导致位移的系统高估。另请注意φ(k个)由于位移被忽略了。这是因为相移,像CTF一样,也是从畸变图像中计算出来的,所以我们可以假设它在畸变坐标中是正确的。

使用以这种方式转换的项,平方误差之和可以近似为

[\eqaligno{E_{rm{mag}}&\simeq\textstyle\sum\limits_{p,{\bfk}}f_{\bf k}\Big|X_{p{垂直}_{p,{\bfk}}+{\bf-g}_{p,}^\top\delta_{\bf k}\big)\big|^2&(29)\cr&=\textstyle\sum\limits_{p{垂直}_{p,{\bf k}}+{\bf g}_{p,{\bf k}}^\top(M-I){\bf k}\bigh]\bigh|^2。&(30)}]

这对应于要在最小二乘意义下求解的两个线性方程组,或者是像素位移δk个(29)[链接]或用于全局变形矩阵M(M)(30)[链接]与像差方法类似,我们对这两种方法都进行了求解。再次了解像素解可以让我们直观地确认观察到的变形是否与线性变形一致;如果是,则为像素位移δk个将遵循以下线性函数k个.

最佳位移[{\bb R}^2]中的{\delta_{\bf k}}等于

[\eqaligno{\hat{\delta_{\bfk}}&=S_{\bf k}^{-1}{\bf-e}_{\Bfk},&(31)\cr{\bfe}_{\ffk}&=\textstyle\sum\limits_p{\rm CTF}_{p,{\bf2k}}{\rm-Re}[{\bf1g}_{p,{}-\widetilde公司{垂直}_{p,{\bf k}})],&(32)}]

实对称2×2矩阵S公司k个由提供

[S_{\bf k}=\textstyle\sum\limits_p{\rm CTF}_{p,{\bf-k}}^2{\rm-Re}

注意,这相当于处理(29)的实部和虚部[链接]作为单独的方程,因为Re(z(z)*w个)=回复(z(z))回复(w个)+进出口(z(z))我(w个)对所有人来说z(z),w个[{\bb C}]类似于对称像差的估计,S公司k个e(电子)k个通过为每个像素累积五个数字,在一次迭代中计算k个覆盖整个数据集。

最佳2×2变形矩阵M(M)通过首先将其重塑为列向量来确定[{\bb R}^4],

[M=\left[\矩阵{1+M^{(1)}&M^{2)}\crm^{3)}&1+mm^{4)}\right]。\等号(34)]

(30)中的表达式[链接]然后可以写为

[E_{\rm mag}=\textstyle\sum\limits_{p,{\bf k}}\big|X_{p{垂直}_{p,{\bfk}}-{\bfa}_{p,}\bfk}}^\top{\bf m}\big|^2,\eqno(35)]

使用列向量第页,k个[{\bb C}^4]由提供

[{\bf a}_{p,{\bf k}}={\rm CTF}_{p,{\bf k}}\left[\matrix{k^{(1)}g_{p,{\bf k}}^{(1)}\cr k ^{(1)}g_{p,{\bf k}}^{(2)}\cr k ^{(2)}g_ p,{\bf k}^{(2)}\right]。\等式(36)]

我们现在可以计算最优值,

[{\bf-m}=T^{-1}{\bf l},\eqno(37)]

其中实对称4×4矩阵T型和列向量[{\bb R}^4]等于

[\eqalignno{T&=\textstyle\sum\limits_{p,{\bf k}}f_{\bf-k}{\rm Re}a}{p,{\bfk}}^*(X_{p{垂直}_{p,{\bf k}})]。&(39)}]

无需计算T型通过迭代所有粒子显式地第页同样,由于所有必要的金额都已作为S公司k个e(电子)k个相反,我们只需要将所有像素的相应值相加k个详见附录B[链接].

为了校正后的各向异性M(M)据估计,我们从未对观测到的图像重新采样。当我们从一组观察到的图像中计算3D地图时,我们通过将2D切片插入3D Fourier空间体积来实现。由于此过程需要在分数3D坐标处插入2D像素(从而进行插值),我们可以通过插入像素来避免对观测图像进行任何额外的重采样k个到3D地图的位置A类第页M(M)k个而不是在A类第页k个类似地,如果第2.2节中描述的方法[链接]和2.3[链接]在失真矩阵之后应用M(M)已知,则通过从中读取复数振幅来生成预测图像W公司在3D位置A类第页M(M)k个。为了提高可读性,在这些方法的描述中省略了这一点。

此外,当处理各向异性放大时RELION公司,我们选择始终在未失真的2D坐标中定义CTF。这背后的主要动机是假设球差(方程式10中的第二个总和[链接])只有在图像没有失真的情况下,才应该是径向对称的。因此,一旦畸变矩阵M(M)已知,我们需要变换像散散焦矩阵D类到新的未变形坐标系中。这是通过共轭来实现的D类在下面M(M)−1,

[D^\prime=M^{-1\top}D M^{-1}.\eqno(40)]

当在执行该变换之后计算CTF值时,它总是被计算为CTF(M(M)k个)而不是CTF(k个).

作为对称像差和反对称像差基础的泽尼克多项式也在未畸变坐标中定义,Zernike多项式也在Z轴b条(M(M)k个). 注意,估算后这些系数的修正M(M)无法进行分析,但需要数值解。相反,我们建议只有在M(M)已知。在严重情况下,更好地估计M(M)可以通过重复放大来获得精炼在使用的初始估计确定最佳散焦和散光估计之后M(M)。我们在第3.4节中的一个合成示例中说明了该场景[链接].

2.5. 实施细节

上述三种方法需要应用于大量粒子,以获得可靠的估计。然而,我们允许三种影响在RELION公司-3.1. 为了促进这一点,我们引入了光学组:共享相同光学特性的粒子集分区,例如电压或像素大小(或像差和放大矩阵)。截至RELION公司-3.1,允许光学组之间的这些光学特性不同,而不同组的粒子仍然可以一起细化。这使得可以合并在不同显微镜上收集的具有不同放大率和像差的数据集,而无需对图像进行重新采样。各向异性放大精炼然后可以用于通过相对于公共参考图细化光学组的放大率来测量光学组之间的相对放大率。

由于粒子的大多数光学特性现在都是通过其所属的光学组定义的,因此每个粒子STAR文件都由RELION公司-3.1现在包含表:一个列出光学组,一个列出粒子。粒子表与旧表等效,只是某些光学特性不再列出。这些通常是电压、像素和图像大小、球差和振幅对比度,它们在光学组列表中指定。这会减小总体文件大小,并使手动编辑这些属性变得更容易。

许多其他光学特性仍存储在粒子列表中,允许同一组中的不同粒子使用不同的值。这些特性构成了对称像差的每粒子部分,系数γ第页,k个英寸(10)[链接]每个粒子可以改变的具体参数如下:相移、散焦、像散、球差和B-因子包络。

这个B-因子包络是由比例因子组成的二维参数S公司B因素本身。它对应于CTF上的高斯包络[由S公司经验(-4B|k个|2)]它还提供了一种对不同粒子进行加权的方法。具体来说,更大的B因子意味着粒子对重建的较高频率贡献较小。尽管B有关CTF的因素已在早期版本中提供RELION公司,估计它们的方法是3.1版中的新方法。

我们开发了一个新的CTF精炼该程序考虑给定显微照片中的所有粒子,并局部优化上述五个参数,而每个参数可以按粒子、显微照片或保持固定进行建模。然后,该程序使用L-BFGS算法(Liu&Nocedal,1989[Liu,D.C.&Nocedal,J.(1989)。数学课程。45,503-528。])找到给定显微照片中所有粒子的最小二乘最优参数配置。例如,这允许用户找到显微照片最可能的相移,同时找到其中每个粒子最可能的散焦值。该程序设计为提供多种组合,尽管其中一些组合起初可能并不有用,例如,估计球差或每个粒子的相移。以这种方式,程序允许出现例外情况,例如非常大的粒子,但我们建议大多数用户只对每个粒子的散焦以及每个显微照片的其他所有内容建模,或者根本不建模。

请注意,术语离焦散光以上具体指δz(z)(散焦)和12(散光),其中散光散焦矩阵D类第页粒子的第页英寸(10)[链接]其组成如下:

[D_p=\left(\matrix{\delta z+a_1&a_2\cr a_2&\delta z-a_1}\right)。]

例如,这将允许通过分配一个单独的δz(z)对于每个粒子,而像散可以通过要求12所有粒子都是相同的。

3.结果

为了验证我们的方法并说明其有用性,我们使用公开的数据集描述了四个实验。首先,我们评估了在200 keV Thermo Fisher Talos Arctica显微镜上收集的两个数据集的像差校正。其次,我们说明了我们使用300 keV Thermo Fisher Titan Krios显微镜上收集的数据集模拟像差的方法的局限性,该显微镜带有带散焦的Volta相位板(Danev等。, 2017[Danev,R.,Tegunov,D.&Baumeister,W.(2017).电子生活,6,e2306.]). 第三,我们将我们的方法应用于迄今为止发表的最高分辨率的低温电子显微镜结构之一,该结构是在没有相位板的泰坦Krios上收集的。最后,我们确定放大矩阵的精度M(M)可以在受控实验中使用人工扭曲的图像,再次从泰坦克里欧斯显微镜中恢复。

3.1. 200 keV下的像差实验

我们重新处理了两个公开的数据集:一个关于兔子肌肉醛缩酶(EMPIAR-10181),另一个关于嗜酸热浆菌20S蛋白酶体(EMPIAR-10185)。这两组数据都是在同一台200 keV Talos Arctica显微镜上收集的,该显微镜配备了Gatan K2 Summit直接电子相机。在最初出版时(Herzik等。, 2017【Herzik,M.A.Jr,Wu,M.&Lander,G.C.(2017),《自然方法》,第14期,第1075-1078页。】),醛缩酶可以重建为2.6º分辨率,蛋白酶体可以重建为3.1º分辨率RELION公司-2.0.

我们为醛缩酶数据集选择了159352个粒子,为蛋白酶体选择了74722个粒子。对于这两个数据集,我们执行了五个步骤,并测量了每个步骤的分辨率。首先,我们在不考虑像差的情况下对粒子进行细化。然后使用生成的3D地图执行初始CTF精炼其中估计了离散度和像差。然后对颗粒进行贝叶斯抛光(Zivanov等。, 2019[Zivanov,J.,Nakane,T.&Scheres,S.H.W.(2019年),IUCrJ,6,5-17.])然后是CTF的另一个迭代精细化。为了从像差校正中分离出改进的贝叶斯抛光的效果,我们还执行了一个精炼使用相同的抛光粒子,但假设所有像差为零。我们测量了两个独立半集之间的傅里叶壳层相关性(FSC),并根据已知原子模型(PDB条目)计算出的映射1扎6亿立方英尺分别为;圣吉恩等。, 2005【St-Jean,M.,Lafrance-Vanasse,J.,Liotard,B.&Sygusch,J..(2005),《生物化学杂志》280,27262-27270。】; 坎贝尔等。, 2015【Campbell,M.G.、Veesler,D.、Cheng,A.、Potter,C.S.和Carragher,B.(2015)。eLife,4,e06380。】). 这些图如图1所示[链接]以及表1中采用半衰期法测量的分辨率,阈值为0.143[链接]像差估计图如图2所示[链接].

表1
在200 keV下醛缩酶和20S蛋白酶体的畸变实验中,在我们的处理管道的不同阶段获得的半集分辨率

  醛缩酶 蛋白酶体
首字母 2.7 3.2
第一次CTF改进 2.4 2.5
贝叶斯抛光 2.3 2.3
第二次CTF改进 2.1 2.3
无畸变 2.5 3.1
[图1]
图1
左图:200 keV下醛缩酶和20S蛋白酶体畸变实验的FSC图。顶部图显示半定FSC,底部图显示FSC与根据各自原子模型计算的映射(PDB条目1扎6亿立方英尺; 详见正文)。请注意,在初始CTF细化期间估计像差已经显著提高了分辨率(红线)。它还允许更有效的贝叶斯抛光和散焦细化,进一步提高分辨率(实心黑线)。忽略像差,同时保持其余参数不变(黑色虚线),可以隔离像差校正的效果。对于蛋白酶体,它也在2.7℃左右的半定FSC中暴露出轻微(假)阳性峰,这对应于参考FSC中的负峰。这表明,由于强烈的像差,3D地图复振幅的相位平均在该频带发生翻转。右:结果贴图的小区域,说明了考虑像差的效果。这些图对应于FSC图中的实心黑线(考虑到像差)和虚线黑线(不考虑像差)。醛缩酶图谱被一个B系数为−50Å2并在3.7处绘制等高线σ。蛋白酶体图通过B系数−55º2轮廓度为3.5σ。所有地图均由渲染PyMOL公司v.1.8.4.1。
[图2]
图2
醛缩酶和20S蛋白酶体在200 keV下的不对称和对称畸变实验。每对的上部图像显示每个像素的独立相位角估计,而下部图像显示使用Zernike多项式的参数拟合。这些类型的像差被称为三叶草三倍散光(左)和四倍散光(右)。蛋白酶体三叶在非常高的频率下超过180°,所以像素图中的符号环绕。这对参数化拟合没有影响。虚线圆圈分别表示1.94和1.98Ω的分辨率。

图2[链接]表明这两个数据集都显示出反对称畸变和对称畸变。对于这两个数据集,两种像差的形状在每像素图中都很明显,参数Zernike拟合很好地捕捉到了这些形状。反对称像差相当于三叶像差(或三倍像散)加上轻微的轴向彗差,它们比对称像差更为明显。在用于反对称像差估计的图像中,三叶可以看到正负相位差的三个交替区域,具有近似的三重对称性(图2左侧[链接]). 轴向彗星通过使图像的一侧更积极,另一侧更消极,打破了三重对称。对称像差图像中的四重对称性(图2右侧[链接])对应于四倍的散光,在蛋白酶体数据集中最强。蛋白酶体还显示出较强的反对称畸变,在较高频率下甚至超过180°。请注意,因为每像素图显示的是[\hat{\bf-t}_{\bf k}]来自(20)[链接]当它们达到180°时就会卷曲。然而,这对参数的估计没有影响,因为[\hat{\bf-t}_{\bf k}]自身是圆上的二维点,用于优化,而不是其相位角。

FSC图(图1[链接])表明像差校正导致更高的分辨率,这是由独立细化的半图之间的FSC和根据原子模型计算的图的FSC所测量的。比较第二次CTF的结果精炼以及无像差校正的等效运行(表1中的下两行[链接]; 图3[链接])醛缩酶数据集的分辨率从2.5增加到2.1º,蛋白酶体的分辨率从3.1增加到2.3º。此外,像差校正还允许更有效的贝叶斯抛光和散焦估计,这是执行CTF的原因精炼两次。

[图3]
图3
作为200 keV畸变实验的一部分,对称畸变对20S蛋白酶体CTF的影响。左边的图像显示了由传统模型表示的CTF,而右边的图像显示的是我们考虑高阶对称像差的新模型的拟合。请注意,由四倍散光引起的略呈方形的形状无法用传统模型表示。像差对应于图2中右下角的图像[链接].

3.2、。相板实验

我们还分析了关于嗜酸乳杆菌20S蛋白酶体(EMPIAR-10078)。该数据集是使用Volta相位板(VPP;Danev等。, 2017[Danev,R.,Tegunov,D.&Baumeister,W.(2017).电子生活,6,e2306.])离焦状态下。我们挑选了138080个粒子,并与之前的实验类似地对它们进行处理,只是CTF精炼现在包括各向异性放大率的估计。估计的像差如图4所示[链接]图6中的FSC。

[图4]
图4
在相位板数据集上测量的不对称(左)和对称(右)像差。上图显示了独立的像素估计值,下图显示了参数拟合。请注意右上角图像中以前使用过的四个后像。我们的模型无法表示它们。虚线圆圈表示分辨率为2.12º。

VPP的目的是移动未散射光束的相位,以增加与散射光束的对比度。这是通过放置一层非晶碳(VPP)在显微镜的后焦平面,并在电子束被样品散射后让其通过。中心无辐射光束的强度比无辐射分量大得多,然后自发地产生一个负光斑电势VPP(Danev)等。2014年【Danev,R.、Buijsse,B.、Khoshouei,M.、Plitzko,J.M.和Baumeister,W.(2014)。美国国家科学院院刊,111,15635-15640。】). 正是这个光斑导致了无散射光束中的相移。使用一段时间后,斑点电荷会更大,并产生瑕疵。此时,用户通常会切换到碳膜上的不同位置。先前位置的电荷将衰减,尽管一些电荷可能会保留很长一段时间。如果VPP移动的距离不够,旧光斑将位于散射光线穿过的位置,对应于较高的图像频率。我们假设可以在对称像差图中观察到这些斑点。

对称图显示频率空间中心的正相移(图4[链接]). 我们假设,这个斑点是由相板上当前使用位置上积累的电荷大小引起的(Danev&Baumeister,2016[Danev,R.和Baumeister,W.(2016)。电子生活,5,e13046。]). 此外,该图还显示了空间频率较高的四个额外点。我们假设,这些可能是由之前使用的相位板上的残余电荷引起的。然后,这些电荷将以较高的空间频率干扰当前位置的衍射光线,从而在像差图像中形成观察到的斑点。反对称图中没有垂直相邻点,这表明这些点是以垂直交替但水平单向的方式进行扫描的。如图5所示[链接].

[图5]
图5
我们对图4中像差图的解释[链接]对称图中所有四个相邻点的存在,以及反对称图中垂直相邻点的缺失,表明VPP点是以垂直交替和水平单向的方式扫描的,如第一幅图像所示。这将大多数点划分为两类,a和b,其中直接垂直相邻点位于相对侧。将相邻点引起的总相移分解为反对称部分和对称部分。在估计过程中,它们都是对两类粒子的平均值,因此在反对称图中,垂直邻域部分抵消,但在对称图中不抵消。

由于这些类型的像差不满足我们的平滑度假设,因此无法使用少量Zernike基多项式很好地建模。虽然增加Zernike多项式的数量原则上可以表达任意的像差函数,但它也会降低系统将像差外推到看不见的高频区域的能力。因此,我们的像差模型不能用于抵消相位板位置的影响,图6中的FSC图证实了这一点[链接]在实践中,通过进一步隔开相板位置,从而任意增加受影响的频率,可以在实验上避免此问题。

[图6]
图6
半集(顶部)和映射与原子模型(底部)的FSC绘图,用于相位板数据集。使用的原子模型再次是PDB条目6亿立方英尺注意,考虑像差并不能提高分辨率,因为这些类型的像差不能用我们的模型来表示。然而,由于新的显微照片全局散焦和相移估计以及考虑到轻微的各向异性放大,CTF细化确实提高了分辨率。

该数据集的估计放大率各向异性相对较弱。最终放大矩阵M(M)我们恢复了

[M=左(矩阵{1.006&0.005\cr 0.006&0.998}\right),]

对应于沿两个垂直轴旋转66°的1.35%各向异性。

3.3. 高分辨率实验

我们将我们的方法应用于在装有Falcon 3相机的300 keV Titan Krios上收集的小鼠重链载铁蛋白数据集(EMPIAR-10216)。在其发表时,可以使用RELION公司-3.0(达涅夫等。, 2019[Danev,R.,Yanagisawa,H.&Kikkawa,M.(2019).生物化学科学趋势44,837-848.]). 因此,该数据集为我们提供了一种在更高分辨率下检查高阶像差和各向异性放大效应的方法。

我们比较了以下三种重建。首先是原始的公开地图。由于使用了RELION公司-3.0,可以校正光束倾斜的影响,但不能校正其他高阶像差或各向异性放大。其次,仅仅是畸变:为此,我们从前面的开始精炼首先估计高阶像差,然后同时估计颗粒离散光和显微像散。第三,我们执行了相同的程序,但只是在首次估计各向异性放大率之后。对于第三个案例,在一轮精细化。对于这三种情况,我们根据原子模型PDB条目计算了独立细化的半图和FSC之间的FSC第6章第61节将其构建到分辨率为1.8º的小鼠脱铁蛋白的独立重建冷冻电镜图中。在没有更高分辨率原子模型的情况下,与PDB条目进行比较第6章第61节基于以下假设,即原子建模期间应用的几何约束导致分辨率超过1.84º时的预测能力。我们使用了与原始出版物中相同的掩模来校正独立半衰期图之间FSC上的溶剂滞留效应,并且我们使用了相同的147637个粒子集。

图7中的像差图[链接]表明该数据集显示出三叶像差和微弱的四倍像散。在图8的放大图中[链接],我们可以看到每个像素的位移之间有明确的线性关系k个及其坐标。这表明测量的位移源于线性畸变图像,隐含的畸变是水平膨胀和垂直压缩。这与各向异性放大率一致,因为平均放大率必须接近1,因为参考图本身是在随机平面内角度下从相同的图像中获得的。每像素图的平滑度表明,大量的粒子使我们能够可靠地测量少量的各向异性。我们估计的放大矩阵是

[M=\左(\矩阵{1.003&0.001\cr 0.001&0.998}\右),]

对应0.54%的各向异性。如图9中的FSC曲线所示[链接],考虑到这两种效果中的任何一种都是有益的,同时考虑到这两者都会产生1.57°的分辨率,与使用RELION公司-3.0.

[图7]
图7
在高分辨率小鼠脱铁蛋白数据集上测量的高阶像差。反对称图(左)显示出明显的三叶像差,而对称图(右)显示出微弱的四倍散光。虽然像差相对较弱,但它们是可以明显测量的,考虑到它们确实会导致分辨率略有提高(见图9[链接]). 虚线圆圈表示分辨率为1.04º。
[图8]
图8
高分辨率小鼠去铁蛋白数据集的各向异性放大图。顶行显示每个像素的估计位移([\hat{\delta_{\bf k}}]在方程式31中[链接]),而底行显示与估计的放大矩阵相对应的位移M(M)( M(M)k个负极k个). 请注意,每像素估计值遵循线性关系,这表明位移确实是由图像的线性变换引起的。水平坐标定义为向右递增,垂直坐标定义为向下递增,因此这两个图表示水平扩张和垂直压缩。虚线圆圈表示分辨率为1.04º。
[图9]
图9
高分辨率鼠标脱铁蛋白数据集的半集(顶部)和映射与原子模型(底部)FSC图。考虑各向异性放大率(黑线)会使分辨率进一步提高,超出仅考虑像差(蓝线)所能达到的分辨率。使用的原子模型是PDB条目第6章第61节另一种公开可用的低温电磁结构。底部图所示的分辨率受到原子模型分辨率仅为1.84º这一事实的限制。

3.4. 模拟各向异性放大实验

为了在存在大量各向异性的情况下测量各向异性放大率估计过程的性能,我们还对合成数据进行了实验。在这个实验中,我们使用了一小部分(来自29部电影的9487个粒子),这些粒子取自我们之前处理过的人类脱铁蛋白数据集(EMPIAR-10200)(Zivanov等。, 2018[Zivanov,J.,Nakane,T.,Forsberg,B.O.,Kimanius,D.,Hagen,W.J.,Lindahl,E.&Scheres,S.H.W.(2018).电子生活,7,e42166]). 我们通过使用已知的各向异性放大率来扭曲显微照片MotionCor公司2(郑等。, 2017[Zheng,S.Q.,Palovcak,E.,Armache,J.-P.,Verba,K.A.,Cheng,Y.&Agard,D.A.(2017).自然方法,14,331-332.]). 沿着以20°角旋转的两个垂直轴,应用于图像的相对比例分别为0.95和1.05。在这个过程中,大约4%的粒子被映射到图像之外,因此变形粒子的数量略小于9093个。

然后我们进行了四轮精炼为了恢复各向异性放大率,从畸变的显微照片中提取粒子图像。每轮包括一个CTF精炼然后是自动细化。CTF公司精炼每次进行两次自身测试:一次是为了估计各向异性,然后再次是为了确定颗粒离散度和显微像散。不同轮次的FSC曲线如图10所示[链接]我们观察到,在第二轮之后,FSC已经接近未变形粒子的FSC。在第一轮中,初始3D参考图不够精确,不足以允许各向异性的可靠恢复。

[图10]
图10
人类脱铁蛋白的模拟各向异性放大实验的半集(顶部)和映射与原子模型(底部)FSC图。使用的原子模型是PDB条目5n27号(费拉罗等。, 2017[Ferraro,G.,Ciambellotti,S.,Messori,L.&Merlino,A.(2017),《无机化学》56,9064-9070.]). 从第二次迭代开始,曲线接近其最终位置。请注意,失真重建无法达到未失真重建的分辨率,因为粒子在重建过程中丢失,图像像素通过重采样而退化。

放大矩阵M(M)在最后一轮中恢复

[M=\左(\矩阵{1.060&-0.032\cr-0.032&0.984}\右)。]

它对应于沿旋转19.939°的两个垂直轴的相对刻度分别为0.951和1.049,尽管它还包含一个额外的均匀刻度系数1.022。均匀比例因子对精细化,但是它确实改变了得到的映射的像素大小。因此,我们注意到,必须小心,要么强制两个相对比例的乘积为1,要么根据外部参考校准地图的像素大小。

该实验表明,即使是从相对较少的粒子中,也可以将放大率的各向异性估计为三个有效数字。由于估算是通过将所有粒子的贡献相加得出的,因此精度随粒子数的增加而增加。

4.讨论

尽管我们之前描述了一种估算和校正束流诱导轴向彗差的方法(Zivanov等。, 2019[Zivanov,J.,Nakane,T.&Scheres,S.H.W.(2019年),IUCrJ,6,5-17.])到目前为止,还没有检测和校正高阶光学像差的方法。因此,目前尚不清楚这些像差是冷冻电镜中的一个限制因素的频率结构测定生物大分子。我们已经在两种不同类型的显微镜上观察到几个强烈的三倍和四倍散光的例子,这表明这些像差可能比较常见。

我们对醛缩酶和20S蛋白酶体数据集的结果表明,当数据中存在反对称和/或对称畸变时,我们的方法会显著提高可实现的分辨率。醛缩酶和20S蛋白酶体都可以被视为冷冻-EM的“简单”靶点结构确定:它们都被用于测试低温电子显微镜硬件和软件的性能(例如,请参阅Li等。, 2013[Li,X.,Mooney,P.,Zheng,S.,Booth,C.R.,Braunfeld,M.B.,Gubbens,S.、Agard,D.A.和Cheng,Y.(2013)。《自然方法》,10,584-590。]; Danev&Baumeister,2016年[Danev,R.和Baumeister,W.(2016)。电子生活,5,e13046。]; 赫齐克等。, 2017【Herzik,M.A.Jr,Wu,M.&Lander,G.C.(2017),《自然方法》,第14期,第1075-1078页。】; 基姆等。, 2018【Kim,L.Y.,Rice,W.J.,Eng,E.T.,Kopylov,M.,Cheng,A.,Raczkowski,A.M.,Jordan,K.D.,Bobe,D.,Potter,C.S.&Carragher,B.(2018),《前沿分子生物学》第5、50页。】). 然而,我们的方法不仅限于标准测试样本,而且已经用于从更具挑战性的数据中获取生物学见解。我们在300 keV Titan Krios显微镜上记录的一名患有慢性创伤性脑病的前职业美国足球运动员的脑源性τ纤维图像显示出严重的三倍和四倍散光。对这些畸变进行校正后,分辨率从2.7埃提高到2.3埃,从而可以可视化替代侧链构象和淀粉样纤维内有序水分子(Falcon等。, 2019【Falcon,B.、Zivanov,J.、Zhang,W.、Murzin,A.G.、Garringer,H.J.、Vidal,R.、Crowther,R.A.、Newell,K.L.、Ghetti,B.、Goedert,M.和Scheres,S.H.W.(2019)。自然,568,420-423。】).

Titan Krios显微镜配备了透镜,可以对其进行调整,以纠正三倍的散光,尽管这种操作通常只由工程师进行。Titan Krios显微镜是戴蒙德(克莱尔等。, 2017[克莱尔·D·K、西伯特·C·A、赫克塞尔·C、哈根·C、莫德霍斯特·V、格兰奇·M、阿什顿·A·W、沃尔什·M·A、格鲁·纽瓦尔德·K、塞比尔·H·R、斯图尔特·D·I·P·(2017),《结晶学报》第73期,第488-495页。]). 在测量了像差的严重程度后,对其镜片进行了重新调整,自那时以来,镜片上没有检测到高阶像差(张培军,个人通信)。Talos Arctica显微镜没有透镜来校正三叶草,斯克里普斯研究所用于收集醛缩酶和20S蛋白酶体数据集的显微镜继续产生畸变量波动的数据集(Gabriel Lander,个人通信)。在确定或更好地理解这些像差的来源之前,这里提出的校正对于处理在这些显微镜上获得的数据将是重要的。

高阶像差的限制程度取决于三倍和四倍像散的数量以及重建的目标分辨率。我们只观察到数据集的分辨率显著提高,这些数据集在像差校正前产生了分辨率超过3.0–3.5Å的重建。然而,对于低能电子,像差的影响更为明显。因此,我们的方法可能与100keV显微镜的数据特别相关,该显微镜的开发旨在为薄标本提供更好的图像,并降低现代低温电子显微镜的高昂成本结构测定(皮特等。, 2019【Peet,M.J.、Henderson,R.和Russo,C.J.(2019)。超微显微镜,203,125-131。】; 奈德诺娃等。, 2019[Naydenova,K.、McMullan,G.、Peet,M.J.、Lee,Y.、Edwards,P.C.、Chen,S.、Leahy,E.、Scotcher,S.,Henderson,R.&Russo,C.J.(2019)。国际癌症研究联合会,6,1086-1098。]).

各向异性放大对冷冻电镜的影响结构测定之前已经描述了生物样品的数量,并提出了校正方法(Grant&Grigorieff,2015【Grant,T.&Grigorieff,N.(2015),《结构生物学》192204-208。】; 等。, 2016[Yu,G.,Li,K.,Liu,Y.,Chen,Z.,Wang,Z..,Yan,R.,Klose,T.,Tang,L.&Jiang,W.(2016).结构生物学杂志.195,207-215。]). 我们的方法与中实现的穷举搜索算法有一些相似之处JSPR公司(郭江,2014[郭富伟、江伟(2014).分子生物学方法,1117401-443.]; 等。, 2016[Yu,G.,Li,K.,Liu,Y.,Chen,Z.,Wang,Z..,Yan,R.,Klose,T.,Tang,L.&Jiang,W.(2016).结构生物学杂志.195,207-215。])它将参考投影与高信噪比和整个数据集的粒子图像进行比较。然而,我们的方法避免了在各向异性的方向和大小上进行计算昂贵的二维网格搜索JSPR公司此外,我们的方法原则上能够检测和建模放大中的倾斜分量。

除了建模各向异性放大率外,我们的方法还可以用于组合具有未知相对放大率的不同数据集。在低温电子显微镜成像中,放大倍数通常并不确切。同样,可以使用具有已知衍射几何形状的晶体试样精确测量放大率,但在实际操作中,经常会观察到标称像素尺寸中高达百分之几的误差。当处理来自单个数据集的数据时,这种误差可以在一定程度上被吸收在散焦值中。这会产生外观非常相似但规模略有不同的CTF。因此,像素大小的微小误差只会在原子建模阶段成为一个问题,导致整体收缩或扩展模型的立体化学较差。(请注意,由于C例如对于非-C-校正300 kV显微镜。)然而,当组合来自不同会话的数据集时,其相对放大率的错误将影响分辨率低得多的3D重建。我们的方法可以直接用于纠正此类错误。此外,为了进一步方便起见,我们的新实现允许将具有不同像素和方框大小的粒子图像组合为单个精细化。我们的方法在这些条件下的性能有待说明。通常,当组合两个或多个不同的数据集时,在重建的分辨率极限下,单个数据集的性能优于其他数据集,而数据集的组合不会改善映射。

我们的结果表明,可以准确估计和建模反对称和对称像差以及各向异性放大率后部从一组有噪声的生物大分子投影图像中提取。无需在显微镜上进行额外的测试样品或实验;所需要的只是一个足够分辨率的3D重建,以使光学效果变得明显。因此,我们的方法原则上可以用于“先拍摄,后提问”的方法,在这种方法中,图像采集速度优先于彻底优化显微镜设置。在这种情况下,我们警告说,虽然我们的方法的适用范围仍有待探索,但最好保留其在其他仔细进行的实验数据中的意外效果中的使用。

附录A

在下文中,我们证明了作为二次形式的像散散焦项的公式等价于中定义的传统形式RELION公司,这反过来又基于中的模型CTFFIND公司(Mindell&Grigorieff,2003年【Mindell,J.A.和Grigorieff,N.(2003),《结构生物学杂志》第142期,第334-347页。】). 让两个散焦量由下式给出Z轴1Z轴2,散光的方位角φA类电子的波长由λ。然后我们希望表明

[\eqaligno{{\bfk}^\top D{\bf k}&=\pi\lambda[Z_\mu+Z_D\cos(2\delta\varphi_{\bf-k}_{{\bfk}}&=\tan^{-1}\左({{k^{(2)}}\上{k^}}\右)-\varphi_A&(44)}]

像散散焦矩阵D类定义为

[\eqaligno{D&=\pi\lambda Q^\top\Delta Q,&(45)\cr Q&=\left[\matrix{\cos(\varphi_A)&\sin(\varfi_A)\cr-\sin(47)}]

乘以旋转k个进入像散的坐标系,

[Q{\bfk}=\left[\matrix{\cos(\delta\varphi_{\bf-k})\cr\sin(\delta \varphi_{\bf k},)}\right]|{\bv-k}|。\方程式(48)]

将二次型相乘并应用Z轴μZ轴d日产量

[\eqaligno{{\bf k}^\top D{\bf-k}&=(Q{\bfk})^\top\Delta(Q{\ff k}\Delta\varphi_{\bf k})-Z_D\sin^2(51)}]

通过替换cos(2δφk个)对于cos2(δφk个)−正弦2(δφk个)我们看到这与原始公式是等价的。

为了转换给定的D类在传统公式中,我们对−D类/(πλ). 这两个特征值等于Z轴1Z轴2,而特征向量的方位角对应于Z轴1等于φA类.

附录B

计算T型显式通过(38)[链接]需要对所有粒子进行迭代第页在数据集中。因为我们已经在S公司k个e(电子)k个总的来说第页,我们可以通过对所有像素执行以下求和来避免这种情况k个,

[\eqaligno{T&=\textstyle\sum\limits_{\bf k}f_{\bf k}\widetilde{宋体}_{\bf k}提示符(\widetilde{\bfk}\widetilde{\bf-k}^\top),&(52)\cr{\bfl}&=\textstyle\sum\limits_{\bf1k}f{\bfe}\widestilde{

其中⊗表示元素的乘法,以及实对称的4×4矩阵[\widetilde公司{宋体}_{\bf k}]和列向量[\widetilde{\bf k}][\widetilde{\bfe}_{\bfk}\在{\bbR}^4]中通过重塑S公司k个,k个e(电子)k个,

[\eqaligno{\widetilde{宋体}_{\bf k}&=\left[\matrix{S_{\bf-k}^{(1,1)}&S_{\bf-k}^{}^{(1,2)}\cr S_{\bf k}^{^{(2,2)}}\right],&(54)\cr\widetilde{\bfk}&=\left[\matrix{k^{(1)}\crk^{(2)}\chk^{[(1)]}\crk(2){}\ right]{\bfk}^{(2)}\cre_{\bf k}^}{(1)}\right].&(55)}]

致谢

我们感谢Rado Danev为EMPIAR-10216中的数据集提供抛光粒子,感谢Jake Grimmet和Toby Darling在高性能计算方面的帮助。

资金筹措信息

本研究由英国医学研究委员会(MC_UP_A025_1013 to SHWS)、日本科学促进会(TN海外研究奖学金)和瑞士国家科学基金会(SNF;P2BSP2_168735 to JZ)资助。

工具书类

第一次引用Batson,P.E.、Dellby,N.和Krivanek,O.L.(2002)。自然,418, 617–620. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Campbell,M.G.、Veesler,D.、Cheng,A.、Potter,C.S.和Carragher,B.(2015)。电子生活,4,e06380科学网 交叉参考 谷歌学者
第一次引用Clare,D.K.、Siebert,C.A.、Hecksel,C.、Hagen,C.,Mordhorst,V.、Grange,M.、Ashton,A.W.、Walsh,M.A.、Grünewald,K.、Saibil,H.R.、Stuart,D.I.和Zhang,P.(2017年)。《水晶学报》。D类73,488–495科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Danev,R.和Baumeister,W.(2016)。电子生活,5,e13046科学网 交叉参考 公共医学 谷歌学者
第一次引用Danev,R.、Buijsse,B.、Khoshouei,M.、Plitzko,J.M.和Baumeister,W.(2014)。程序。美国国家科学院。科学。美国,111, 15635–15640. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Danev,R.、Tegunov,D.和Baumeister,W.(2017年)。电子生活,6,e23006科学网 交叉参考 公共医学 谷歌学者
第一次引用Danev,R.、Yanagisawa,H.和Kikkawa,M.(2019年)。生物化学趋势。科学。 44, 837–848. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Falcon,B.,Zivanov,J.,Zhang,W.,Murzin,A.G.,Garringer,H.J.,Vidal,R.,Crowther,R.A.,Newell,K.L.,Ghetti,B.,Goedert,M.&Scheres,S.H.W.(2019年)。自然,568, 420–423. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Fernandez-Leiro,R.&Scheres,S.H.W.(2016)。自然,537,339–346页科学网 中国科学院 公共医学 谷歌学者
第一次引用Ferraro,G.、Ciambellotti,S.、Messori,L.和Merlino,A.(2017年)。无机化学 56, 9064–9070. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Grant,T.&Grigorieff,N.(2015年)。J.结构。生物。 192, 204–208. 科学网 交叉参考 公共医学 谷歌学者
第一次引用Guo,F.和Jiang,W.(2014)。方法分子生物学。,1117, 401–443. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Hartley,R.I.(1994)。ECCV’94:第三届欧洲计算机视觉会议记录由J.-O.Eklundh编辑,第471-478页。柏林:Springer-Verlag。 谷歌学者
第一次引用Hartley,R.I.和Zisserman,A.(2003年)。计算机视觉中的多视图几何,第二版,剑桥大学出版社。 谷歌学者
第一次引用霍克斯,P.W.和卡斯珀,E.(1996)。电子光学原理,第3卷。纽约:学术出版社。 谷歌学者
第一次引用Herzik,M.A.Jr,Wu,M.&Lander,G.C.(2017年)。自然方法,14, 1075–1078. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Iudin,A.、Korir,P.K.、Salavert-Torres,J.、Kleywegt,G.J.和Patwardhan,A.(2016)。自然方法,13, 387–388. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Kim,L.Y.、Rice,W.J.、Eng,E.T.、Kopylov,M.、Cheng,A.、Raczkowski,A.M.、Jordan,K.D.、Bobe,D.、Potter,C.S.和Carragher,B.(2018年)。前面。Mol.Biosci公司。 5, 50. 科学网 交叉参考 公共医学 谷歌学者
第一次引用Krivanek,O.、Corbin,G.、Dellby,N.、Elston,B.、Keyse,R.、Murfitt,M.、Own,C.、Szilagyi,Z.和Woodruff,J.(2008)。超微显微镜,108,179-195科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Li,X.、Mooney,P.、Zheng,S.、Booth,C.R.、Braunfeld,M.B.、Gubbens,S.,Agard,D.A.和Cheng,Y.(2013)。自然方法,10, 584–590. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Liu,D.C.和Nocedal,J.(1989)。数学。程序。 45, 503–528. 交叉参考 科学网 谷歌学者
第一次引用Meyer,R.、Kirkland,A.和Saxton,W.(2002年)。超微显微镜,92, 89–109. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Mindell,J.A.和Grigorieff,N.(2003年)。J.结构。生物。 142, 334–347. 科学网 交叉参考 公共医学 谷歌学者
第一次引用Naydenova,K.、McMullan,G.、Peet,M.J.、Lee,Y.、Edwards,P.C.、Chen,S.、Leahy,E.、Scotcher,S.和Henderson,R.&Russo,C.J.(2019年)。IUCrJ大学,6, 1086–1098. 科学网 交叉参考 中国科学院 公共医学 IUCr日志 谷歌学者
第一次引用Nelder,J.A.&Mead,R.(1965年)。计算。J。 7, 308–313. 交叉参考 科学网 谷歌学者
第一次引用Peet,M.J.、Henderson,R.和Russo,C.J.(2019)。超微显微镜,203, 125–131. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Saxton,W.(1995)。《微生物学杂志》。 179, 201–213. 交叉参考 科学网 谷歌学者
第一次引用Saxton,W.(2000年)。超微显微镜,81, 41–45. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用St-Jean,M.、Lafrance-Vanasse,J.、Liotard,B.和Sygusch,J..(2005)。生物学杂志。化学。 280, 27262–27270. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Yu,G.,Li,K.,Liu,Y.,Chen,Z.,Wang,Z,Yan,R.,Klose,T.,Tang,L.&Jiang,W.(2016)。J.结构。生物。 195, 207–215. 科学网 交叉参考 公共医学 谷歌学者
第一次引用Zernike,F.(1934年)。物理,1, 689–704. 交叉参考 谷歌学者
第一次引用Zheng,S.Q.,Palovcak,E.,Armache,J.-P.,Verba,K.A.,Cheng,Y.&Agard,D.A.(2017)。自然方法,14,331–332科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Zivanov,J.、Nakane,T.、Forsberg,B.O.、Kimanius,D.、Hagen,W.J.、Lindahl,E.&Scheres,S.H.W.(2018)。电子生活,7,e42166科学网 交叉参考 公共医学 谷歌学者
第一次引用Zivanov,J.,Nakane,T.&Scheres,S.H.W.(2019年)。IUCrJ大学,6, 5–17. 科学网 交叉参考 中国科学院 公共医学 IUCr日志 谷歌学者

这是一篇开放获取的文章,根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

IUCrJ大学
第7卷| 第2部分| 2020年3月| 第253-267页
国际标准编号:2052-2525