研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标生物
结晶学
国际标准编号:1399-0047

单粒子结构的分辨率测量

美国马萨诸塞州沃尔瑟姆市南街415号布兰迪斯大学生物化学系罗森斯蒂尔基础医学研究中心细胞可视化研究所霍华德·休斯医学院
*通信电子邮件:niko@brandees.edu公司

(2000年2月4日收到; 2000年7月16日接受)

推导了分析表达式,并进行了计算机模拟,以评估通常用于估计从单个蛋白质分子或复合物图像中导出的三维(3D)结构分辨率的程序的准确性。结果表明,在图像中信噪比较低的情况下,当两个半数据集与相同的参考结构对齐时,两个结构之间的傅里叶环相关性(每个结构都使用一半的数据计算)显著高估了分辨率。过高估计是因为图像中的噪声分量之间存在相关性。相关性是由对齐引入的,并且随着信噪比的降低而变得更加严重。只有当两个半数据集与两个独立的参考结构对齐时,才能获得可靠的分辨率度量。进一步表明,噪声相关性也显著影响频谱信噪比和这使得它们分别无法可靠地测量3D结构和原始图像中的信号。得出的结论是,图像的对齐总是伴随着噪声的相关性,并且这种相关性与信号产生的相关性无法区分。

关键词: 分辨率测量.

1.简介

电子显微镜生物大分子已成为测定蛋白质和蛋白质复合物三维结构的有力技术。晶体学方法的发展及其在二维(2D)晶体中的应用产生了3-4的三维密度图原子模型可以解释的光学分辨率(亨德森等。, 1990[Henderson,R.,Baldwin,J.M.,Ceska,T.A.,Zemlin,F.,Beckmann,E.&Downing,K.H.(1990),《分子生物学杂志》第213期,第899-929页。]; 库尔布兰特等。, 1994【Kühlbrandt,W.,Wang,D.N.&Fujiyoshi,Y.(1994)。《自然》(伦敦),367614-621。】; 诺盖尔斯等。, 1998【Nogales,E.、Wolf,S.G.和Downing,K.H.(1998)。《自然》(伦敦),391199-203。】). 同时,电子显微镜分离的蛋白质分子和复合物(单个粒子)继续发展到更高的分辨率,并在7高度对称病毒(Böttcher等。, 1997[Böttcher,B.、Wynne,S.A.和Crowther,R.A.(1997)。《自然》(伦敦),386,88-91。]; 康威等。, 1997【Conway,J.F.,Cheng,N.,Zlotnick,A.,Wingfield,P.T.,Stahl,S.J.&Steven,A.C.(1997)。《自然》(伦敦),386,91-94。】)和11.5不对称核糖体(Gabashvili等。, 2000【Gabashvili,I.S.、Agrawal,R.K.、Spahn,C.M.T.、Grassucci,R.A.、Svergun,D.I.、Frank,J.和Penczek,P.(2000)。细胞,100,537-549。】).

物理限制结构测定已经讨论过使用单个粒子(Henderson,1995[Henderson,R.(1995),《生物物理学四分之一评论》,第28期,第171-193页。])似乎可以在3点获得密度图如果粒子质量足够大(300–4000kDa,取决于电子显微镜中可达到的对比度),并给出足够多的图像以平均超过(104–106图像)。必须使用可靠的分辨率测量来判断使用大量数据和新技术进行分辨率的进展。通常,a相关系数用于测量从单粒子图像计算的3D贴图的分辨率。为此,图像集被分为两个子集,每个子集包含完整集图像的一半。两组图像之间的分布应该是随机的,但实际上它们通常分为奇数和偶数粒子。根据子集及其傅里叶变换计算出两个3D地图,F类1F类2,进行计算。然后,通过傅里叶壳相关性(FSC;Harauz&van Heel,1986)估计两幅地图的分辨率[Harauz,G.和van Heel,M.(1986)。Optik,73,146-156。]),

[{\rm FSC}(k,\Delta k)={{\textstyle\sum\limits_{({k,\Delta k})}{F_1{\bf k})}|^2}}\右]^{1/2}}},\eqno(1)]

针对每个解析shell进行评估(k,Δk). 这里†表示复共轭。对于纯噪音期望值对于FSC是1/[N个(k,Δk)]1/2,其中N个(k,Δk)是外壳中的项数。然后,通常在FSC<2的点处取分辨率截止值/[N个(k,Δk)]1/2(弗兰克,1996年[Frank,J.(1996)。高分子组装的三维电子显微镜。圣地亚哥:学术出版社。]). 需要注意的是,上述假设相关性分析这两个子集是相互独立的。然而,由于以下列出的原因,这通常不是真的。

处理单个粒子的图像时,主要任务是尽可能准确地确定每个粒子的方向(三个角度)和位置(两个坐标)。例如,可以使用粒子的3D贴图作为参考来确定这些参数。从这样一个3D参考图中生成的投影可以在所有可能方向均匀采样的方向上生成,然后可以找到每个粒子图像的最接近匹配(Penczek等。, 1994【Penczek,P.A.、Grassucci,R.A.和Frank,J.(1994)。超微显微镜,53,251-270。】). 这种方法代表一种参数搜索,其精度仅限于所用步长的一半。当粒子的3D贴图不可用时,一开始就会出现问题。通常,第一个映射是使用图像集的多元统计分析和分类生成的,这导致类平均值表示粒子的常见视图。然后可以使用例如角度重建方法来确定这些视图的相对方向(van Heel,1987[Heel,M.van(1987)。超微显微镜,21,111-124。]).

在大致确定每个粒子的方向和位置并计算出第一个3D贴图后,将细化参数。精炼与参数搜索不同的是,确定的参数的准确性不受步长的限制。相反,函数是最大化还是最小化,取决于所使用的函数。例如,可以通过改变决定投影方向的角度来最大化图像和参考地图投影之间的互相关系数。使用新参数,可以计算出更好的3D地图,并在下一步中使用精炼循环。当参数在周期之间停止显著变化时,迭代终止。

由于在这个迭代过程中,每个粒子的参数都是根据相同的参考进行优化的相关分析获得分辨率估计是不独立的。如下文所示,这可能导致完全错误的分辨率估计。

2.与公共参考对齐的图像和的错误相关性

给定是一组M(M)粒子图像,每个粒子都带有N个=n个×n个像素,并且每个图像被归一化为具有0的平均值和1的方差。为了简单起见,我们假设(i)我们只对粒子的2D投影图感兴趣,(ii)图像都显示了粒子的相同视图,以及(iii)粒子相互旋转对齐,只需要在其两个位置坐标中对齐。我们希望监控参数的进度精炼通过相关系数CC与

[{\rm CC}({X,Y})=\textstyle\sum\limits_{i=1}^N{X_i Y_i}\biggr/\left({\textstyle\sum\limits _{i=1}^N}X_i ^2}\sum\limits_{i=1}^N{Y_i^2}}\right)^{1/2}.\eqno(2)]

X(X)Y(Y)是两个具有像素值的图像x个分别为。在(2)中,我们使用了以下事实:x个为零。同样,为了简单起见,我们计算了相关系数在两个图像子集的平均值之间的实际空间中。这个相关系数等于傅里叶环相关的光谱平均值(FRC;Saxton&Baumeister,1982【Saxton,W.O.和Baumeister,W.(1982),《微生物学杂志》127,127-138。】; 面包车高跟鞋等。, 1982[Heel,M.van,Keegstra,W.,Schutter,W.&van Bruggen,E.F.J.(1982)。无脊椎动物呼吸蛋白质的结构和功能,E.J.Wood编辑,第69-73页。阅读:哈伍德学院。]),这是FSC的二维等效值。

当图像包含纯噪声时会发生什么?我们知道如果我们计算相关系数在两幅噪声图像之间期望值相关系数为零。然而,如果我们将两个图像相互对齐以最大化相关系数,这个期望值的最大值将大于零。The variance of the相关系数因为纯噪声是σ2= 1/N个和大型N个其分布近似正态。如果我们允许将两个位置坐标中的偏移应用于两个图像中的任何一个,我们可以计算N个′ =N个不同的相关系数。对于大型N个’,渐近期望值最大值的N个'方差为1的正态分布相关系数/N个是(格里戈里夫·格里戈里夫,1999【Grigorieff,N.和Grigoriff,R.D.(1999)。预印本,Reihe Fachbereich Mathematik,柏林理工大学,第647号。】)

[\langle{{rm CC}}\rangle_N=[(2/N)\ln({N'})]^{1/2}。\方程式(3)]

(3) 提供了相关系数如果我们对齐两个纯噪声图像,每个图像都有N个=n个×n个像素,以其两个位置坐标表示。对于大型N个,的期望值正如预期的那样,接近零。

现在我们将方程展开为M(M)图像。我们假设我们拥有所有M(M)图像相互对齐,我们用*表示对齐的图像或图像坐标。我们注意到,作为校准的结果,协方差λ的像素值对于任何两个图像都是相同的X(X)*以及Y(Y)*:λ=覆盖(X(X)*,Y(Y)*) > 0. 我们选择一个图像X(X)n个*并计算相关系数在剩余的总和之间M(M)−1张图片和图片X(X)n个*. The期望值相关系数将与两个单对齐噪声图像之间的相同,因为M(M)−1图像也是噪声图像。我们写相关系数

[{\rm CC}\left(\textstyle\sum\limits_{i\n}^M X_i,X_n\right)={{\textstyle\sum\limits _{j=1}^n\sum\limits_{i \n}^Mx_j^{(i)}X_j ^{sum\limits_{j=1}^n[X_j^{(n)}]^2\right\}^{1/2}}}。\等式(4)]

要计算期望值相关系数我们使用期望值两个随机变量的商x个,可以近似为

[\left\langle{{x\over y}}\right\langle\simeq{\langle x\rangle}\over{\langle y\rangle}}-{1\over{\langle y\rangle ^2}}{\rm cov}(x,y)+{\langle x\rangle}\over{\langle y\rangle ^3}}}{\rm var}(y)\eqno(5)]

(情绪等。, 1974【Mood,M.A.,Graybill,F.A.&Boes,D.C.(1974),《统计学理论导论》,新加坡:McGraw-Hill。】). 我们观察到N个与分母的平均值相比,(4)中分母的方差及其与分子的协方差较小。因此,

[\eqalinno{\left\langle{\rm CC}\left(\textstyle\sum\limits_{i\ne n}^M X_i^*,X_n^*\right)\right\langle&=\langle{\rm CC}\langle_n\cr&\simeq{\left\langle\textstyle\sum\limits_{j=1}^n\sum\limits_{i\ne n}^M X_j^{(i)*}X_j^{(n)*}\right\langle}\over{\left\langle\left(\text style\sum\limits_{j=1}^N\left\{sum\limits_{i\N}^M[x_j^{(i)*}]\right\}^2\sum\limits_{j=1}^N[x_j(N)*}]^2\right)^{1/2}\ right\rangle}}\cr&\simeq{{\textstyle\sum\limits\{i\N{M{\rm cov}(x_i^*,x_N^*)}\over{left[{\rmvar}\left(\sum\limits_{i\N}^M x_N^*\right)\right]^{1/2}}}\cr&=\{{(M-1)\lambda}\在{[M-1+\左(M^2-3M+2\右)\lambda]^{1/2}}\cr&\simeq\lambda ^{1/2}\四{\rm代表\,\,large}\,M.&(6)}]上

在(6)中,我们再次观察到,所有图像均用零均值和一个方差进行了归一化。此外,要计算期望值对于分母,我们再次使用了这样一个事实,即平方根下的二重和的方差与其平均值相比很小。

当我们将数据集拆分为两个时,每个数据集包含M(M)/对齐图像中的2个期望值〈CC〉N个,M(M)相关系数这两个总和之间的差值为

[\eqalignno{\langle{\rm CC}\rangle_{N,M}&=\left\langle}\rm CC}\left(\textstyle\sum\limits_{i=1}^{M/2}X_i^*,\sum\limits_{j=1}^}M/2}Y_j^*\right)\right\rangle\cr&\simeq\textstyle\sum\ limits_{i=1{M/2{sum\limits{j=1{M/2}{\rm cov}(X_i^*,Y_j^*)\cr&\quad\div\left\{\\left[\textstyle\sum\limits_{i=1}^{M/2}{\rm-var}(X_i^*)+\sum\limits_{i\nei'}^{M/2}\sum\limits\{i'=1}^{M/2}{\rm cov}(X_i ^*,X_{i'}^*)\right]\right。\cr&\\quad{\times}\\left。\左[\textstyle\sum\limits_{j=1}^{M/2}{\rm变量}simeq{M\ over{(2/\langle{\rm-CC}\rangle_N^2)+M-2}}\ quad{\rm for \,\,large\,\,M.&(7)}]

在这里和(6)中,我们使用了关系

[{\rm cov}\left(\textstyle\sum\limits_i x_i,\sum\limits_j y_j\right)=\textstyle\sum\limits\i\sum\limits_j{\rm-cov}\ left(x_i、y_j\ right)\eqno(8)]

[{\rm var}\left(\textstyle\sum\limits_i x_i\right)=\textstyle\sum\limits _i{\rm-var}\leaft(x_i\ right)+\textstyle\ sum\limits_{i\ne j}\sum\ limits _ j{\rm-cov}\left(x_i,x_j\rift)\eqno(9)]

(情绪等。, 1974【Mood,M.A.,Graybill,F.A.&Boes,D.C.(1974),《统计学理论导论》,新加坡:McGraw-Hill。】). 我们注意到,随着图像数量的增加M(M)接近无穷大,我们期望a相关系数第页,共页。因此,如果所有图像都与公共引用对齐,则相关系数不是对平均值中存在的信号的可靠测量。例如,如果我们有1000张大小的图像N个=64×64像素,我们会发现相关系数为0.67;对于5000张图像,我们发现相关性为0.91。如果我们允许图像的旋转对齐以及在两个位置坐标中的对齐,我们预计情况会变得更糟;独立相关系数的个数N个‘(3)中的’将更大,因此‘CC’N个将增加,进而导致“CC”增加N个,M(M).

对于用于计算粒子三维重建的图像,也可以使用类似的参数。这个相关系数为了测试,将在两个3D地图之间计算分辨率,每个3D地图包含的体素数量大于二维情况下的像素数量。然而自由度在对齐中也更大,包括两个位置坐标和三个角度。

3.其他处置措施

3.1. 光谱信噪比

光谱信噪比(SSNR)被建议作为另一种分辨率度量(Unser等。, 1987【Unser,M.、Trus,B.L.和Steven,A.C.(1987)。超微显微镜,23,39-52。】, 1989【Unser,M.、Trus,B.L.、Frank,J.和Steven,A.C.(1989)。超微显微镜,30,429-434。】). 其定义为

[{\rm SSNR}_R=\cases{F_R-1和{$F_R>1$}\cr 0&{$F-R\le 1,$}}\eqno(10)]

用光谱方差比

[F_R={{(M-1){\textstyle\sum\limits_{k\在R}}\left|{\texttyle\sum\limits_{i=1}^M}F_i({\bf k})\right|^2}\在{M{\textstyle\sum\ limits_在R}{k\上}\,{\textstyle\sum\limits_{j=1}^M}F_j({\bf k})\right|^2}},\eqno(11)]

哪里F类是图像的傅里叶变换X(X)R(右)是傅里叶空间中评估SSNR的区域。这个期望值属于F类R(右)对于包含纯不相关噪声(Unser)的图像等。, 1987【Unser,M.、Trus,B.L.和Steven,A.C.(1987)。超微显微镜,23,39-52。】). 我们注意到,对于包含纯噪声的图像,所有傅里叶系数的概率分布是相同的。这个期望值在每个傅里叶系数为零的情况下,傅里叶参数的方差与图像中的方差有关(F类) = N个无功功率(X(X))两个傅里叶变换系数的协方差为cov(F类,[F_{j}^{\dagger}])=N个覆盖(cov)(X(X),X(X)j个). 当计算期望值属于F类R(右)对于一系列M(M)对齐图像,我们观察到M(M)分子和分母可以像以前一样独立处理,

[\eqaligno{\langle{F_R}\rangle&\simeq(M-1)\textstyle\sum\limits_{k\in-R}\left[\sum\limits_{i-1}^M{\rm var}(F_i)+\sum\slimits_a{i\ne j}^M{\textstyle\sum\limits{j=1}^M}{\rm-cov}(F_i,F_j^{\dagger})\right]\cr&\\quad\div\\biggr(\M{\textstyle\sum\limits_{k\in R}}\biggr\{{\texttyle\sum\limits_{i-1}^M}{\rm var}(F_i)+{1\over{M^2}}\biggr[\textstyle\sum\limits_{i-1}^M{\rm var}(F_i j=1}^M{\rm cov}(F_i,F_j^{\dagger})\biggr\}\biggr)\cr&={1+(M-1)\lambda}\over{1-\lambda}}\cr&\simeq{{1+(M-1)\langle{\rm CC}\rangle_N^2}\over{1-\langle}\rm CC}\range_N^2}}\quad{rm for \,\,large}\,M&(12)}]

因此

[\langle{\rm SSNR}_R\rangle\simeq{{M\langle}\rm CC}\rangle_N^2}\over{1-\langle\rm CC}\range_N^2{}\quad{rm for \,\,large}\,M.\eqno(13)]

(13) 给出了整个频谱上的SSNR的平均值。对于大型M(M),我们预计SSNR将显著大于1。因此,SSNR显示出假高值的相同效果。例如,如果我们有1000个大小的图像N个=64×64像素,我们会发现SSNR为4.1;对于5000张图像,我们发现SSNR为20.4。The relation between the相关系数而SSNR为

[{\rm SSNR}\simeq 2{\rm-CC}/(1-{\rm-CC}).\eqno(14)]

(14) 与Frank&Al-Ali(1975)给出的关系相同【Frank,J.&Al-Ali,L.(1975),《自然》(伦敦),256,376-379。】)除了因子2之外,这说明了以下事实:(14)中的SSNR描述了所有图像的最终平均值的信噪比,而不是通过相关系数比较的两个半集的平均值的信噪比。

3.2.因素

分辨率的另一个度量方法是因素(van Heel和Hollenberg,1980年[Heel,M.van&Hollenberg,J.(1980)。分子尺寸的电子显微镜,W.Baumeister编辑,第256-260页。柏林,纽约:施普林格。]; 凯塞尔等。, 1985【Kessel,M.、Radermacher,M.和Frank,J.(1985),《微生物学杂志》第139、63-74页。】),定义为

[{\rm QF}({\bf k})={{\left|\textstyle\sum\limits_{i=1}^M F_i

k是傅里叶变换中的特定位置(像素)计算因子。这个纯不相关噪声的因子为零,无噪声信号的因子为一。和以前一样期望值可以通过分别计算分子和分母的期望值来近似QF。我们注意到分母服从威尔逊统计(威尔逊,1949【Wilson,A.J.C.(1949),《结晶学报》,第2期,第318-321页。】)并写入

[\eqaligno{\langle{\rm QF}({\bf k})\rangle&\simeq{{2\left[\textstyle\sum\limits_{i=1}^M{\rm-var}(F_i)+\sum\limits_{i \ne j}^M\sum\limits_{j=1}^M{\rm-cov}\limits_{i=1}^M{\rm var}(F_i)}}\cr&={2[1+(M-1)\langle{\rm-CC}\rangle_N^2]^{1/2}}\over{(\pi M)^{1/2}}}. & (16)}]

(16) 给出了整个光谱中的因子。对于大型M(M),的因子接近(2)的值/π1/2)〈CC〉N个。这意味着即使是对齐的噪声图像,该因子也仍然很小。例如,对于大小为的图像N个=64×64像素,我们有一个在无限数量图像的限制中,系数为0.072。(16) 表明因子基本上与数据集中的图像数量无关,只取决于它们的相互关系。因此,它测量了原始图像中的信号,而不是最终的平均值。由于纯噪声图像在对齐后具有非零相关性因子也不为零,并且受到与前面讨论的量相同的信号错误指示的影响。

4.计算机上的模拟

4.1. 纯噪音

验证FRC、SSNR和-使用图像处理软件包在计算机上进行因子模拟三脚架(弗兰克等。1996年【Frank,J.,Radermacher,M.,Penczek,P.,Zhu,J..,Li,Y.,Ladjadj,M.&Leith,A.(1996),《生物结构杂志》116,190-199。】). 三个数据集包括1000、5000和10生成了包含64×64像素正态分布噪声(单位方差和零均值)的000幅图像。对每个数据集执行30个平移比对周期。一个周期包括使用来自前一周期的对准参数计算所有图像的平均值,以及使用互相关函数将所有图像随后对准到新的平均值。对于第一个周期,使用原始噪声图像计算第一个平均值。图1[链接]显示了FRC、SSNR和-所有数据集的分辨率区域中的因子值;表1[链接]给出了整个光谱的平均值。计算的平均值与模拟中发现的值吻合良好。图1[链接]显示了FRC、SSNR和因子在整个谱中近似为常数,曲线中的噪声随着较小的数据集而增加。

表1
模拟和计算的比较

FRC、SSNR和三个不同数据集的因子和使用文中导出的方程计算的值。

  财务报告委员会 SSNR公司 因素
数据集 模拟 等式(7)[链接] 模拟 等式(13)[链接] 模拟 等式(16)[链接]
N个= 1000 0.67 0.67 3.89 4.06 0.070 0.080
N个=5000 0.89 0.91 18.4 20.4 0.063 0.074
N个= 10000 0.95 0.95 35.6 40.8 0.061 0.073
[图1]
图1
()财务报告委员会(b条)SSNR和(c(c))对于仅包含正态分布噪声的图像,对齐数据集的分辨率区域因子。包含的数据集M(M)=1000(虚线)、5000(虚线000张图像(完整的线条)。对于最小的数据集,图中的噪声最高。所有曲线图都显示了整个光谱的近似常量值。分辨率以像素为单位−1.

4.2. 信号的存在

当图像中出现信号时,分辨率测量的期望值会发生变化。这是对准自由度降低的结果:信号将通过偏爱独立于噪声的定义位置来约束单个图像的对准。如果信号的幅度在傅里叶谱中不是恒定的,则期望值的统计值也会在谱中发生变化。最终对准将取决于信噪比和光谱分布信号。生成了测试图形(图2[链接])和归一化(单位方差和零均值)。测试图形傅里叶谱分辨率区域的平均振幅如图2所示[链接](b条). 通过向测试模式中添加正态分布的噪声,生成了另外六个测试数据集。前三个数据集包括1000、5000和10000幅图像(64×64像素),信噪比(信号方差与噪声方差之比)为1/25;后三个数据集包含1000、5000和10000幅信噪比为1/4的图像(示例图像如图3所示[链接]). 实验观察到的信噪比范围在1/10到1/2之间,这取决于所检测复合体的大小和电子显微镜获得的对比度。对每个模拟数据集中的图像再次进行归一化。如前所述,进行了30次校准循环,生成了六个最终平均值(图3[链接]). FRC、SSNR和分辨率区域中的系数如图4所示[链接]()–4个((f)). 此外,计算了最终平均值和原始测试模式之间的FRC图(图4[链接]和4小时). 测试图形的傅里叶谱表明,信号在低分辨率下最高。此外,由于测试图形的形状,在频谱中可以看到振荡。这种振荡在所有曲线图中都再现出来,在数据集最大、信噪比最高的情况下最为明显。比较相同大小但信噪比不同的数据集的绘图时(0、1/25和1/4;图3[链接]和4[链接]),一个共同的模式变得显而易见。在信号较强的分辨率区域,FRC、SSNR和因子随数据集的信噪比增加而增加。在信号最弱的分辨率区域,我们发现顺序相反:FRC、SSNR和当数据集的信噪比最低时,factor取其最大值,当没有信号时。这一发现证明了两点。首先,所有考虑的分辨率度量都与数据中信号的功率、分布和数据集的大小有复杂的依赖关系。第二点是对于弱信号,FRC、SSNR和因子不是数据中信号存在的可靠指标。当比较图4中的FRC图时,这一点得到了很好的说明[链接]()和4(b条)图4所示[链接]()和4(小时). 对于信噪比为1/4的数据集,两个半集的平均值之间的FRC与最终平均值和测试模式之间的FRC很好地对应。对于信噪比为1/25的数据集,只有在低分辨率下才有很好的一致性。在高分辨率下,两个半组平均值之间的FRC表示强信号(图4[链接]; 对于包含10的数据集,FRC约为0.8000张图像),即使最终平均值和原始测试图案之间几乎没有任何对应关系(图4[链接]).

[图2]
图2
()计算机模拟中使用的64×64像素测试图案。(b条)测试图形的振幅谱,显示由测试图形的特定形状引起的振荡。分辨率以像素为单位−1.
[图3]
图3
64×64像素、信噪比为1/25和1/4的测试图案,以及包含以下内容的数据集在30个平移对齐周期后的数据集平均值M(M)=1000、5000和10000张图像。
[图4]
图4
FRC、SSNR和具有信号(测试模式)和正态分布噪声的对齐图像数据集的分辨率区域因子。包含的数据集M(M)=1000(虚线)、5000(虚线000张图像(完整的线条)。左栏显示了信噪比为1/25的数据集绘图,而右栏中的信噪比是1/4。面板()和(小时)显示最终数据集平均值和图2中所示原始测试模式之间的FRC[链接]()以及两倍于FRC的纯噪音图(Frank,1996[Frank,J.(1996)。高分子组装的三维电子显微镜。圣地亚哥:学术出版社。]). 分辨率以像素为单位−1.

4.3. 两个独立数据集的傅里叶环相关

为了完成分析,生成了两个数据集,每个数据集包含图2中5000个测试图案的图像[链接]()增加了信噪比为1/4的噪声。数据集与以前一样对齐,但与两个单独的引用相对应。在每个校准周期中,将两个参考重新计算为各自校准数据集的平均值。具有两个独立参考的对齐与上一节中的模拟不同,因为第一个数据集中的图像从未与第二个数据集生成的参考对齐,并且反之亦然从而使参考完全不相关。使用FRC(FRC)比较最终平均值1/2如图5所示[链接]). 第一组数据的最终平均值也与原始测试模式(FRC原始如图5所示[链接]; 这与图4中的曲线相同[链接]小时对于M(M) = 5000). 图5中的FRC图[链接]显示与前面看到的相同的振荡。财务报告委员会1/2小于FRC原始因为前者比较原始测试模式的两种有噪表示,而后者比较有噪表示和无噪测试模式。两个噪声平均值之间的预期方差是其中一个噪声平均数与原始测试模式之间方差的两倍。对于FRC,这意味着

[{\rm FRC}_{\rm-orig}\simeq2{\rm-FRC}_{\rm 1/2}/({1+{\rmFRC}_{\rm-1/2}}).\eqno(17)]

第三个地块(FRC估计)显示预计FRC原始如图5所示[链接]并与FRC达成一致原始除非FRC较小(分辨率约为0.43),因此统计不确定性增加。

[图5]
图5
两个数据集平均值之间的分辨率区域中的FRC,每个数据集包含5000个图像(FRC1/2),在一个数据集的平均值和原始测试模式(FRC原始)和预计FRC原始(财务报告委员会估计),基于(17[链接]). 分辨率以像素为单位−1.

5.讨论

本研究的目的是回顾通过平均单个蛋白质分子或复合物图像得出的结构分辨率的常用测量方法。前面的计算和计算机模拟表明,根据所使用的分辨率测量,最终结构或用于推导结构的图像中存在的指示信号可能是偶然的。本研究处理2D平均值的简单情况,但结果也适用于3D重建。图4中的模拟[链接]结果表明,对于信噪比为1/4的数据,FRC和SSNR是最终平均值中信号的良好指标。当信噪比降至1/25时,FRC和SSNR仍指示出强信号,即使将最终平均值与原始测试模式进行比较(图4[链接])显示不存在分辨率超过约0.25的信号。例如,对于包含M(M) = 10000张图像,分辨率为0.3时,FRC为0.82(图4[链接])SSNR为10,而图4中最终平均值与原始测试模式的比较[链接]()表示FRC低于噪声级。

图5[链接]表明,如果分别对两个半数据集进行校准,则两个半数集平均值之间的FRC是最终平均值中信号的真实指示器。然而,通常的做法是将两个半数据集合并,以计算下一个校准周期的单个新参考,因为这会使参考中的信噪比加倍。然后假设当将数据分成两半时,仍然可以获得可靠的分辨率测量值(例如,参见Saxton&Baumeister,1982【Saxton,W.O.和Baumeister,W.(1982),《微生物学杂志》127,127-138。】). 如本研究所示,情况并非如此。因此,重要的是将两个半数据集与两个单独的引用对齐。

在SSNR的原始定义中(Unser等。, 1987【Unser,M.、Trus,B.L.和Steven,A.C.(1987)。超微显微镜,23,39-52。】),假设要对准的图像中存在的噪声是不相关的。此假设对原始工作中导出的SSNR的特性至关重要。如果图像中的噪声不相关,则此处描述的偶然增加的SSNRs的影响不适用。然而,值得注意的是,对于目前用于单粒子平均的对齐方法,无法避免图像中噪声的相关性。因此,使用当前对准方法的SSNR,计算的信噪比可能明显高于平均结构的实际信噪比。当图像中的信号较弱时,这种影响最强,这种情况通常在低剂量下会遇到电子显微镜冷冻水化标本(亨德森,1992【亨德森·R(Henderson,R.)(1992)。超微显微镜,46,1-18。】). 这个因子遭受相同的问题,因为它指示图像中的信号,如果图像中存在的噪声是相关的,则该信号可能比实际信号强得多。尽管FRC、SSNR和对于纯噪声图像,可以相当准确地估计因子(表1[链接]),当存在信号时,这些值显示出更复杂的行为(图4[链接]). 如果结构(信号)是准确已知的,人们可以估计相关噪声引起的误差,并在分辨率图中进行校正。然而,它与人们通常寻求确定的结构完全相同,因此对偶然较高的FRC、SSNR和这个因素通常是不可能的。因此,非零相关系数在一组对齐图像中的一对噪声图像之间无法与非零图像区分相关系数由真实信号产生。

6.结论

现代社会的一个重要目标电子显微镜生物样品的研究是对非晶体样品的三维结构进行高分辨率的研究。根据单个蛋白质分子或复合物的图像计算的3D重建分辨率的准确测量是对电子显微镜中记录的图像以及将要开发的将单粒子方法推向近原子分辨率的新方法的基本质量评估。目前的研究表明,常用的分辨率测量,如傅里叶环相关、光谱信噪比或因素,可能会产生不切实际的结果。只有当两个半数据集中的图像对齐使用两个独立的参考结构时,傅里叶环相关才是三维重建中存在的信号的可靠指示器。

致谢

作者感谢W.M.Keck基金会的财政支持,感谢Robert Glaeser和David DeRosier对手稿的批判性阅读。

工具书类

第一次引用Böttcher,B.、Wynne,S.A.和Crowther,R.A.(1997)。自然(伦敦),386, 88–91. 公共医学 科学网 谷歌学者
第一次引用Conway,J.F.、Cheng,N.、Zlotnick,A.、Wingfield,P.T.、Stahl,S.J.和Steven,A.C.(1997)。自然(伦敦),386, 91–94. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Frank,J.(1996)。高分子组装体的三维电子显微镜。圣地亚哥:学术出版社。 谷歌学者
第一次引用Frank,J.和Al-Ali,L.(1975年)。自然(伦敦),256, 376–379. 交叉参考 公共医学 中国科学院 科学网 谷歌学者
第一次引用Frank,J.、Radermacher,M.、Penczek,P.、Zhu,J、Li,Y.、Ladjadj,M.和Leith,A.(1996)。J.结构。生物。 116, 190–199. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Gabashvili,I.S.、Agrawal,R.K.、Spahn,C.M.T.、Grassucci,R.A.、Svergun,D.I.、Frank,J.和Penczek,P.(2000)。单元格,100, 537–549. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Grigorieff,N.和Grigorieff,R.D.(1999年)。Preprint,Reihe Fachbereich Mathematik,柏林理工大学,第647号谷歌学者
第一次引用Harauz,G.和van Heel,M.(1986年)。Optik公司,73, 146–156. 谷歌学者
第一次引用Heel,M.van(1987年)。超微显微镜,21, 111–124. 交叉参考 公共医学 科学网 谷歌学者
第一次引用Heel,M.van和Hollenberg,J.(1980)。分子尺寸的电子显微镜由W.Baumeister编辑,第256-260页。柏林,纽约:斯普林格出版社。 谷歌学者
第一次引用Heel,M.van,Keegstra,W.,Schutter,W.和van Bruggen,E.F.J.(1982)。无脊椎动物呼吸蛋白的结构与功能由E.J.Wood编辑,第69–73页。阅读:哈伍德学院。 谷歌学者
第一次引用Henderson,R.(1992)。超微显微镜,46, 1–18. 交叉参考 公共医学 中国科学院 科学网 谷歌学者
第一次引用Henderson,R.(1995)。夸脱。生物物理学评论。 28,第171页至第193页交叉参考 中国科学院 谷歌学者
第一次引用Henderson,R.、Baldwin,J.M.、Ceska,T.A.、Zemlin,F.、Beckmann,E.和Downing,K.H.(1990)。分子生物学杂志。 213, 899–929. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Kessel,M.、Radermacher,M.和Frank,J.(1985)。《微生物学杂志》。 139, 63–74. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Kühlbrandt,W.、Wang,D.N.和Fujiyoshi,Y.(1994)。自然(伦敦),367, 614–621. 公共医学 科学网 谷歌学者
第一次引用Mood,M.A.,Graybill,F.A.&Boes,D.C.(1974年)。统计学理论导论。新加坡:麦格劳-希尔。 谷歌学者
第一次引用Nogales,E.、Wolf,S.G.和Downing,K.H.(1998)。自然(伦敦),391, 199–203. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Penczek,P.A.、Grassucci,R.A.和Frank,J.(1994)。超微显微镜,53, 251–270. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Saxton,W.O.和Baumeister,W.(1982)。《微生物学杂志》。 127, 127–138. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Unser,M.、Trus,B.L.、Frank,J.和Steven,A.C.(1989年)。超微显微镜,30, 429–434. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Unser,M.、Trus,B.L.和Steven,A.C.(1987年)。超微显微镜,23, 39–52. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Wilson,A.J.C.(1949年)。《水晶学报》。 2, 318–321. 交叉参考 IUCr日志 科学网 谷歌学者

©国际结晶学联合会。如果引用了原文作者和来源,则无需事先获得许可即可复制本文中的简短引文、表格和数字。有关详细信息,请单击在这里.

期刊徽标生物
结晶学
国际标准编号:1399-0047