Cryo-TEM simulations of amorphous radiation-sensitive samples using multislice wave propagation

Himes, B.; Grigorieff, N.

doi:10.1107/S2052252521008538

研究论文

IUCrJ大学

第8卷| 第6部分| 2021年11月| 第943-953页

国际标准编号：2052-2525

https://doi.org/10.107/S2052252521008538

CRYO公司|相对长度单位

打开

访问

非晶辐射敏感样品的多层波传播低温TEM模拟

本杰明·希姆斯 ^一 ^*和尼古拉·格里戈里夫 ^一

^一美国马萨诸塞大学陈医学院RNA治疗研究所，马萨诸塞州伍斯特市种植园街368号，邮编：01605
^*通信电子邮件：benjamin.himes@umassmede.du

德国马克斯·普朗克分子生理研究所S.Raunser编辑(收到日期：2021年5月10日； 2021年8月16日接受；在线2021年9月30日)

图像模拟在高分辨率的开发和实践中发挥着核心作用电子显微镜，包括透射电子显微镜冷冻水化标本（冷冻-EM）。模拟具有与实验图像中观察到的对比度相匹配的对比度的图像仍然具有挑战性，尤其是对于非晶样品。当前最先进的模拟器适用事后（post-hoc）缩放到近似经验溶剂对比度，因样品厚度和振幅对比度而衰减图像强度。对于需要空间可变缩放的图像，此做法失败，例如模拟拥挤或蜂窝环境。准确地建模信号和噪声对于模拟具有绝对尺度上正确对比度的生物样本图像是必要的。引入“冻结等离子体”方法来显式模拟空间变量非弹性散射冷冻电镜标本中的过程。这种方法产生的振幅对比度取决于样品的原子成分，再现了总的非弹性平均自由程如实验所观察到的，并且允许在模拟中结合辐射损伤。使用匹配滤波器概念量化这些改进，以比较模拟和实验。冷冻等离子体方法与一种新的数学公式相结合，用于在笛卡尔网格上精确采样原子散射势列表，该方法在开源软件包中实现顺式透射电镜。

关键词：低温-TEM;多层波传播;顺式透射电镜;冷冻等离子体法.

类似文章

1.简介

定量了解图像对比度是低温电子显微镜的一个重要目标，目的是准确测量样品密度，优化图像处理策略，以高分辨率重建大分子结构，并完善图像形成模型。本文中的实验解决了一个简单的问题：能否以正确的对比度模拟嵌入无定形冰中的生物大分子的图像？为了回答这个问题，我们研究了几种对比度的定义，它们的共同目标是描述“信号”从“噪声”中脱颖而出的程度，并定义了信噪比。使用这些度量的关键是定义信号和噪声的方差如何受到不同误差源的影响，包括数值误差、成像期间的样本运动、辐射损伤以及振幅对比度对原子种类的依赖性。我们首先定义噪声源。

低温EM图像中噪声的功率（方差）超过信号的功率，通常是20倍或更多。低温电子显微镜中的主要噪声源是“散粒”噪声，这是由低剂量成像条件下在给定位置和时间检测电子的随机性引起的。巴克斯特的详细分析等。(2009 )证明了还需要考虑结构噪声的必要性，结构噪声定义为除最终感兴趣的物体以外的其他来源产生的任何对比：碳膜、结晶冰、辐射损伤的粒子、不需要的大分子构象物、支持的非晶冰、，等与散粒噪声不同，结构噪声受物镜像差的影响，从而产生对比度传递函数（CTF）。巴克斯特等。将结构噪声和散粒噪声建模为加性高斯白噪声，这无法捕获图像处理过程中常见的伪影和挑战，如Scheres之前所示等。(2007 ).

结构噪声模拟方法的改进，特别是由支撑非晶冰引起的噪声，可以在TEM模拟器（鲁尔格德等。, 2011 )和InSilicoTEM公司（武洛维奇等。, 2013 ). 他们实现了Cowley和Moodie（1957）最初描述的多层波传播 )，从而产生受CTF影响的噪音。多层模拟的结果是由探测器处电子波函数的平方复数模定义的概率分布ψ_探测器(x,年). 然后通过从泊松分布每个像素都是独一无二的，同时考虑了探测器的影响量子效率（DQE）。

在高分辨率低温电子显微镜中，从样品传输到图像的大部分信息都是在相位对比中捕获的，相位对比是由未散射波和代表样品弹性散射电子的波之间的干涉引起的；忽略散射波之间的高阶相互作用被称为线性成像理论。第二种对比度形式，振幅对比度，是由于电子在物镜孔径外散射而丢失，或者由于非弹性散射。后一种振幅对比度源使用能量滤波器（Yonekura等。, 2006 ). 与相位对比度不同，振幅对比度不能用线性成像理论来解释（埃里克森，1973 )并进行了说明事后（post-hoc）通过将相移项添加到应用于模拟图像的CTF（Erickson&Klug，1971 ). 这种处理方法也是解决图像重建逆问题的常见方法，该逆问题旨在回答“给定观测数据的模型概率是多少”的问题。然而，在正演模拟中，“在给定特定模型的情况下，观测某些数据的概率是多少”，需要考虑振幅损失取决于原子类型和局部质量厚度这一事实。例如，弹性散射物镜光圈外的重原子（如金）比轻原子（如碳）更有可能出现。由于非弹性损耗引起的振幅对比，这种重/轻原子趋势被反转，因为轻原子的非弹性散射概率与弹性散射概率之比更高（Egerton，1976 ; 雷默和罗斯·梅塞默，1989年 )因此，它们在能量过滤图像中比重原子产生更大的振幅损失。为了理解这对模拟图像的影响，我们首先讨论了目前在多层模拟中如何考虑振幅对比度。

对于投影近似失败的厚试样，多层形式主义是必不可少的，因为它包含了电子的多次散射和曲率等重要影响埃瓦尔德球体。越来越厚的样品对电子的透明度也越来越低，我们所知道的所有模拟器都应用了一个隐式“能量过滤器”来从最终图像中去除非弹性散射的电子。为了考虑非弹性损失，使用单个厚度参数衰减图像强度，根据

$[{{I}\结束{{我}_{0}}=\exp\left[{{\rm-厚度}\over{\lambda}}\right]，\eqno（1）]$

哪里我₀是未衰减的图像强度λ是非弹性的平均自由程对于单次散射-电子在非弹性散射之前至少经过一次样品的平均距离。很明显，这些单一过滤器不适用于质量厚度可变的试样(例如或用于可变原子成分(例如细胞核中磷的浓度增加）。即使是含有有限原子种类子集的纯化单粒子样品，也需要模拟两种截然不同的环境：分子和溶剂。我们将把分子从溶剂中脱颖而出的程度作为“溶剂信噪比”信噪比_溶剂由Yonekura量化等。(2006)其中我是平均图像强度σ_溶剂是溶剂区域的标准偏差：

$[{rm SNR}_{rm溶剂}\equiv{|{{bar{I}}{{rm蛋白质}-{{bar}I}}}{溶剂}|}\在{{sigma}_{orm溶剂}}.\eqno（2）]上$

通常，溶剂由水的平均内电势给出的单个值建模，并在投影中添加到模拟分子的顶部。这种方法，我们称之为“连续体模型”，相当于使用移动水原子集合的无限时间平均值。连续体模型的一个缺点是无法解释分子的水合半径，该半径在颗粒内应为零，高于紧邻颗粒包络线外的体积溶剂，并随距离逐渐下降（Shang&Sigworth，2012 ). 忽略分子取代溶剂这一事实已被证明会产生信噪比_溶剂在100e的曝光下甚至无法进行目视检查⁻ Å⁻²（武洛维奇等。, 2013).

我们现在知道，连续体模型中使用的无限时间平均值不能充分描述现实；即使溶剂是冷冻的低密度无定形冰（LDA），在成像过程中也不是静止的。McMullan和Henderson量化了成像过程中LDA中水分子的运动，估计RMSD为～1 Au/e⁻ Å⁻²（麦克马伦等。, 2015 ). 重要的是，随着时间的推移，这种运动会导致溶剂对比度模糊，这可以被视为低通滤波，等等σ_溶剂随着暴露程度的增加而减少。最终结果是SNR_溶剂是图像中总曝光的函数，随着溶剂变得更加模糊而逐渐增加。值得注意的是，信噪比的增加_溶剂随着曝光的增加，质量损失在实验图像中进一步放大，质量损失也会减少σ_溶剂并增加方程式（2）中的分子)通过减少 $[{{\bar{I}}}_{\rm溶剂}]$ 我们的溶剂模型的更复杂版本可能会在未来的工作中实现这种质量损失。

在SNR时_溶剂由于其简单性，更详细的分析需要另一个指标来量化模拟图像再现实验图像的效果。为此，我们建议使用匹配滤波器，这是互相关检测器的统计最优实现。利用低温电磁数据的图像统计特性，匹配滤波器的输出可以简单地定义为互相关系数的比值(CCC公司)的标准偏差CCC公司当只存在噪音时(σ_n个)（里克格尔等。, 2017 )包括上述任何结构噪声源。

$[{\rm SNR}_{\rm-mf}={{CCC}\在{{\sigma}_{n}}.\eqno（3）]$

信噪比上限_中频由输入信号功率与图像中噪声功率的比值给出（McDonough，1995 ). 例如，这意味着较大的分子通常具有较高的信噪比_中频，而图像中的信号和模拟模板之间的任何不一致都会降低SNR_中频从这个最大值。因此，可以通过使用匹配滤波器搜索图像来确定模拟分子密度与实验数据匹配的相对精度。计算方程式（3)，我们使用中可用的互相关工具和相关预处理顺式TEM（授予等。, 2018 ; 卢卡斯等。, 2021 ).

连续体模型的缺点源于在成像过程中忽视样本的变化。感兴趣分子的辐射损伤和样品运动都是通过非弹性散射。对于冷冻非晶样品，非弹性散射通常归因于等离子体子，即成像电子的电场对价电子的集体激发。然而，这些是强离域或更局域的单电子激发的体等离子体子的程度尚不清楚（Egerton，2011）). 与等离子体激元的精确形式无关，它们的净效应是成像过程中系统哈密顿量的改变，因此是传统多层模拟的产物，ψ_探测器(x,年)不再有效。正如最初的多层切片方法引入了将样本电势划分为薄空间切片以确保小角度近似有效一样，我们建议将模拟曝光划分为小时间切片，其中样本变化不大。虽然我们在这里指的是时间，但从显微镜的角度来看，最实际的是用e来测量曝光量⁻ Å⁻²因此，模拟器中的时间步长被指定为每个电影帧的期望曝光。曝光率相关现象，如探测器开发质量工程光束相干性由曝光率参数化，曝光时间由软件根据用户提供的每帧曝光除以曝光率隐式设置。

2.理论

在高分辨率成像过程建模中有三个主要组件透射电子显微镜（HRTEM），其中低温电子显微镜是其中的一个子集：（1）相对论电子波函数及其由样品的调制；（2）试样的暴露相关库仑电势；（3）显微镜，包括孔径、探测器、透镜光学和像差。

在这项工作中，我们主要关注在成像过程中，由于能量沉积在样品中，库仑势是如何变化的，并且只提供其他两个分量的总结。感兴趣的读者以越来越完整的顺序提到了Vulović的治疗方法等。(2013)，柯克兰（2006 )、Reimer&Kohl（2003）)霍克斯和卡斯珀（2018 ).

与光子不同，电子具有自旋量子数，因此它们与物质的相互作用由狄拉克方程的解决定。给出合理的近似值（Hawkes&Kasper，2018)一个相对论修正的薛定谔波动方程，称为克莱因-戈登方程，被用于实践中。这个方程的解析解对于除了最简单的系统之外的所有系统都是难以处理的，所以我们转向多层波传播（Ishizuka&Uyeda，1977）)，生成此方程的近似数值解。多层模拟的第一步是计算样品的投影库仑势 $[{V（{\bf r}，t）]$ ; 假设暴露于单电子的准静态溶液，则时间依赖性随后将被忽略。电势沿成像轴被分成薄片，可由二维散射电势近似，电子波函数通过二维散射电势依次传播。这种细分可确保电势沿电子波传播方向缓慢变化，以便小角度近似仍然有效，散射球面波前可通过抛物线局部近似（菲涅耳衍射）。在无限薄切片的限制下，这将导致准确的Klein–Gordon方程的数值解（Goodman&Moodie，1974）).

多条模拟可以对弹性和非弹性散射过程，前提是可以计算相应的库仑势。与光学显微镜中的光学势类似，非弹性散射通过样本电势中的复数项并入波动理论 $[{V}（{\bf r}）]$ 由Slater（1937）介绍 ).

$[{V}（{\bfr}）={V}{（{\ffr}）}{\rm弹性}+i{V}}{非弹性}.\eqno（4）]$

孤立原子叠加近似表明，样品电势五(第页)可以表示为单个原子势的总和φ(第页)_我。我们引入了一个比例因子β为了补偿这些原子之间键的贡献，以保持正确的总散射截面：

$[V（{\bf r}）\simeq\beta\sum\varphi（{\bf r}）_{i}.\eqno（5）]$

弹性原子势可以使用相对论Hartree–Fock波函数计算（Doyle&Turner，1968）). 具有各向同性分布的孤立原子的解通常由四个或五个高斯函数（Peng等。, 1996 ). 通常，电位是间接记录的，因为这些拟合被列为弹性电子散射因子 $[{f}^{（\rme）}（\theta）]$ 定义为弹性势的傅里叶变换（Peng，1999 ):

$[{{f}}^{（\rme）}（\theta）={{2\pi{米}_{0}{\rme}}\在{h}^{2}}}{F}\{\varphi（{\bfr}）\}上，\eqno（6）]$

哪里θ是散射角，e是电子电荷，米₀是剩余质量，小时是普朗克常数F类表示傅里叶变换运算符。我们稍后将回到的一个重要关系是光谱分布微分散射的散射因子横截面–电子通过立体角散射的概率密度Ω:

$[{{\rm d}\sigma}\在{{\rmad}\Omega}}={\left|{f}^{（\rme）}（\theta）\right|}^{2}.\eqno（7）]$

虽然从第一原理计算起来很简单， $[{{V}（{\bf r}）{\rm非弹性}]$ 考虑到入射电子向样品传递能量的各种机制，这个问题更大：电离、激发、离解附着、振动和旋转激发、轫致辐射、，等（Plante&Cucinotta，2009）). 一个例子，其中 $[{{V}（{\bfr}）{\rm非弹性}}]$ 定义明确的是对辐射不敏感的晶体样品，其中由声子激发引起的热扩散散射（TDS）是复合势（Peng）的主要贡献者等。, 1996). 一种用于计算TDS势的模型通过德拜-沃勒因子处理时间平均原子位移，并提高了动态RHEED计算的准确性（杜达列夫等。, 1995 ). 这种时间平均方法类似于HRTEM模拟生物样品时如何计算溶剂、样品运动、辐射损伤和对准误差B类-与德拜-沃勒因子相关的因子为4。

虽然这种时间平均方法保留了预计相互作用潜力的总强度（Kirkland，2016 )众所周知，以这种方式产生的图像对比度是系统性错误的，通常是三倍或更多。误差被称为Stobbs因子（Hátch&Stobbs，1994）)随着电子-样品相互作用强度的增加，情况变得更糟，而电子-样品交互作用强度又取决于样品中的平均质量厚度。斯托布斯等。提出了模拟和观测之间观察到的对比度不匹配的两个可能原因：（a）现有的模拟器没有完全考虑到样本的辐射损伤和/或（b）它们没有对非弹性散射具有足够的准确性。最近的经验表明，这些是相关的现象（Peet等。, 2019 ).

范戴克等。证明了Stobbs因子可以通过“冻结声子”方法在很大程度上进行校正（Van Dyck，2009 , 2015 ). 该方法在概念上很简单：根据基于经验TDS值的概率分布，在每个原子随机位移的情况下进行了一系列模拟。这个强度在图像平面中，根据这些单独的模拟计算出的值被一起平均。在这里，我们提出了一个类似的想法，应用于对辐射敏感的冷冻水化标本，其中等离子体子是主要形式的非弹性散射。冷冻等离子体方法提出了几个计算和理论挑战：（1）溶剂原子的数量，O（10⁹)大大超过了我们希望模拟图像的大分子O（10⁵)，需要仔细的算法设计，以使计算易于处理。（2）溶剂和大分子具有非常不同的弹性和非弹性总散射截面，以及不同的平均质量密度[～0.94 g cm⁻³对于低密度无定形冰和～1.38 g cm⁻³蛋白质平均值（Fischer等。, 2004 )]，这意味着振幅对比度和非弹性损失无法应用特别的最终的模拟图像，必须在每个原子的基础上考虑。（3）前面的几点也对每个原子散射势的计算精度提出了要求，因为原子散射势不能再简单地进行缩放，所以必须从一开始就正确无误。

低密度非晶冰中等离子激元的散射因子需要达到适当的对比度，这取决于适当的光谱分布。获取表达式 $[{\varphi}^{（\rm非弹性）}{（{r}）}{i}]$ ，我们从双微分散射开始横截面对于等离子体（Ferrell，1956 ; 埃格顿，2009 ). 基本形式是洛伦兹

$[{{\rmd}^{2}\sigma}\over{{\rmad}\Omega{\rmd}E}}\propto{1}\over{{\theta}^{2}+{\theta}_{E}^{2]}}，\eqno（8）]$

具有角度相关性θ以及特征角中捕获的能量依赖性，

$｛θ｝_｛E｝=｛δ{电子}_{\rm-pl}}\在{2E}}上。\等式（9）]$

$[\hslash{\omega}_{\rm-pl}=\delta{电子}_{\rm pl}]$ 是等离子子损失的能量E类这个动能来的电子。为了计算等离子体子的散射因子，我们首先根据Du&Jacobsen（2018）发布的EELS数据，形成了非晶冰中单个散射电子产生的等离子体子的经验概率分布 ). 然后对方程（8）进行数值积分)每个角度的低损耗谱（7.5–100 eV）中的过能量。选择低能截止与Gatan能量过滤器（15–20 eV）的典型能量狭缝宽度一致，这不能排除约3%的等离子体子，而较高能量截止排除约1%的等离子体子。

然后，我们将此光谱与非弹性与弹性总散射截面之比的经验测量值相结合，后者与原子分子量成反比（Reimer&Ross-Messemer，1989). 当我们在模拟过程中计算弹性势时，我们通过这些总概率分别累加每个原子的非弹性势。在波函数传播过程中，该非弹性势以正确的洛伦兹形式给出，取上述值的平方根。

等离子体以低角度强烈散射，通常称为离域。这反映在图1中其中非弹性散射我们推导的等离子体子因子与弹性散射谷氨酰胺分子的因子。而等离子体散射在低分辨率下占主导地位弹性散射，从图1中的橙色散列标记可以看出，它在高角度上仍有显著贡献将总垃圾箱划分为20%非弹性散射奈奎斯特频率的概率，2Ω⁻¹在本例中。The precise nature of非弹性散射在非晶态材料中，人们还没有很好地理解这一高分辨率信息与潜在样品结构之间的关系。

图1
谷氨酰胺分子的弹性散射因子（黑线）与等离子体赝粒子的非弹性散射系数（灰线）。橙色标记表示箱子的右边缘损害了根据散射因子的平方范数计算的非弹性等离子体散射因子20%的带限散射概率。

3.结果

3.1. 分子密度的精确表示

对于孤立的中性原子，散射势定义为参数化散射因子的傅里叶变换，可以写为

$[\eqaligno{\varphi（\bfr）=&\{{h}^{2}}\over{2\pi{米}_{0}e}}\sum\limits_{i}{一}_{i} {\左（{{4\pi}\上{{b}_{i} +B}}\右）}^{{3}/{2}}\cr&\times\exp\left\{{-4{\pi}^{2}\left[{\left（x-{x}_{0}\右）}^{2}+{（y-{y}（y）_{0}）}^{2}+{\左（z-{z}（z）_{0}\right）}^{2}\right]}\结束{{b}_{i} +B}}\右}，&（10）}]$

哪里一_我和b_我是拟合系数，B类是德拜-沃勒因子，其他符号的含义与其他符号相同。这个原子势在原子坐标附近急剧达到峰值( $[{\bf r}=\langle（语言）{x}_{0},{y}（y）_{0},{z}（z）_{0}\范围]$ )在实际空间中，离散化时需要高采样率以保持总投影电位。这种高采样率有效地产生了方程（10）的数值积分). 为了允许更粗的采样，从而提高模拟器的计算效率，我们对方程（10）中的表达式进行了分析积分):

$[\eqalinno｛\varphi_｛\rm vox｝（\bf r）=&&｛｛h^2｝\over｛2\pi m_0 e｝｝\sum\limits_{i｝a_i\left（｛4\pi｝\over｛b_i+b｝｝\right）^｛3｝/｛2｝｝\cr&&times\prod_j\int_0^ ^｛\infty｝｛\rm d｝x_j\exp\left[｛-4\pi ^2（x_j-x_｛j\，0｝）^2｝\over｛b_i+b｝｝\右]，&（11）｝]$

导致

$[\varphi_｛\rm vox｝（｛\bf r｝）=｛｛h^2｝\over｛2\pi m_0 e｝｝\sum\limits_i a_i\prod_j erf\left[｛2\pi（x_j-x_｛j\，0｝）^2｝\over｛（b_i+b）^｛1/2｝｝｝\right]，\eqno（12）]$

在这里电流变液是标准误差函数，vox下标表示该值高于离散体素，并且x_j个表示x,年和z（z）协调。虽然每个体素中的潜力计算成本稍高（要评估积分极限，与单个指数相比，每个体素的误差函数必须评估六次），但这远远超过了所需体素数量减少的补偿。例如，以0.5°体素间距进行模拟的计算成本比以0.1°体素倾角进行模拟的成本低125倍。虽然在z（z）-尺寸，板坯厚度是一个自由参数，它也影响计算效率。根据Kirkland（2006）的建议，通过简单测试确定最大允许厚度)搜索模拟结果依赖于板坯厚度的点。我们的模拟开始显示出对7º左右板坯厚度的依赖性（未显示数据），因此，我们通常使用5º。使用方程式（12）比计算速度更重要)在我们的模拟中，也意味着采样电势仍然具有正确的大小，并且不简单地与连续电势成正比，如下一节所述。

3.2. 孤立原子叠加近似的补偿

而方程（12）中散射势的积分公式)保留了所有单个原子贡献的计算势，但由于键相互作用，仍然存在对散射势的系统低估。这通常估计在总潜力的5-10%之间（彭等。, 2010 )忽略这一差异称为孤立原子叠加近似。考虑到我们想要获得在绝对尺度上定量的图像，我们试图测量和校准此误差。为了近似生物样品中由于键合而引起的散射电位的重新分布，我们使用以下可用数据非晶碳，与以下电子全息结果进行比较。材料中的平均相移取决于材料的平均内电势(五₀)，厚度(t吨)和相互作用常数C类_E类（Reimer&Kohl，2003年),

$[C_{E}={{2\pi}\ over{lambda E}}{{E_0+E}\ over{2E_0+E}}，\eqno（13）]$

哪里E类₀和E类剩下的能量和动能具有波长的成像电子λ此外，表面边界效应在低温电子显微镜成像中也很重要，因此我们比较了我们计算的相移δφ利用电子全息技术获得的经验结果，该技术测量了碳的平均内电势(五₀=9.04 eV，1.75 g cm⁻³密度）和附加厚度相关的表面诱导相移φ_添加（0.497弧度）（Wanner等。, 2006 ):

$[\delta\varphi={C_{E}}{V_0}吨+｛\varphi_｛\rm add｝｝。\等式（14）]$

考虑到Zernike相位板的原理，我们模拟了一个非晶碳应产生相移的薄板π/2弧度[图2(一)]密度为1.75克厘米⁻³和348.6Ω厚度符合方程式（14). 我们的模拟表明，平均相移小了约3.8%。为了纠正这个错误，我们引入了一个恒定的比例因子[方程（5)]1.038到孤立原子势。模拟相位板还可以用作健全性检查，以表明弹性散射不同像素大小的电势是一致的[图2(b)].

图2
(一)用密度为1.75 g cm的348.6μ厚碳原子非晶层模拟相板⁻³. (b)模拟相位板的平均相移是模拟过程中像素采样率的函数。黑线绘制于π/2弧度用于视觉参考。

3.3. 散装溶剂建模

由于生物样品中水分子的绝对数量，模拟散装溶剂需要大量计算。我们选择计算水的粗粒度模型，其中每个水分子表示为单个各向同性散射中心。我们基于弹性散射我们在弹性散射氧气系数表中列出，但按总比率缩放弹性散射横截面氧气：水，我们从实验中知道（Plante&Cucinotta，2009). 对于低密度非晶冰（～0.94 g cm），这些假分子以适当的密度随机播种⁻³). 然后模拟一部电影，其中每个时间步长（电影帧）由用户指定的曝光量定义，样本在该时间内保持不变。

振幅损失原因非弹性散射通过复散射势（通常定义为与实际（弹性）势成线性比例）并入多层形式，例如InSilicoTEM公司Dudarev及其同事（Peng）对为什么这个比例模型不合适进行了详细分析等。, 1996). 我们不是使用线性比例模型，而是根据理论部分中定义的等离子体散射因子，从重标体积溶剂弹性势导出复散射势，以获得功率谱密度（PSD）。

参考图3，我们观察到非弹性散射引起的衰减的预期函数形式。

图3
粗颗粒全原子溶剂模型与我们导出的等离子体的非弹性散射因子相结合，通过不需要缩放的复势产生振幅损失事后（post-hoc）斜率是非弹性（单次散射）的读数平均自由程在我们的模拟溶剂中。

3.4. 振幅对比度

在结束对非晶样品体性质的讨论之前，我们现在研究另一种形式的振幅对比度，这种对比度是由电子在物镜孔径外散射引起的。通过在成像之前将孔径函数直接应用于复波函数，将其纳入模拟中，这将导致探测器处预期电子数的衰减。这如图4所示对于一系列孔径和一个模拟的非晶样品，其密度和厚度与之前用于“相板”的相同，具有碳原子（橙色圆圈）、磷原子（灰色x’s）或金原子（蓝色方块）的原子势。所使用的最小孔径（0.01µm）不包括除未衰减光束以外的所有光束，因此也是模拟层总透射率的测量值。

图4
物镜孔径外的散射会产生振幅损失，该损失因原子种类而异。这里计算的最小值（0.01µm）是散射电子与非散射电子的关系。模拟的非晶碳层（如图1所示

)弹性散射总共约6.2%的入射电子。用金原子取代碳原子，约99.5%的电子被散射。

3.5. 溶剂噪声的准确表示

在前面的部分中，我们评估了单个类型原子的大型集合的行为。要证明模拟的对比度在绝对尺度上是正确的，更严格的方法是比较具有不同散射特性的原子组：溶剂和溶质。为此，我们使用方程（2)作为量化信噪比的指标_溶剂通过连续介质模型和冻结等离子体方法计算。

在图5中(电子)我们展示了使用连续体模型（顶行）模拟的电影中选定的时间点，实验数据（EMPIAR-10061；Bartesaghi等。, 2014 )中间一行是用冰冻等离子体方法计算的粗颗粒全原子模型。从视觉上可以看出，信噪比_溶剂对于连续体模型来说更强，因为电势只有直流分量。在比较图5时，也强调了对PSD的依赖性(一)和5(b)在溶剂区具有相同的平均强度，但信噪比相差很大_溶剂值。为了量化这种影响，我们计算了信噪比_溶剂如方程式（2)，通过图5中掩模的白色部分定义溶剂区域(c（c）)蛋白质作为中心黑色区域。结果如图5所示(d日)其中，最终SNR_溶剂使用连续体模型时，二分之一的因子太强，而我们的模型与实验数据非常吻合。

图5
连续和粗颗粒全原子溶剂模型和实验数据的比较。(一) ∣ψ_探测器∣²为溶剂添加恒定的电势。(b) ∣ψ_探测器∣²采用粗颗粒全原子水模型。平均强度(一)和(b)在数值精度范围内，溶剂区是相同的。(c（c）)计算SNR时使用的掩码_溶剂[方程式（2

)正文]其中白色区域用于溶剂，中心黑色区域用于蛋白质。(d日)SNR图_溶剂作为实验数据（蓝线、方形标记）、粗颗粒全原子溶剂模型（灰色、x标记）和恒定溶剂势（橙色钻石标记）的累积曝光函数。(电子)中计算绘图时使用的图像(d日)使用相同的颜色/标记方案，总曝光量沿底部显示。实验数据取自EMPIAR 10061，β-半乳糖苷酶。比例尺100º。

3.6. 溶剂包络线建模

已经证明我们可以用真实的信噪比模拟图像_溶剂通过使用散射势的积分形式和冻结等离子体方法，我们现在将注意力从准确模拟溶剂和非弹性损失转向通过与使用匹配滤波器的实验图像和输出（SNR_中频)公式（3）中定义).

作为基线，我们计算一个“完美”模型真空中，具有轮状病毒双层颗粒（DLP，PDB入口）的投射散射势3盎司; 陈等。, 2009 )如图6所示(一). 我们使用此模型从18部DLP电影中搜索单个早期帧，每部电影的累计曝光量为1.5 e⁻ Å⁻²,例如图6(b). 在这种低辐射水平下，我们假设没有明显的辐射损伤。平均信噪比_中频在这18个电影帧中，从180个DLP到10.4个DLP。

图6
(一)使用PDB条目投影模拟轮状病毒DLP3盎司，平均峰值信噪比_中频白色覆盖的180个DLP。(b)电影第二帧的示例图像，只有1.5 e⁻ Å⁻²累积暴露。(c（c）)溶剂嵌入模拟的旋转平均功率谱与基础模拟的比值，如(一). (d日)溶剂嵌入和检测器MTF模拟的旋转平均功率谱与之前模拟的比值，如所示(c（c）). (电子)包含溶剂嵌入、检测器MTF和残余帧内运动模糊的模拟的旋转平均功率谱与之前模拟的比率，如(d日). (（f）)具有溶剂嵌入、检测器MTF、残余帧内运动模糊和PDB的模拟的旋转平均功率谱的比率B类-上一个模拟的因子，如中所示(电子). 比例尺500º。

生物大分子不存在于真空中；它们位于溶剂中的一个低分辨率“洞”中，这影响了Shang&Sigworth（2012）详细讨论的后续分析). 我们通过跟踪到任何非溶剂分子的最小距离，并使用归一化方程（1）定义的概率分布对任何附近溶剂进行加权，将它们的水合半径模型合并到模拟器中)来自他们的论文。我们注意到，Shang和Sigworth表1中的参数“r3”应为～3.0，而不是1.7。此外，我们使用他们报告的极性和非极性残基系数的平均值，因为模拟器目前仅实现中性原子的各向同性势。

当模拟孤立的大分子以与实验图像进行比较时，我们用这个概率分布来加权平均水势指数衰减从4º开始进入散装溶剂。这个指数衰减是因为我们对样品的了解在感兴趣的粒子之外迅速衰减到零。这会产生类似于特别的Henderson&Mcmullan之前提出的模型（2013 ). 当模拟图像时，概率分布应用于单个伪水分子，如下所述。

为了说明应用前面章节中讨论的溶剂包络的效果，我们绘制了旋转平均PSD $[（{\rm模型}{in\，vacuo}）/（{\rma模型{水合物}}）]$ 如图6所示(c（c）). 我们观察到，光谱阻尼在低分辨率（<20º）时几乎没有影响，在高分辨率（>10º）下相对恒定。为了量化影响，我们包括信噪比_中频覆盖图6中的投影密度(c（c）).

3.7. 对塑造信号分布的其他成像效果进行建模

图6中的后续面板显示的旋转平均PSD $[（{\rm-model}{\rm-provious\，row}）/（{\rma-model{{\rm-Provious\，row+new\，effect}）]$ 探测器MTF再现了我们从拉斯金的工作中得出的应用模型等。(2013 ). 我们之所以选择探测器MTF的参数化，是因为它还通过抑制傅里叶变换的直流分量，纳入了由于电子计数误差而导致的重合度损失 $[|\psi_{\rm检测器}（x，y）|^2]$ .

为了解释由于残余帧内样本运动导致的模糊，我们应用了傅里叶空间阻尼包络，对于匀速运动来说，这通常是一个sinc（c）功能：

$[正弦c（\pi{量子}_{i} ），\eqno（15）]$

哪里d日_我（ω）是实际空间位移矢量q个(Å⁻¹)是空间频率矢量新几内亚功能，我们建议读者参考Frank（1969）的作品 )]. 较不重要的是确定框架内试样的运动，我们只知道其下限，估计为两个相邻框架之间位移的平均值。在图6中(电子)绘制了沿运动方向的调制（这将下降为垂直方向无调制）。最后，我们包括每个原子B类-PDB文件中的系数，并在图6中绘制有效包络线(（f）). 而不是试图将这些联系起来B类-对于任何特定物理现象的因素，我们建议它们只是解释了由各种因素引起的建模原子坐标的不确定性。

通过考虑溶剂包络、探测器MTF、残余帧内运动和原子模型构建不确定性，我们能够提高平均信噪比_中频从10.4至12.14。自SNR以来_中频预计将随着粒子质量的平方根增加（Rickgauer等。, 2017)，这有效地减少了质量检测极限约1.3倍。我们发现，应用额外的阳性或阴性B类-因素只会使平均得分变差，表明该模型相当准确。

3.8. 评估辐射损伤模型

我们开发了一个模型，该模型最大限度地与缺乏实质性辐射损伤的图像保持一致，我们将重点放在辐射损伤上这个低温电子显微镜中的限制因素（Hayward&Glaeser，1979 ). 通过研究TEM中记录的电影，一个模拟辐射损伤对相干SNR影响的分析函数_图像重建作为傅里叶空间滤波器–ξ(q个)–由Grant&Grigorieff（2015）描述 ). 鉴于辐射损伤具有样本依赖性，Grant和Grigorieff的分析模型将仅严格适用于轮状病毒VP6衣壳蛋白，而不适用于核酸，例如。或者，辐射损伤可以与其他模糊因素一起建模，例如，未修正的运动模糊，使用曝光相关B类-因素（Bartesaghi等。, 2018 ; Scheres，2014年 ).

为了量化使用分析模型对辐射损伤建模的准确性，ξ(q个)，我们将其与方程（15)因为当仍然存在最高分辨率信息时，由于帧内残留运动导致的模糊最初会更糟：

$[{1\over{N-1}}\sum\limits_{i=2}^N sinc（{\bf-q}\cdot{{\bf d}_i}）\xi（q）_i.\eqno（16）]$

在这里，我们将图像中观察到的内容建模为平均值N个电影帧2−N个因此，累积暴露范围为10至100 e⁻ Å⁻²图7显示了一个具有代表性的图像(一). 然后我们测量了平均信噪比_中频图7中绘制的DLP(b)无曝光滤波（实心黑线）、对图像应用曝光滤波（黑色虚线）、将曝光滤波应用于模拟分子（实心蓝线）和将曝光滤波同时应用于数据和模型（蓝色虚线）。我们发现信噪比增幅最大_中频使用50e的总曝光量⁻ Å⁻²将曝光滤光片应用于图像和模拟参考时。

图7
(一)总曝光量为～91 e的示例图像⁻ Å⁻².本分析中使用的数据集中的轮状病毒DLP，请Tim Grant博士分享。(b)作为总暴露函数的平均SNR值。实心黑线：简单平均电影帧，无曝光过滤。虚线黑线：曝光加权电影帧的图像总和。蓝色实线：用累积曝光滤镜模拟的参考，通常用于电影。蓝色虚线：图像和参考曝光均已过滤。红色方块：使用单个可达到的最大信噪比B类-表示所有信封的因子。比例尺500º。

4.讨论

我们的模拟器实现了迄今为止最彻底的正向模型，用于计算高能电子与辐射敏感生物样品之间的相互作用。此处所述的改进源于对样品中由于能量沉积而引起的变化的大致描述非弹性散射在成像过程中，结合溶剂及其运动以及辐射损伤的模型。这在模拟分子密度方面增加了准确性，为算法开发提供了更真实的图像模拟，但同样重要的是，它提供了一种通过2D模板匹配使用匹配滤波来研究复杂生物样本原子细节行为的方法。

由于匹配滤波器的输出对信号的PSD敏感，我们可以通过测量信噪比的变化来量化图像形成/损伤模型的准确性_中频我们发现，建模水包络、检测器MTF、残余帧内运动模糊和原子建模不确定性导致较高的信噪比_中频而不是通过优化单个B类-因素。这种分析受到以下事实的限制，即我们不能严格区分来自不同包络的信号变化，这些包络可以相互补偿，尽管考虑到图6所示包络的差异，这可能不是一个太严重的问题(一). 更仔细地考虑不同空间频率对信噪比的影响_中频在未来的工作中，可能会被证明有助于解决这一局限性。特别是，我们知道高空间频率信号强烈影响信噪比_中频，但尚不清楚模糊效果在这里是如何未被详细考虑的，例如轴向彗差、电子束相干性或其他高阶像差可能会影响高空间频率对信噪比的贡献_中频

我们表明，需要对溶剂的时间依赖性运动进行建模，以产生与实验图像一致的对比度。我们的显式溶剂模型虽然是粗粒度的，但使我们能够准确地再现由于非弹性损失和空间可变振幅对比度引起的衰减，并且仅基于模拟样品中的原子种类和局部质量厚度。原则上，可以通过向模拟器提供适当的原子坐标文件来模拟原子的任何配置。实际上，可变溶剂厚度、蛋白质碎片和其他结构噪声源，如六角冰区域，可以直接包含在模拟器中，但是，我们将此留到以后的工作中。

这项工作的核心思想是将最近的经验观察和测量纳入正向模型。通过考虑小角度X射线散射数据来补充分子动力学此处使用的信息。在未来，将我们的模型扩展到包括极性原子或带电原子也很重要，这将改变分子溶剂包络的特性。对带电原子进行建模也将使我们能够将盐包括在内，鉴于盐的原子序数相对较高，我们预计盐会强烈分散，并改变水分子的局部结构。然而，这种局部排序将增加另一层计算复杂性，因为它需要各向异性散射因子和运动模型。我们注意到，建模也需要这种定向建模脂类准确无误。

对带电原子建模的另一个方面可能在未来被证明是有用的，那就是对原子或残留物特定的辐射损伤建模的能力。例如，随着暴露时间的增加，低温电子显微镜重建中的酸性氨基酸侧链似乎会迅速消失（巴拉德等。, 2015 ; 巴尔泰萨吉等。, 2014). 负电荷化学基团的消失也可能部分地与负电荷原子的对比反转有关（Yonekura等。, 2018 ). 对带电原子进行建模可能需要考虑残留物的直接化学环境，这将带来相当大的计算和理论挑战。预测我们对信噪比的期望值_中频要通过增加曝光来改进，需要更全面地了解给定空间频率的物体特征对信噪比的贡献_中频以及这些功能是如何随时间退化的。

由于我们需要表示的原子数量之多，对溶剂进行建模会带来计算上的挑战，这就需要将所有溶剂分子简化为相同的伪水。即使进行了这些简化，我们也显示出在匹配SNR方面有了相当大的改进_溶剂以实验数据为基础，并期望这能提高基于模拟数据训练的模型（尤其是人工神经网络）的能力，从而更容易推广到实验数据。

除了将溶剂分子建模为相同的伪水外，我们还通过C++中的多线程处理了这种计算成本。即使如此，大部分计算都花费在计算波函数传播过程中使用的溶剂和傅里叶变换上。为了模拟更复杂的溶剂模型或倾斜样品，它们将传播大量切片，GPU实现可能对未来的工作有益。

5.结论

在这里，我们提出了一个描述信号衰减源的精确正向模型，并展示了该衰减的频谱特性建模如何提高匹配滤波器（SNR）的输出_中频用于检测低温电子显微镜图像中分子的模板匹配）。SNR（信噪比）_中频反过来与检测的质量限值直接相关；我们的正向模型的任何改进都能检测到更小的颗粒，这将扩大视觉蛋白质组学中模板匹配的能力。增加的信噪比_中频由于辐射损伤建模是令人鼓舞的，但应该更准确地建模以进行模板匹配。我们还建议我们的模型非弹性散射通过在模板生成中加入原子类型特定损失，可以通过与使用匹配滤波器的实验进行直接比较来改进。

综上所述，这些结果表明，对模板进行其他修改，使其与实验数据更好地匹配，可以进一步提高信噪比_中频; 例如，一些氨基酸侧链受到辐射损伤的影响比其他氨基酸侧链更大，例如天冬氨酸和胱氨酸的二硫键。这些细节可以在未来的工作中纳入新的原子特定损伤模型。

资金筹措信息

以下资金得到认可：霍华德·休斯医学研究所。

工具书类

Barad，B.A.，Echols，N.，Wang，R.Y.，Cheng，Y.，Dimaio，F.，Adams，P.D.&Fraser，J.S.（2015）。12, 943–946. 谷歌学者
 Bartesaghi，A.、Aguerrebere，C.、Falconeeri，V.、Banerjee，S.、Earl，L.A.、Zhu，X.、Grigorieff，N.、Milne，J.L.S.、Sapiro，G.、Wu，X.和Subramaniam，S.（2018年）。结构,26，848–856.e3科学网交叉参考中国科学院公共医学谷歌学者
 Bartesaghi，A.、Matthies，D.、Banerjee，S.、Merk，A.和Subramaniam，S.（2014年）。程序。美国国家科学院。科学。美国,111, 11709–11714. 科学网交叉参考中国科学院公共医学谷歌学者
 Baxter，W.T.、Grassucci，R.A.、Gao，H.和Frank，J.（2009）。J.结构。生物。 166, 126–132. 科学网交叉参考公共医学中国科学院谷歌学者
 Chen，J.Z.，Settembre，E.C.，Aoki，S.T.，Zhang，X.，Bellamy，A.R.，Dormitzer，P.R.，Harrison，S.C.&Grigorieff，N.（2009年）。程序。美国国家科学院。科学。美国,106, 10644–10648. 科学网交叉参考公共医学中国科学院谷歌学者
 Cowley，J.M.和Moodie，A.F.（1957）。《水晶学报》。 10, 609–619. 交叉参考 IUCr日志科学网谷歌学者
 Doyle，P.A.和Turner，P.S.（1968年）。《水晶学报》。A类24, 390–397. 交叉参考 IUCr日志科学网谷歌学者
 Du，M.&Jacobsen，C.（2018年）。超微显微镜,184, 293–309. 科学网交叉参考中国科学院公共医学谷歌学者
 Dudarev，S.L.、Peng，L.M.和Whelan，M.J.（1995）。冲浪。科学。 330, 86–100. 交叉参考中国科学院科学网谷歌学者
 Egerton，R.F.（1976年）。物理学。状态单字A,37, 663–668. 交叉参考中国科学院科学网谷歌学者
 Egerton，R.F.（2009）。代表程序。物理学。 72, 016502. 科学网交叉参考谷歌学者
 Egerton，R.F.（2011）。电子显微镜中的电子能量损失光谱。马萨诸塞州波士顿：美国施普林格谷歌学者
 埃里克森，H.P.（1973）。高级选项。电子。微型计算机。 5, 163–199. 中国科学院谷歌学者
 Erickson，H.P.P.和Klug，A.（1971年）。菲洛斯。事务处理。R.Soc.伦敦系列。B类,261, 105–118. 谷歌学者
 Ferrell，R.A.（1956年）。物理学。版次。 101, 554–563. 交叉参考中国科学院科学网谷歌学者
 Fischer，H.、Polikarpov，I.和Craievich，A.F.（2004）。蛋白质科学。 13, 2825–2828. 科学网交叉参考公共医学中国科学院谷歌学者
 Frank，J.（1969年）。Optik公司,30, 43–50. 谷歌学者
 Goodman，P.&Moodie，A.F.（1974年）。《水晶学报》。A类30, 280–290. 交叉参考 IUCr日志科学网谷歌学者
 Grant，T.和Grigorieff，N.（2015）。电子生活,4，e06980科学网交叉参考公共医学谷歌学者
 Grant，T.、Rohou，A.和Grigorieff，N.（2018年）。电子生活,7，e35383科学网交叉参考公共医学谷歌学者
 霍克斯，P.W.和卡斯珀，E.（2018）。电子光学原理：波动光学伦敦：学术出版社。谷歌学者
 Hayward，S.B.和Glaeser，R.M.（1979年）。超微显微镜,4, 201–210. 交叉参考中国科学院科学网谷歌学者
 Henderson，R.&Mcmullan，G.（2013）。62, 43–50. 谷歌学者
 Hátch，M.J.和Stobbs，W.M.（1994）。超微显微镜,53, 191–203. 交叉参考中国科学院科学网谷歌学者
 Ishizuka，K.和Uyeda，N.（1977年）。《水晶学报》。 2, 740–749. 交叉参考 IUCr日志科学网谷歌学者
 Kirkland，E.J.（2006）。申请。工程物理。1–14. 谷歌学者
 Kirkland，E.J.（2016）。《水晶学报》。A类72, 1–27. 科学网交叉参考 IUCr日志谷歌学者
 Lucas，B.A.，Himes，B.B.A.，Xue，L.，Grant，T.，Mahamid，J.&Grigorieff，N.（2021年）。电子生活,10，e68946科学网交叉参考公共医学谷歌学者
 McDonough，R.N.（1995）。噪声中信号的检测，牛津：学术出版社。谷歌学者
 McMullan，G.、Vinothkumar，K.R.和Henderson，R.（2015）。超微显微镜,158, 26–32. 科学网中国科学院公共医学谷歌学者
 Peet，M.J.、Henderson，R.和Russo，C.J.（2019）。超微显微镜,203, 125–131. 科学网交叉参考中国科学院公共医学谷歌学者
 彭立明（1999）。微米,30, 625–648. 科学网交叉参考中国科学院谷歌学者
 Peng，L.M.、Dudarev，S.L.和Whelan，M.J.（2010）。高能电子衍射和显微镜牛津大学出版社。谷歌学者
 Peng，L.-M.，Ren，G.，Dudarev，S.L.&Whelan，M.J.（1996）。《水晶学报》。A类52, 257–276. 交叉参考中国科学院科学网 IUCr日志谷歌学者
 Plante，L.&Cucinotta，F.A.（2009年）。新物理学杂志。 11, 063047. 科学网交叉参考谷歌学者
 Reimer，L.和Kohl，H.（2003）。透射电子显微镜，施普林格：纽约谷歌学者
 Reimer，L.和Ross-Messemer，M.（1989）。《微生物学杂志》。 155, 169–182. 交叉参考科学网谷歌学者
 Rickgauer，J.P.、Grigorieff，N.和Denk，W.（2017年）。电子生活,6，e25648科学网交叉参考公共医学谷歌学者
 Rullgárd，H.，Øfverstedt，L.G.，Masich，S.，Daneholt，B.&ࡷktem，O.（2011）。《微生物学杂志》。 243, 234–256. 科学网公共医学谷歌学者
 Ruskin，R.S.、Yu，Z.和Grigorieff，N.（2013年）。J.结构。生物。 184, 385–393. 科学网交叉参考中国科学院公共医学谷歌学者
 Scheres，S.H.（2014）。电子生活,三，e03665科学网交叉参考公共医学谷歌学者
 Scheres，S.H.、Nüñez-Ramírez，R.、Gómez-Llorente，Y.、San MartíN，C.、Eggermont，P.P.和Carazo，J.-M.（2007）。结构,15, 1167–1177. 科学网交叉参考公共医学中国科学院谷歌学者
 Shang，Z.和Sigworth，F.J.（2012）。J.结构。生物。 180, 10–16. 科学网交叉参考中国科学院公共医学谷歌学者
 斯莱特，J.C.（1937）。物理学。版次。 51, 840–846. 交叉参考中国科学院谷歌学者
 Van Dyck，D.（2009年）。超微显微镜,109, 677–682. 科学网交叉参考公共医学中国科学院谷歌学者
 Van Dyck，D.、Lobato，I.、Chen，F.R.和Kisielowski，C.（2015）。微米,68, 158–163. 科学网交叉参考中国科学院公共医学谷歌学者
 Vulović，M.、Ravelli，R.B.G.、van Vliet，L.J.、Koster，A.J.、Lazić，I.、Lücken，U.、Rullgård，H.、Öktem，O.和Rieger，B.（2013）。J.结构。生物。 183, 19–32. 科学网公共医学谷歌学者
 Wanner，M.、Bach，D.、Gerthsen，D.、Werner，R.和Tesche，B.（2006年）。超微显微镜,106, 341–345. 科学网交叉参考公共医学中国科学院谷歌学者
 Yonekura，K.，Braunfeld，M.B.，Maki-Yonekula，S.&Agard，D.A.（2006年）。J.结构。生物。 156, 524–536. 科学网交叉参考公共医学中国科学院谷歌学者
 Yonekura，K.、Matsuoka，R.、Yamashita，Y.、Yamane，T.、Ikeguchi，M.、Kidera，A.和Maki-Yonekula，S.（2018年）。IUCrJ大学,5, 348–353. 科学网交叉参考中国科学院公共医学 IUCr日志谷歌学者