1.简介
定量了解图像对比度是低温电子显微镜的一个重要目标,目的是准确测量样品密度,优化图像处理策略,以高分辨率重建大分子结构,并完善图像形成模型。本文中的实验解决了一个简单的问题:能否以正确的对比度模拟嵌入无定形冰中的生物大分子的图像?为了回答这个问题,我们研究了几种对比度的定义,它们的共同目标是描述“信号”从“噪声”中脱颖而出的程度,并定义了信噪比。使用这些度量的关键是定义信号和噪声的方差如何受到不同误差源的影响,包括数值误差、成像期间的样本运动、辐射损伤以及振幅对比度对原子种类的依赖性。我们首先定义噪声源。
低温EM图像中噪声的功率(方差)超过信号的功率,通常是20倍或更多。低温电子显微镜中的主要噪声源是“散粒”噪声,这是由低剂量成像条件下在给定位置和时间检测电子的随机性引起的。巴克斯特的详细分析等。(2009)证明了还需要考虑结构噪声的必要性,结构噪声定义为除最终感兴趣的物体以外的其他来源产生的任何对比:碳膜、结晶冰、辐射损伤的粒子、不需要的大分子构象物、支持的非晶冰、,等与散粒噪声不同,结构噪声受物镜像差的影响,从而产生对比度传递函数(CTF)。巴克斯特等。将结构噪声和散粒噪声建模为加性高斯白噪声,这无法捕获图像处理过程中常见的伪影和挑战,如Scheres之前所示等。(2007).
结构噪声模拟方法的改进,特别是由支撑非晶冰引起的噪声,可以在TEM模拟器(鲁尔格德等。, 2011)和InSilicoTEM公司(武洛维奇等。, 2013). 他们实现了Cowley和Moodie(1957)最初描述的多层波传播),从而产生受CTF影响的噪音。多层模拟的结果是由探测器处电子波函数的平方复数模定义的概率分布ψ探测器(x,年). 然后通过从泊松分布每个像素都是独一无二的,同时考虑了探测器的影响量子效率(DQE)。
在高分辨率低温电子显微镜中,从样品传输到图像的大部分信息都是在相位对比中捕获的,相位对比是由未散射波和代表样品弹性散射电子的波之间的干涉引起的;忽略散射波之间的高阶相互作用被称为线性成像理论。第二种对比度形式,振幅对比度,是由于电子在物镜孔径外散射而丢失,或者由于非弹性散射。后一种振幅对比度源使用能量滤波器(Yonekura等。, 2006). 与相位对比度不同,振幅对比度不能用线性成像理论来解释(埃里克森,1973)并进行了说明事后(post-hoc)通过将相移项添加到应用于模拟图像的CTF(Erickson&Klug,1971). 这种处理方法也是解决图像重建逆问题的常见方法,该逆问题旨在回答“给定观测数据的模型概率是多少”的问题。然而,在正演模拟中,“在给定特定模型的情况下,观测某些数据的概率是多少”,需要考虑振幅损失取决于原子类型和局部质量厚度这一事实。例如,弹性散射物镜光圈外的重原子(如金)比轻原子(如碳)更有可能出现。由于非弹性损耗引起的振幅对比,这种重/轻原子趋势被反转,因为轻原子的非弹性散射概率与弹性散射概率之比更高(Egerton,1976; 雷默和罗斯·梅塞默,1989年)因此,它们在能量过滤图像中比重原子产生更大的振幅损失。为了理解这对模拟图像的影响,我们首先讨论了目前在多层模拟中如何考虑振幅对比度。
对于投影近似失败的厚试样,多层形式主义是必不可少的,因为它包含了电子的多次散射和曲率等重要影响埃瓦尔德球体。越来越厚的样品对电子的透明度也越来越低,我们所知道的所有模拟器都应用了一个隐式“能量过滤器”来从最终图像中去除非弹性散射的电子。为了考虑非弹性损失,使用单个厚度参数衰减图像强度,根据
哪里我0是未衰减的图像强度λ是非弹性的平均自由程对于单次散射-电子在非弹性散射之前至少经过一次样品的平均距离。很明显,这些单一过滤器不适用于质量厚度可变的试样(例如或用于可变原子成分(例如细胞核中磷的浓度增加)。即使是含有有限原子种类子集的纯化单粒子样品,也需要模拟两种截然不同的环境:分子和溶剂。我们将把分子从溶剂中脱颖而出的程度作为“溶剂信噪比”信噪比溶剂由Yonekura量化等。(2006)其中我是平均图像强度σ溶剂是溶剂区域的标准偏差:
通常,溶剂由水的平均内电势给出的单个值建模,并在投影中添加到模拟分子的顶部。这种方法,我们称之为“连续体模型”,相当于使用移动水原子集合的无限时间平均值。连续体模型的一个缺点是无法解释分子的水合半径,该半径在颗粒内应为零,高于紧邻颗粒包络线外的体积溶剂,并随距离逐渐下降(Shang&Sigworth,2012). 忽略分子取代溶剂这一事实已被证明会产生信噪比溶剂在100e的曝光下甚至无法进行目视检查− Å−2(武洛维奇等。, 2013).
我们现在知道,连续体模型中使用的无限时间平均值不能充分描述现实;即使溶剂是冷冻的低密度无定形冰(LDA),在成像过程中也不是静止的。McMullan和Henderson量化了成像过程中LDA中水分子的运动,估计RMSD为~1 Au/e− Å−2(麦克马伦等。, 2015). 重要的是,随着时间的推移,这种运动会导致溶剂对比度模糊,这可以被视为低通滤波,等等σ溶剂随着暴露程度的增加而减少。最终结果是SNR溶剂是图像中总曝光的函数,随着溶剂变得更加模糊而逐渐增加。值得注意的是,信噪比的增加溶剂随着曝光的增加,质量损失在实验图像中进一步放大,质量损失也会减少σ溶剂并增加方程式(2)中的分子)通过减少我们的溶剂模型的更复杂版本可能会在未来的工作中实现这种质量损失。
在SNR时溶剂由于其简单性,更详细的分析需要另一个指标来量化模拟图像再现实验图像的效果。为此,我们建议使用匹配滤波器,这是互相关检测器的统计最优实现。利用低温电磁数据的图像统计特性,匹配滤波器的输出可以简单地定义为互相关系数的比值(CCC公司)的标准偏差CCC公司当只存在噪音时(σn个)(里克格尔等。, 2017)包括上述任何结构噪声源。
信噪比上限中频由输入信号功率与图像中噪声功率的比值给出(McDonough,1995). 例如,这意味着较大的分子通常具有较高的信噪比中频,而图像中的信号和模拟模板之间的任何不一致都会降低SNR中频从这个最大值。因此,可以通过使用匹配滤波器搜索图像来确定模拟分子密度与实验数据匹配的相对精度。计算方程式(3),我们使用中可用的互相关工具和相关预处理顺式TEM(授予等。, 2018; 卢卡斯等。, 2021).
连续体模型的缺点源于在成像过程中忽视样本的变化。感兴趣分子的辐射损伤和样品运动都是通过非弹性散射。对于冷冻非晶样品,非弹性散射通常归因于等离子体子,即成像电子的电场对价电子的集体激发。然而,这些是强离域或更局域的单电子激发的体等离子体子的程度尚不清楚(Egerton,2011)). 与等离子体激元的精确形式无关,它们的净效应是成像过程中系统哈密顿量的改变,因此是传统多层模拟的产物,ψ探测器(x,年)不再有效。正如最初的多层切片方法引入了将样本电势划分为薄空间切片以确保小角度近似有效一样,我们建议将模拟曝光划分为小时间切片,其中样本变化不大。虽然我们在这里指的是时间,但从显微镜的角度来看,最实际的是用e来测量曝光量− Å−2因此,模拟器中的时间步长被指定为每个电影帧的期望曝光。曝光率相关现象,如探测器开发质量工程光束相干性由曝光率参数化,曝光时间由软件根据用户提供的每帧曝光除以曝光率隐式设置。
3.结果
3.1. 分子密度的精确表示
对于孤立的中性原子,散射势定义为参数化散射因子的傅里叶变换,可以写为
哪里一我和b我是拟合系数,B类是德拜-沃勒因子,其他符号的含义与其他符号相同。这个原子势在原子坐标附近急剧达到峰值()在实际空间中,离散化时需要高采样率以保持总投影电位。这种高采样率有效地产生了方程(10)的数值积分). 为了允许更粗的采样,从而提高模拟器的计算效率,我们对方程(10)中的表达式进行了分析积分):
导致
在这里电流变液是标准误差函数,vox下标表示该值高于离散体素,并且xj个表示x,年和z(z)协调。虽然每个体素中的潜力计算成本稍高(要评估积分极限,与单个指数相比,每个体素的误差函数必须评估六次),但这远远超过了所需体素数量减少的补偿。例如,以0.5°体素间距进行模拟的计算成本比以0.1°体素倾角进行模拟的成本低125倍。虽然在z(z)-尺寸,板坯厚度是一个自由参数,它也影响计算效率。根据Kirkland(2006)的建议,通过简单测试确定最大允许厚度)搜索模拟结果依赖于板坯厚度的点。我们的模拟开始显示出对7º左右板坯厚度的依赖性(未显示数据),因此,我们通常使用5º。使用方程式(12)比计算速度更重要)在我们的模拟中,也意味着采样电势仍然具有正确的大小,并且不简单地与连续电势成正比,如下一节所述。
3.3. 散装溶剂建模
由于生物样品中水分子的绝对数量,模拟散装溶剂需要大量计算。我们选择计算水的粗粒度模型,其中每个水分子表示为单个各向同性散射中心。我们基于弹性散射我们在弹性散射氧气系数表中列出,但按总比率缩放弹性散射 横截面氧气:水,我们从实验中知道(Plante&Cucinotta,2009). 对于低密度非晶冰(~0.94 g cm),这些假分子以适当的密度随机播种−3). 然后模拟一部电影,其中每个时间步长(电影帧)由用户指定的曝光量定义,样本在该时间内保持不变。
振幅损失原因非弹性散射通过复散射势(通常定义为与实际(弹性)势成线性比例)并入多层形式,例如InSilicoTEM公司Dudarev及其同事(Peng)对为什么这个比例模型不合适进行了详细分析等。, 1996). 我们不是使用线性比例模型,而是根据理论部分中定义的等离子体散射因子,从重标体积溶剂弹性势导出复散射势,以获得功率谱密度(PSD)。
参考图3,我们观察到非弹性散射引起的衰减的预期函数形式。
| 图3 粗颗粒全原子溶剂模型与我们导出的等离子体的非弹性散射因子相结合,通过不需要缩放的复势产生振幅损失事后(post-hoc)斜率是非弹性(单次散射)的读数平均自由程在我们的模拟溶剂中。 |
4.讨论
我们的模拟器实现了迄今为止最彻底的正向模型,用于计算高能电子与辐射敏感生物样品之间的相互作用。此处所述的改进源于对样品中由于能量沉积而引起的变化的大致描述非弹性散射在成像过程中,结合溶剂及其运动以及辐射损伤的模型。这在模拟分子密度方面增加了准确性,为算法开发提供了更真实的图像模拟,但同样重要的是,它提供了一种通过2D模板匹配使用匹配滤波来研究复杂生物样本原子细节行为的方法。
由于匹配滤波器的输出对信号的PSD敏感,我们可以通过测量信噪比的变化来量化图像形成/损伤模型的准确性中频我们发现,建模水包络、检测器MTF、残余帧内运动模糊和原子建模不确定性导致较高的信噪比中频而不是通过优化单个B类-因素。这种分析受到以下事实的限制,即我们不能严格区分来自不同包络的信号变化,这些包络可以相互补偿,尽管考虑到图6所示包络的差异,这可能不是一个太严重的问题(一). 更仔细地考虑不同空间频率对信噪比的影响中频在未来的工作中,可能会被证明有助于解决这一局限性。特别是,我们知道高空间频率信号强烈影响信噪比中频,但尚不清楚模糊效果在这里是如何未被详细考虑的,例如轴向彗差、电子束相干性或其他高阶像差可能会影响高空间频率对信噪比的贡献中频
我们表明,需要对溶剂的时间依赖性运动进行建模,以产生与实验图像一致的对比度。我们的显式溶剂模型虽然是粗粒度的,但使我们能够准确地再现由于非弹性损失和空间可变振幅对比度引起的衰减,并且仅基于模拟样品中的原子种类和局部质量厚度。原则上,可以通过向模拟器提供适当的原子坐标文件来模拟原子的任何配置。实际上,可变溶剂厚度、蛋白质碎片和其他结构噪声源,如六角冰区域,可以直接包含在模拟器中,但是,我们将此留到以后的工作中。
这项工作的核心思想是将最近的经验观察和测量纳入正向模型。通过考虑小角度X射线散射数据来补充分子动力学此处使用的信息。在未来,将我们的模型扩展到包括极性原子或带电原子也很重要,这将改变分子溶剂包络的特性。对带电原子进行建模也将使我们能够将盐包括在内,鉴于盐的原子序数相对较高,我们预计盐会强烈分散,并改变水分子的局部结构。然而,这种局部排序将增加另一层计算复杂性,因为它需要各向异性散射因子和运动模型。我们注意到,建模也需要这种定向建模脂类准确无误。
对带电原子建模的另一个方面可能在未来被证明是有用的,那就是对原子或残留物特定的辐射损伤建模的能力。例如,随着暴露时间的增加,低温电子显微镜重建中的酸性氨基酸侧链似乎会迅速消失(巴拉德等。, 2015; 巴尔泰萨吉等。, 2014). 负电荷化学基团的消失也可能部分地与负电荷原子的对比反转有关(Yonekura等。, 2018). 对带电原子进行建模可能需要考虑残留物的直接化学环境,这将带来相当大的计算和理论挑战。预测我们对信噪比的期望值中频要通过增加曝光来改进,需要更全面地了解给定空间频率的物体特征对信噪比的贡献中频以及这些功能是如何随时间退化的。
由于我们需要表示的原子数量之多,对溶剂进行建模会带来计算上的挑战,这就需要将所有溶剂分子简化为相同的伪水。即使进行了这些简化,我们也显示出在匹配SNR方面有了相当大的改进溶剂以实验数据为基础,并期望这能提高基于模拟数据训练的模型(尤其是人工神经网络)的能力,从而更容易推广到实验数据。
除了将溶剂分子建模为相同的伪水外,我们还通过C++中的多线程处理了这种计算成本。即使如此,大部分计算都花费在计算波函数传播过程中使用的溶剂和傅里叶变换上。为了模拟更复杂的溶剂模型或倾斜样品,它们将传播大量切片,GPU实现可能对未来的工作有益。
5.结论
在这里,我们提出了一个描述信号衰减源的精确正向模型,并展示了该衰减的频谱特性建模如何提高匹配滤波器(SNR)的输出中频用于检测低温电子显微镜图像中分子的模板匹配)。SNR(信噪比)中频反过来与检测的质量限值直接相关;我们的正向模型的任何改进都能检测到更小的颗粒,这将扩大视觉蛋白质组学中模板匹配的能力。增加的信噪比中频由于辐射损伤建模是令人鼓舞的,但应该更准确地建模以进行模板匹配。我们还建议我们的模型非弹性散射通过在模板生成中加入原子类型特定损失,可以通过与使用匹配滤波器的实验进行直接比较来改进。
综上所述,这些结果表明,对模板进行其他修改,使其与实验数据更好地匹配,可以进一步提高信噪比中频; 例如,一些氨基酸侧链受到辐射损伤的影响比其他氨基酸侧链更大,例如天冬氨酸和胱氨酸的二硫键。这些细节可以在未来的工作中纳入新的原子特定损伤模型。
资金筹措信息
以下资金得到认可:霍华德·休斯医学研究所。
工具书类
Barad,B.A.,Echols,N.,Wang,R.Y.,Cheng,Y.,Dimaio,F.,Adams,P.D.&Fraser,J.S.(2015)。12, 943–946. 谷歌学者
Bartesaghi,A.、Aguerrebere,C.、Falconeeri,V.、Banerjee,S.、Earl,L.A.、Zhu,X.、Grigorieff,N.、Milne,J.L.S.、Sapiro,G.、Wu,X.和Subramaniam,S.(2018年)。结构,26,848–856.e3科学网 交叉参考 中国科学院 公共医学 谷歌学者
Bartesaghi,A.、Matthies,D.、Banerjee,S.、Merk,A.和Subramaniam,S.(2014年)。程序。美国国家科学院。科学。美国,111, 11709–11714. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Baxter,W.T.、Grassucci,R.A.、Gao,H.和Frank,J.(2009)。J.结构。生物。 166, 126–132. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Chen,J.Z.,Settembre,E.C.,Aoki,S.T.,Zhang,X.,Bellamy,A.R.,Dormitzer,P.R.,Harrison,S.C.&Grigorieff,N.(2009年)。程序。美国国家科学院。科学。美国,106, 10644–10648. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Cowley,J.M.和Moodie,A.F.(1957)。《水晶学报》。 10, 609–619. 交叉参考 IUCr日志 科学网 谷歌学者
Doyle,P.A.和Turner,P.S.(1968年)。《水晶学报》。A类24, 390–397. 交叉参考 IUCr日志 科学网 谷歌学者
Du,M.&Jacobsen,C.(2018年)。超微显微镜,184, 293–309. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Dudarev,S.L.、Peng,L.M.和Whelan,M.J.(1995)。冲浪。科学。 330, 86–100. 交叉参考 中国科学院 科学网 谷歌学者
Egerton,R.F.(1976年)。物理学。状态单字A,37, 663–668. 交叉参考 中国科学院 科学网 谷歌学者
Egerton,R.F.(2009)。代表程序。物理学。 72, 016502. 科学网 交叉参考 谷歌学者
Egerton,R.F.(2011)。电子显微镜中的电子能量损失光谱。马萨诸塞州波士顿:美国施普林格谷歌学者
埃里克森,H.P.(1973)。高级选项。电子。微型计算机。 5, 163–199. 中国科学院 谷歌学者
Erickson,H.P.P.和Klug,A.(1971年)。菲洛斯。事务处理。R.Soc.伦敦系列。B类,261, 105–118. 谷歌学者
Ferrell,R.A.(1956年)。物理学。版次。 101, 554–563. 交叉参考 中国科学院 科学网 谷歌学者
Fischer,H.、Polikarpov,I.和Craievich,A.F.(2004)。蛋白质科学。 13, 2825–2828. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Frank,J.(1969年)。Optik公司,30, 43–50. 谷歌学者
Goodman,P.&Moodie,A.F.(1974年)。《水晶学报》。A类30, 280–290. 交叉参考 IUCr日志 科学网 谷歌学者
Grant,T.和Grigorieff,N.(2015)。电子生活,4,e06980科学网 交叉参考 公共医学 谷歌学者
Grant,T.、Rohou,A.和Grigorieff,N.(2018年)。电子生活,7,e35383科学网 交叉参考 公共医学 谷歌学者
霍克斯,P.W.和卡斯珀,E.(2018)。电子光学原理:波动光学伦敦:学术出版社。 谷歌学者
Hayward,S.B.和Glaeser,R.M.(1979年)。超微显微镜,4, 201–210. 交叉参考 中国科学院 科学网 谷歌学者
Henderson,R.&Mcmullan,G.(2013)。62, 43–50. 谷歌学者
Hátch,M.J.和Stobbs,W.M.(1994)。超微显微镜,53, 191–203. 交叉参考 中国科学院 科学网 谷歌学者
Ishizuka,K.和Uyeda,N.(1977年)。《水晶学报》。 2, 740–749. 交叉参考 IUCr日志 科学网 谷歌学者
Kirkland,E.J.(2006)。申请。工程物理。1–14. 谷歌学者
Kirkland,E.J.(2016)。《水晶学报》。A类72, 1–27. 科学网 交叉参考 IUCr日志 谷歌学者
Lucas,B.A.,Himes,B.B.A.,Xue,L.,Grant,T.,Mahamid,J.&Grigorieff,N.(2021年)。电子生活,10,e68946科学网 交叉参考 公共医学 谷歌学者
McDonough,R.N.(1995)。噪声中信号的检测,牛津:学术出版社。 谷歌学者
McMullan,G.、Vinothkumar,K.R.和Henderson,R.(2015)。超微显微镜,158, 26–32. 科学网 中国科学院 公共医学 谷歌学者
Peet,M.J.、Henderson,R.和Russo,C.J.(2019)。超微显微镜,203, 125–131. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
彭立明(1999)。微米,30, 625–648. 科学网 交叉参考 中国科学院 谷歌学者
Peng,L.M.、Dudarev,S.L.和Whelan,M.J.(2010)。高能电子衍射和显微镜牛津大学出版社。 谷歌学者
Peng,L.-M.,Ren,G.,Dudarev,S.L.&Whelan,M.J.(1996)。《水晶学报》。A类52, 257–276. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
Plante,L.&Cucinotta,F.A.(2009年)。新物理学杂志。 11, 063047. 科学网 交叉参考 谷歌学者
Reimer,L.和Kohl,H.(2003)。透射电子显微镜,施普林格:纽约谷歌学者
Reimer,L.和Ross-Messemer,M.(1989)。《微生物学杂志》。 155, 169–182. 交叉参考 科学网 谷歌学者
Rickgauer,J.P.、Grigorieff,N.和Denk,W.(2017年)。电子生活,6,e25648科学网 交叉参考 公共医学 谷歌学者
Rullgárd,H.,Øfverstedt,L.G.,Masich,S.,Daneholt,B.&ࡷktem,O.(2011)。《微生物学杂志》。 243, 234–256. 科学网 公共医学 谷歌学者
Ruskin,R.S.、Yu,Z.和Grigorieff,N.(2013年)。J.结构。生物。 184, 385–393. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Scheres,S.H.(2014)。电子生活,三,e03665科学网 交叉参考 公共医学 谷歌学者
Scheres,S.H.、Nüñez-Ramírez,R.、Gómez-Llorente,Y.、San MartíN,C.、Eggermont,P.P.和Carazo,J.-M.(2007)。结构,15, 1167–1177. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Shang,Z.和Sigworth,F.J.(2012)。J.结构。生物。 180, 10–16. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
斯莱特,J.C.(1937)。物理学。版次。 51, 840–846. 交叉参考 中国科学院 谷歌学者
Van Dyck,D.(2009年)。超微显微镜,109, 677–682. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Van Dyck,D.、Lobato,I.、Chen,F.R.和Kisielowski,C.(2015)。微米,68, 158–163. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Vulović,M.、Ravelli,R.B.G.、van Vliet,L.J.、Koster,A.J.、Lazić,I.、Lücken,U.、Rullgård,H.、Öktem,O.和Rieger,B.(2013)。J.结构。生物。 183, 19–32. 科学网 公共医学 谷歌学者
Wanner,M.、Bach,D.、Gerthsen,D.、Werner,R.和Tesche,B.(2006年)。超微显微镜,106, 341–345. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Yonekura,K.,Braunfeld,M.B.,Maki-Yonekula,S.&Agard,D.A.(2006年)。J.结构。生物。 156, 524–536. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Yonekura,K.、Matsuoka,R.、Yamashita,Y.、Yamane,T.、Ikeguchi,M.、Kidera,A.和Maki-Yonekula,S.(2018年)。IUCrJ大学,5, 348–353. 科学网 交叉参考 中国科学院 公共医学 IUCr日志 谷歌学者
国际标准编号:2052-2525
打开访问