研究交流\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标结构生物学
通信
国际标准编号:2053-230X

制作糖蛋白类有点甜PDB-重做

十字标记_颜色_方形_文本.svg

荷兰癌症研究所生物化学部,Plesmanlaan 121,1066 CX阿姆斯特丹,荷兰b条德国吉森法兰克福大街100号朱斯塔斯·利比格大学吉森兽医生理和生物化学研究所,邮编:35392
*通信电子邮件:r.joosten@nki.nl

由M.J.van Raaij编辑,西班牙国家生物技术中心(2018年1月31日收到; 2018年3月7日接受; 在线2018年7月26日)

糖基化是蛋白质翻译后修饰的最常见形式之一,也是最复杂的形式。处理糖蛋白类在结构模型构建中,精细化,由于实验数据和可用软件工具的限制,验证和PDB沉积比处理非糖基化蛋白质更容易出错。此外,实验人员在处理碳水化合物残留物方面的经验通常不如处理氨基酸残留物。重记和重定义的结果PDB-重做分析了来自蛋白质数据库的8114个糖蛋白结构模型。3620个重符号及其后续符号的积极方面精细化,讨论了获得一致高质量碳水化合物模型的剩余挑战。

1.简介

结构生物学为我们提供了对生命分子机制的洞察力(Brändén&Tooze,1998)【Brändén,C.-I.&Tooze,J.(1998),《蛋白质结构导论》,纽约:Garland出版社。】). 这些机制大多是从蛋白质的角度来看的,因为它们具有许多作用,例如化学转换器、结构构建块和信号处理器,但蛋白质并不是单独起作用的。他们之间的互动核酸,小分子、离子甚至水分子构成了非常复杂的系统和相互作用网络的基础。对这些系统和网络进行管理,以应对功能要求的变化,例如在任何特定时间由于环境因素的变化。蛋白质共价结构的改变,翻译后修改可能是最广为人知的监管形式。

糖基化不仅是蛋白质共翻译和翻译后修饰的最常见形式之一,也是最复杂的形式之一。聚糖链参与蛋白质折叠通过钙联蛋白/钙网蛋白循环(Caramelo&Parodi,2008[Carmelo,J.J.和Parodi,A.J.(2008)。生物化学杂志28310221-10225.]),作为分子标记,影响蛋白质稳定性并影响蛋白质的功能(Varki,2017[Varki,A.(2017),《糖生物学》,27,3-49。]). 虽然N-聚糖的核心结构高度保守,但在N-聚糖核心外和O-聚糖中都可以发现各种不同的结构(Varki,2017[Varki,A.(2017),《糖生物学》,27,3-49。]). 这种类型的聚糖允许对蛋白质功能进行微调(Varki,2017[Varki,A.(2017),《糖生物学》,27,3-49。]; 大津博等。, 2011【Ohtsubo,K.,Chen,M.Z.,Olefsky,J.M.&Marth,J.D.(2011),《自然医学》第17期,第1067-1075页。】; 2013年,尼格罗维奇【Nigrovic,P.A.(2013)。大黄关节炎。65,2541-2544。】).葡聚糖在细胞信号传递和贩运中发挥重要作用(Furukawa等。, 2012【Furukawa,K.、Ohkawa、Y.、Yamauchi,Y.、Hamamura,K.和Ohmi,Y.(2012),《生物化学杂志》151、573-578。】; 基尔马耶等。, 2016【Kiermaier,E.等人(2016),《科学》,第351期,第186-190页。】)以及感染、炎症和免疫反应(瓦尔基,2017年[Varki,A.(2017),《糖生物学》,27,3-49。]; Schnaar,2015年【Schnaar,R.L.(2015),《过敏临床免疫杂志》,135,609-615。】; 弗拉巴特等。, 2018[Frabutt,D.A.,Wang,B.,Riaz,S.,Schwartz,R.C.&Zheng,Y.-H.(2018),J.Virol.92,e01690-17.]; Tytgat&Vos,2016年【Tytgat,H.L.P.&de Vos,W.M.(2016),《微生物趋势》,第24期,第853-861页。】),其中聚糖被糖结合蛋白特异识别凝集素,或者通过抗体。在所有这些事件中,聚糖链的微小差异,例如单个C原子的不同立体化学或不同的连接位置,都会对生物功能产生重大影响。例如,流感病毒血凝素的碳水化合物再认识域对末端唾液酸残基和邻近半乳糖之间的特定联系具有特异性:禽流感病毒血凝素主要与(2–3)连接的唾液酸结合,而来自人类流感病毒的血凝素最好能识别(2–6)连接的唾液酸(史蒂文斯等。, 2006[Stevens,J.,Blixt,O.,Paulson,J.C.&Wilson,I.A.(2006),《微生物自然评论》,第4期,第857-864页。]; 等。, 2015【Yang,H.,Nguyen,H.T.,Carney,P.J.,Guo,Z.,Chang,J.C.,Jones,J.,Davis,C.T.,Villanueva,J.M.,Gubareva,L.V.&Stevens,J.(2015),J.Virol.89,2801-2812.】).

的三维结构糖蛋白类和蛋白质数据库(PDB;Bernstein)中的蛋白质-碳水化合物复合物等。, 1977[Bernstein,F.C.,Koetzle,T.F.,Williams,G.J.,Meyer,E.F.,Brice,M.D.,Rodgers,J.R.,Kennard,O.,Shimanouchi,T.&Tasumi,M.(1977),《分子生物学杂志》,第112期,第535-542页。])是了解糖基化对蛋白质影响的宝贵资源。此外,它们还提供了识别聚糖通过蛋白质。然而,不幸的是,这些结构的聚糖部分通常具有许多缺陷,从轻微的不规则到严重的错误(Lütteke等。, 2004【Lütteke,T.、Frank,M.和von der Lieth,C.-W.(2004)。碳水化合物研究339,1015-1020。】; 克里斯宾等。, 2007[Crispin,M.,Stuart,D.I.和Jones,E.Y.(2007),《自然结构分子生物学》14354。]; 戴维斯·阿吉雷等。, 2015【Agire,J.、Davies,G.、Wilson,K.和Cowtan,K.(2015),《自然化学生物学》11,303。】). 这个问题有多个原因:糖蛋白类(2.4º)略低于PDB条目的一般值(2.0º);大多数结构生物学软件工具都是以蛋白质为中心的,不处理碳水化合物以及它们处理蛋白质;大多数晶体学家在处理这些问题上缺乏良好的训练碳水化合物;蛋白质上的糖基化位点可能不是解决结构的研究问题的一部分(也就是说,在这些方面花费的精力很少);验证碳水化合物不是标准结构阐明过程的一部分;以及wwPDB的沉积和注释过程(Young等。, 2017[Young,J.Y.等人(2017),《结构》,第25期,第536-545页。])不专注于碳水化合物。鉴于有关各方可用的资源有限,所有这些因素都是可以理解的,但仍有提高质量的动力碳水化合物在可用的结构模型中(读取等。, 2011[Read,R.J.等人(2011),《结构》,第19期,第1395-1412页。]).

这个PDB-重做“建设性验证”管道(Joosten等。, 2012【Joosten,R.P.,Jooston,K.,Murshudov,G.N.&Perrakis,A.(2012),《水晶学报》D68,484-496。】)晶体结构模型的改进可以为晶体学和其他结构生物学家提高糖蛋白结构模型的质量提供服务,PDB-重做是以蛋白质为中心的。然而,它确实有一组可以改进的功能碳水化合物基于pdb护理(Lütteke&von der Lieth,2004年)[Lütteke,T.&von der Lieth,C.-W.(2004)。BMC生物信息学,5,69。]; Joosten&Lütteke,2017年【Joosten,R.P.&Lütteke,T.(2017年),《当代手术结构生物学》第44期,第9-17页。】). 因为PDB-重做管道是完全自动化的,它对模型的处理是一致的。然而,这只在管道的一个版本中是完全正确的。多年来,PDB-REDO数据库(Joosten等。, 2009【Joosten,R.P.等人(2009),《应用结晶杂志》第42期,第376-384页。】)已经开发了相当多的软件版本,这使得很难可靠地分析PDB-重做关于碳水化合物。我们最近完全替换了PDB-REDO数据库,将所有内容都转换为单一版本(van Beusekom等。, 2018【Beusekom,B.van,Touw,W.G.,Tatineni,M.,Somani,S.,Rajagopal,G.,Luo,J.,Gilliland,G.L.,Perrakis,A.&Joosten,R.P.(2018),蛋白质科学27,798-808.】). 在这里,我们借此机会了解PDB-REDO在碳水化合物结构模型质量的各个方面所处的地位,以及PDB-REDO项目的未来体现中还有哪些可以改进的地方。

2.方法

2.1. 数据集选择

我们分析了最近更新的PDB-REDO数据库(van Beusekom)中的所有条目等。, 2018【Beusekom,B.van,Touw,W.G.,Tatineni,M.,Somani,S.,Rajagopal,G.,Luo,J.,Gilliland,G.L.,Perrakis,A.&Joosten,R.P.(2018),蛋白质科学27,798-808.】)其中任何单糖 β-D类-GlcpNAc、,α-D类-GlcpNAc、,α-D类-男人第页β-D类-男人第页β-D类-Glc公司第页α-D类-Glc公司第页β-D类-镓第页α-D类-加仑第页α-L(左)-操第页β-L(左)-操第页存在并作为单独的残基进行注释。例如,只有当麦芽糖被标注为两个共价结合的葡萄糖残基而不是单个麦芽糖残基时,才能对其进行分析。为了强调这一区别,我们将参考单糖通过PDB化学成分词典(Westbrook等。, 2015【Westbrook,J.D.,Shao,C.,Feng,Z.,Zuravleva,M.,Velankar,S.&Young,J.(2015).生物信息学,311274-1278.】)残留物名称:分别为NAG、NDG、MAN、BMA、BGC、GLC、GAL、GLA、FUC和FUL。本研究的数据集包括8114个PDB-REDO条目(共111 130个条目)及其对应的PDB条目。

2.2。碳水化合物注释的变化

这个PDB-重做程序汽提塔(乔斯顿等。, 2012【Joosten,R.P.,Jooston,K.,Murshudov,G.N.&Perrakis,A.(2012),《水晶学报》D68,484-496。】)更改的批注碳水化合物在PDB格式结构模型中简化约束生成精炼在里面REFMAC公司(穆尔舒多夫等。, 2011【Murshudov,G.N.,Skubák,P.,Lebedev,A.A.,Pannu,N.S.,Steiner,R.A.,Nicholls,R.A..,Winn,M.D.,Long,F.&Vagin,A.A..(2011),《晶体学报》,D67,355-367。】). 此重新注释基于pdb护理(Lütteke&von der Lieth,2004)[Lütteke,T.&von der Lieth,C.-W.(2004)。BMC生物信息学,5,69。])之前已经描述过(Joosten&Lütteke,2017【Joosten,R.P.&Lütteke,T.(2017年),《当代手术结构生物学》第44期,第9-17页。】). 简而言之碳水化合物可以包括残留物重命名、删除多余建模的剩余原子(残基的O1原子),移除和添加描述残基间共价键的LINK记录,将糖苷键标准化以将O1描述为离开原子,并明确注释预期的键类型[例如β(1–4)在N-连接聚糖中的两个NAG残基之间]。对于选定的数据集,将最终的PDB-REDO模型与等效的PDB条目进行比较,以找到所有注释更改。

2.3. 模型质量分析

质量碳水化合物使用多种工具分析了in-structure模型。我们使用EDSTATS公司(Tickle,2012年【Tickle,I.J.(2012),《水晶学报》,D68,454-467。】),用Privater公司(阿吉雷、伊格莱西亚斯·费尔南德斯等。, 2015【Agire,J.、Iglesias-Fernández,J.,Rovira,C.、Davies,G.J.、Wilson,K.S.和Cowtan,K.D.(2015)。《自然结构分子生物学》22,833-834。】),计算了Evans(2007)描述的异聚中心原子C1的手性体积【Evans,P.R.(2007),《水晶学报》,D63,58-61。】)并用更新版本的挑剔(吕泰克等。, 2005【Lütteke,T.、Frank,M.和von der Lieth,C.-W.(2005)。核酸研究33,D242-D246。】). 这个新的实现挑剔表示链接特定的扭角集(φψ)作为GlycoMapsDB中扭转角高质量分布的基于知识的潜力(Frank等。, 2007【Frank,M.,Lütteke,T.&von der Lieth,C.-W.(2007),《核酸研究》35,287-290。】). 为了一致性,最终的PDB-REDO模型和重新标记后但在任何之前的模型精细化,进行了比较。也就是说,在PDB-重做用于针对特定于残差或特定于链接的几何参数进行验证。

2.4. 碳水化合物氢键和同源性

我们最近表明,在精炼可以帮助改进中低分辨率的蛋白质结构模型(van Beusekom等。, 2018【Beusekom,B.van,Touw,W.G.,Tatineni,M.,Somani,S.,Rajagopal,G.,Luo,J.,Gilliland,G.L.,Perrakis,A.&Joosten,R.P.(2018),蛋白质科学27,798-808.】).碳水化合物有大量的氢键供体和受体,但碳水化合物结构的相对质量较差。在这里,我们研究在糖蛋白类为碳水化合物创造氢键约束。

程序斯威西是为了分析涉及碳水化合物残基的氢键并找到它们的同源物。该程序基于HODER(发动机罩)(范博塞科姆等。, 2018【Beusekom,B.van,Touw,W.G.,Tatineni,M.,Somani,S.,Rajagopal,G.,Luo,J.,Gilliland,G.L.,Perrakis,A.&Joosten,R.P.(2018),蛋白质科学27,798-808.】)带有专门用于碳水化合物。读取输入PDB文件后,在CCP4单体库(Vagin等。, 2004【Vagin,A.A.,Steiner,R.A.,Lebedev,A.A,Potterton,L.,McNicholas,S.,Long,F.&Murshudov,G.N.(2004),《结晶学报》,D60,2184-2195。】). 对存在的碳水化合物残基的约束文件进行解析,以确定原子及其键序。根据这些,可以确定哪些原子是氢键供体和/或受体。二者之间的氢键碳水化合物蛋白质和碳水化合物之间的检测基于我们之前使用的相同几何标准(van Beusekom等。, 2018【Beusekom,B.van,Touw,W.G.,Tatineni,M.,Somani,S.,Rajagopal,G.,Luo,J.,Gilliland,G.L.,Perrakis,A.&Joosten,R.P.(2018),蛋白质科学27,798-808.】). 在当前的实现中,同源蛋白质-碳水化合物氢键仅被识别为N-连接糖基化树,因为它们可以可靠地匹配。识别形成蛋白质-碳水化合物氢键的蛋白质残基,然后识别同源物中的等效残基。此外,与糖基化树芽所来自的天冬酰胺同源的残基。从这个残基中,通过寻找糖基化树中相同相对位置的碳水化合物部分,可以找到同源的碳水化合物残基。应该注意的是,给定的碳水化合物残留类型被故意忽略,因为这些数据并不完全可靠。

评估一般氢键约束是否适用于碳水化合物是一个可行的选择,我们分析了糖蛋白类在我们的数据集中。此外,我们在同源结构中寻找守恒氢键,基于此可以生成基于同源的氢键约束。

3.结果和讨论

3.1. 批注更改

数据集中的结构模型都由PDB-重做v.7.00或更高,这意味着他们都被检查是否存在涉及碳水化合物的可解决注释错误。在考虑的66 137个碳水化合物残基中,1732个被重新命名(表1[链接]). 这是对需要重命名的总残数或残基的保守估计,因为只有残基的身份可以根据先前的知识可靠地分配的情况下(例如,与N-连接聚糖的核心残基的情况一样)才会自动处理。特别是,大部分NDG和FUL残基(分别为63%和77%)被重新命名,因为它们经常被错误地添加到N-连接聚糖在应该添加NAG和FUC残基的位置。其他情况下,特定碳水化合物残留物的模型坐标与残留物类型冲突,但没有关于预期类型的事先知识,也可以通过以下方法检测到pdb护理。但是,建议的残留物重新命名操作不适用于汽提塔因为这些与较高的假阳性率有关,这使得它们不适合在以下情况下进行完全无监督的重记PDB-重做

表1
碳水化合物更名事件

残留物名称 重命名事件数
PDB公司 PDB-重做 计数 百分比
NDG公司 抱怨 552 63
曼恩 BMA公司 553 6.6
BMA公司 曼恩 303 6.9
FUL公司 FUC公司 287 77
其他 其他 37 ND(无损检测)

除了残留物重命名之外,还有许多涉及LINK记录的注释修改:286个LINK被删除,885个被添加,717个被替换。当N键聚糖的第一个NAG残基与O键连接时,会发生特殊情况δ天冬酰胺侧链的原子。幸运的是,这些案例非常罕见(总共21例;有关最近的示例,请参见图1[链接]). 通过将天冬酰胺侧链翻转180°并修改LINK记录以结合N的NAG残基对其进行处理δ原子。

[图1]
图1
漆酶McoG(PDB条目)结构中N-糖基化的错误建模示例5升8; 费拉罗尼等。, 2017[Ferraroni,M.,Westphal,A.H.,Borsari,M..,Tamayo-Ramos,J.A.,Briganti,F.,de Graaff,L.H.&van Berkel,W.J.H.(2017).生物催化,3,1-21。]). 第一个NAG残留物附着在O上δAsn103的原子(PDB命名法中的OD1),而不是Nδ原子。净电子密度(2毫发o个 − DF公司c(c)1.2时σ; 为了清楚起见,将其夹在残基周围),并且Asn60上相邻的N-糖基化反应是正确的,这表明这是一个简单的疏忽。此类错误将在中自动更正PDB-重做通过交换O的名称δ和Nδ原子并相应地更新链接描述。此图是使用生成的中央对手方清算所4毫克(麦克尼古拉斯等。, 2011[McNicholas,S.,Potterton,E.,Wilson,K.S.&Noble,M.E.M.(2011),《结晶学报》D67,386-394.]).

在单个结构模型中需要多个重标记事件并不罕见。小麦胚芽凝集素与糖蛋白a的糖化肽复合物的结构中发现了一个例子(Wright&Jaeger,1993)【Wright,C.S.&Jaeger,J.(1993),《分子生物学杂志》,第232期,第620-638页。】),需要三种类型的重新标记:LINK标准化、LINK添加和剩余重命名(图2[链接]). 在这个结构模型中,糖基化肽链的原子坐标D类质量很高,但如果不重新命名,该模型将在精炼由于不正确的约束。

[图2]
图2
糖蛋白A(链)的唾液酸糖肽D类PDB条目的2立方厘米; 赖特和杰格,1993年【Wright,C.S.&Jaeger,J.(1993),《分子生物学杂志》,第232期,第620-638页。】)需要多次重标记事件:添加了一个LINK记录以将苏氨酸侧链连接到中心碳水化合物残基,中心残基NDG被重命名为A2G(α-D类-加仑第页NAc)和GAL和A2G之间的LINK记录被重写,以正确描述离开的原子O1。虚线表示PDB条目中已存在但未显示的糖苷链接中央对手方清算所4毫克

当前重符号位于PDB-重做在中发现不足晶体结构dectin-2与人复合物的碳水化合物再认识域9甘氨酸核糖核酸2低聚糖(范伯格等。, 2017【Feinberg,H.,Jégouzo,S.A.F.,Rex,M.J.,Drickamer,K.,Weis,W.I.&Taylor,M.E.(2017),《生物化学杂志》29213402-13414。】). 在这个晶体结构低聚糖处于晶体的特殊位置,这意味着它在电子密度上与自身的对称相关拷贝重叠。这在存放模型(PDB条目)中正确建模5磅)但PDB的注释包括连接糖的互斥对称副本的LINK记录。这导致了pdb护理错误解释模型,导致汽提塔去除错误的原子;这反过来又导致了REFMAC公司生成非常不正确的约束,从而显著扭曲模型。删除有问题的LINK记录后PDB-重做管道按预期工作。已向PDB注释器发送错误报告,以确保永久删除不正确的LINK记录。

3.2. 模型质量指标

3.2.1. 密度匹配

模型分析的结果EDSTATS公司Privater公司总结见表2[链接]此外,还对高分辨率病例子集(<1.8°)进行了单独分析。我们观察到,与电子密度的拟合度有了整体改善:中值实空间相关系数(RSCC;Brändén&Jones,1990年【Brändén,C.-I.&Jones,T.A.(1990),《自然》(伦敦),343687-689。】)从PDB中的0.84增加到PDB-REDO中的0.87。在高分辨率子集中发现了类似的改进RSCC公司从0.91增加到0.93。以下方面的改进RSCC公司可能主要是由PDB-REDO模型的总体改进引起的(Joosten等。, 2012【Joosten,R.P.,Jooston,K.,Murshudov,G.N.&Perrakis,A.(2012),《水晶学报》D68,484-496。】).

表2
PDB和PDB-REDO数据库中碳水化合物残留的质量

只使用了最常见的碳水化合物残留数据(NAG、NDG、MAN、BMA、BGC、GLC、GAL、GLA、FUC和FUL)。

  中值的θ(°) RSCC中位数§ 验证状态(好/检查/坏)
PDB,<1.8º 6.7 (174.9) 0.91 8937/590/239
PDB-REDO,<1.8º 6.4 (175.3) 0.93 9083/543/137
PDB,全部 7.9 (172.7) 0.84 50931/7627/2512
PDB-REDO,全部 9.2 (173.3) 0.87 49052/9784/2213年
†根据报告Privater公司
括号中给出了FUC和FUL的值。
§报告人EDSTATS公司
3.2.2. 碳水化合物环构象

这个θ描述碳水化合物环构象的角度(Cremer&Pople,1975【Cremer,D.&Pople,J.A.(1975),《美国化学学会杂志》第97期,第1354-1358页。】)应接近0°D类-吡喃糖和接近180°的L(左)-如果残基是最有利的椅子构象,则本研究考虑吡喃糖。的确,对于高分辨率碳水化合物我们发现PDB和PDB-REDO中的角度都在6.5和175°左右,PDB-REDO中的标称变化较小(表2[链接]). 在大多数情况下,高分辨率的碳水化合物环的质量是好的。主要区别在于,在PDB-REDO中,三层验证状态由Privater公司(good/check/bad)很少出现“bad”:只有137例PDB中239例。在PDB-REDO 9083中,残留物被认为是良好的PDB中有8937个残留物。

如果同时考虑中低分辨率模型,我们发现中位数θPDB中的角度总体较差:7.9和173°。在PDB-REDO中,中值θ角度恶化D类-日射强度中位数为9.2°,但L(左)-吡喃糖略有改善,为0.6°。观察结果表明θ由于低分辨率案例的贡献,角度与目标的偏差更大:这清楚地表明碳水化合物结构质量随着分辨率的降低而降低。然而,PDB-REDO中的这种效应比PDB中的强得多(图3[链接]).

[图3]
图3
的分布θPDB和PDB-REDO中的角度。数据显示为方框和胡须图,胡须延伸至四分位范围的1.5倍。在PDB中θ描述碳水化合物环构象的角度逐渐增加,而在PDB-REDO中,这种影响被放大。

最可能的原因是PDB-重做处理几何约束权重和几何约束的方式碳水化合物在CCP4单体库中定义。PDB-重做优化X射线数据的整体几何约束权重,以在保持“合理”模型几何结构的同时,为数据提供最佳拟合。这种合理的几何形状被定义为键长和键角根平方Z轴-分数低于1。在低分辨率下,这通常意味着PDB-重做使用了比PDB入口通常使用的更宽松的约束(Joosten等。, 2009【Joosten,R.P.等人(2009),《应用结晶杂志》第42期,第376-384页。】). 这提高了结构模型蛋白质部分的整体几何质量(van Beusekom等。, 2018【Beusekom,B.van,Touw,W.G.,Tatineni,M.,Somani,S.,Rajagopal,G.,Luo,J.,Gilliland,G.L.,Perrakis,A.&Joosten,R.P.(2018),蛋白质科学27,798-808.】),但显然不是碳水化合物。碳水化合物约束的松动可以追溯到CCP4单体库中几何约束的单个权重,由公差或σ值定义。对于氨基酸残基,这些值是根据具体情况确定的,并取自高分辨率小分子结构中键长和角度的分布(Engh&Huber,1991【Engh,R.A.&Huber,R.(1991),《结晶学报》A47,392-400。】); 对于碳水化合物残留,这些耐受值被设置为相对较高的固定值。这意味着碳水化合物相对较弱。随着分辨率的降低,当限制变得更加重要时,碳水化合物限制相对于蛋白质限制的相对弱点变得明显,碳水化合物几何结构开始偏离理想值。

一个合理的解决方案是根据数据挖掘非常高质量的结构更新单个碳水化合物限制的公差。这正是程序AceDRG公司dos(长等。, 2017【Long,F.,Nicholls,R.A.,Emsley,P.,Graíulis,S.,Merkys,A.,Vaitkus,A.&Murshudov,G.N.(2017),《冰晶学报》第73期,第112-122页。】). 我们正在与AceDRG公司开发人员更新CCP4单体库中的碳水化合物限制文件。

除了粘结长度和角度外,还可能产生其他约束,如扭转约束,以保持高质量的环构造。鉴于目前的结果,不太明显这些是严格需要的。这需要用一套新的约束装置进行测试。如前所述,扭转角度的限制可用于迫使扭曲的碳水化合物环进入最有利的椅子构象(Agire,Davies等。, 2015【Agire,J.、Davies,G.、Wilson,K.和Cowtan,K.(2015),《自然化学生物学》11,303。】). 当然,只有在基于结构上下文不能预期其他构象的情况下(例如,当残基处于化学过渡状态时),才应该进行这一操作。这个θ然而,角度本身并不是一个合适的限制值,特别是因为它也代表了一个独立的验证标准,很像蛋白质的拉马钱德兰(Ramachandran)绘图角度等。, 1963[Ramachandran,G.N.,Ramakrishnan,C.&Sasisekharan,V.(1963),《分子生物学杂志》第7期,第95-99页。]). 由于数据会有偏差,对验证指标的限制会降低其可用性。

在某些情况下,环状构象会发生很大的变化:如果一种残基名称错误的碳水化合物在严格限制下精制,构象会很好;如果现在更改残留物名称以匹配生物残留物身份(就像我们在许多情况下所做的那样),下一步精炼将迫使环原子的一个或多个手性反转;如果这个反转没有完成(主要是因为键角限制对手性体积限制起作用),残余物最终会形成扭曲的构象。

为了探索这一点,我们研究了θ-仅重命名的残留物的角度统计(补充表S1)。对于这些情况,我们可以看到θ在PDB和PDB-REDO中,角度确实比一般情况下更差。对于D类-我们看到PDB-REDO中重新细化的标称效果更大:高分辨率的情况改善得更多,而低分辨率的情况在中值方面恶化得更多θ角度。对于岩藻糖残基(FUC和FUL),我们看到重命名病例的严重恶化。这可能是因为残留物的电子密度相对较低。由于只有16例高分辨率病例,我们发现中位数RSCC公司确实远低于一般高分辨率情况:PDB为0.74,PDB-REDO为0.78。将低密度与重命名的岩藻糖残基仅存在于碳水化合物树枝的尖端这一事实结合起来(连接到N-聚糖的第一个NAG残基上)表明在构建这些残基时有更多的错误空间。PDB条目中有一个示例2z62型(金等。, 2007【Kim,H.M.、Park,B.S.、Kim,J.-I.、Kim、S.E.、Lee,J.、Oh,S.C.、Enkhbayar,P.、Matsushima,N.、Lee、H.、Yoo,O.J.和Lee,J-O.(2007)。细胞,130,906-917。】),其中重新命名的岩藻糖残留物与倒置的环平面相匹配(图4[链接]). 对其他高分辨率病例的目视检查显示,有7例需要重建(5例需要翻环),2例岩藻糖没有得到足够的密度支持,还有1例不清楚。剩下的五种情况在PDB和PDB-REDO模型中都具有结构上有利的环构型。这里只有岩藻糖残基必须稍微移动才能适应正确的糖苷键。

[图4]
图4
与人类Toll样受体4(PDB条目)的Asn35相连的N-连接聚糖2z62型; 基姆等。, 2007【Kim,H.M.、Park,B.S.、Kim,J.-I.、Kim、S.E.、Lee,J.、Oh,S.C.、Enkhbayar,P.、Matsushima,N.、Lee、H.、Yoo,O.J.和Lee,J-O.(2007)。细胞,130,906-917。】). 电子密度轮廓为1σ对于2毫发o个 − DF公司c(c)地图(灰色)和3σ对于毫发o个 − DF公司c(c)差异密度图(绿色,正值;红色,负值)。()PDB中发现的模型,(1-6)连接的岩藻糖错误地建模为FUL。天冬酰胺连接的NAG的O6原子附近的密度由模型对称相关副本中的四个水分子部分填充(特意未显示),这减少了正差密度的数量。(b条)PDB-REDO模型和地图。岩藻糖残留物重命名为FUC。后续精炼提高了对电子密度的拟合度,但扭曲了环构象并压扁了C1原子的手。(c(c))之后手动重建模型精炼通过PDB-重做翻转(1,6)连接的岩藻糖以正确适应密度,第二个NAG残基的乙酰氨基也是如此。再加上添加(1-3)连接的岩藻糖,这些校正消除了所有强烈的差异密度。(d日)挑剔(1–6)键岩藻糖的曲线图显示了FUC-(1–6NAG)糖苷键扭转角在PDB中的分布。糖苷键中的相关键标记在(). 型号标记如下:PDB,P;PDB-REDO,R;手动重建,M。只有手动重建的模型具有共同的糖苷扭转角。
3.2.3. 阳极中心几何形状

分析了PDB和PDB-REDO中异聚中心(C1原子)的手性体积偏差的分布(图5[链接]). 残基的更名和糖苷键的异构体特异性约束的明确设置可能会导致与预期手性体积的较大初始偏差。如果手完全倒置[例如,当模型显示β(1–2)两个MAN残基之间的链接]失真在4和5之间。2到3之间的畸变表明,阳极中心几乎是平的。较低的扭曲度表明阳极中心的手是正确的。我们看到异常值在以下情况下明显减少PDB-重做即使是在异基因中心的手完全相反的情况下。并不是所有的问题都解决了:一些非聚合中心在PDB-重做

[图5]
图5
异头中心原子C1在PDB和PDB-REDO中的手性体积偏差(绝对值)的分布。手性体积的最佳值为−2.22(对于α-联动装置)或+2.22(对于β-联动);的更正手性因此预计将使手性体积改变约4.5。绝大多数情况下都可以观察到明显的改善(所有点都在对角线以下)。图中观察到三个不同的聚类:PDB和PDB-REDO中都有正确手的病例(左下),PDB中有错误手但PDB-REDO中有正确手(右下),以及PDB中的手不正确,而PDB-REOD中的阳极中心平齐的病例(右中)。
3.2.4. 糖苷键构象

糖苷连杆有两个扭角(φψ)其中挑剔用作类Ramachandran图中的坐标。典型的扭角分布取决于糖苷键在伙伴残基、环位置和阳极聚合物,这使得分析大型联动装置变得困难。新实施的挑剔将链接构造表示为基于知识的潜力,使分析大型数据集更加方便。根据链接类型比较了PDB和PDB-REDO中常见于N-聚糖中的链接的电位(图6[链接]),以及所有联系的完整潜力挑剔(补充图S1)。靠近绘图原点的点表示有利的构象。NAG-NAG和BMA-NAG最常见β(1-4)联系。这可能是两个因素的结果,这两个因素使得建模涉及的残留物相对容易:残留物接近蛋白质,因此具有相对清晰的密度(与较偏远的碳水化合物残留物相比)而NAG残基的延伸扁平形状为这种电子密度的替代解释留下了很小的空间。糖苷键的扭角在精细化,因此,与阳极中心几何形状不同,预计不会有显著改进。事实上,只看到了一个微妙的改善趋势。手动重建,尤其是涉及到环翻转时,可导致糖苷连杆扭转大幅改善(图4[链接]).

[图6]
图6
比较PDB和PDB-REDO中常见的N-聚糖中糖苷键的基于知识的潜力。电势计算公式为挑剔(吕泰克等。, 2005【Lütteke,T.、Frank,M.和von der Lieth,C.-W.(2005)。核酸研究33,D242-D246。】)并且以任意单位给出;值越低越好。

3.3. 氢键

我们在PDB-REDO中的两个碳水化合物部分之间检测到了17834个氢键(PDB中为2124个),在PDB中检测到68 563个氢键碳水化合物PDB-REDO中的氨基酸(PDB中的66 499)。PDB和PDB-REDO中的碳水化合物-蛋白质氢键的平均质量都高于碳水化合物-碳水化合物氢键:角度要好得多(接近理想的180°角),碳水化合物-蛋白质氢键和氢供体和受体距离形成较窄的分布(图7[链接]).

[图7]
图7
不同氢键类型的氢键参数分布。对于碳水化合物的情况,氢键长度分布(顶部)要比纯蛋白质氢键宽得多。氢键角度分布(底部)表明,典型的碳水化合物-碳水化合物氢键具有更尖锐的角度,表明它们相对较弱,不适合产生氢键约束。

生成蛋白质-碳水化合物氢键限制的方法在斯威西如中所示HODER(发动机罩)(范博塞科姆等。, 2018【Beusekom,B.van,Touw,W.G.,Tatineni,M.,Somani,S.,Rajagopal,G.,Luo,J.,Gilliland,G.L.,Perrakis,A.&Joosten,R.P.(2018),蛋白质科学27,798-808.】). 不同于HODER(发动机罩)斯威西只会对基于同源性的目标的确定产生限制。由于蛋白质-碳水化合物氢键具有非常特殊的分子背景,因此不会产生一般的靶点限制,这可以从其距离和角度的广泛分布中看出。

我们研究了同源氢键约束的生成程度。因此,我们过滤了之前发现的氢键集,只保留那些至少有五个可用同系物的氢键(这是基于同系物限制生成的下限),并只保留PDB和PDB-REDO结构中发现的氢链(以确保氢键的可靠性)。这给了我们总共6931个可能被抑制的氢键(补充图S2)。然而,我们注意到同系物中的等效原子通常不涉及氢键:只有在2013年,氢键才在所有同系物上完全保守。2060个氢键在50%或更少的时间内保持不变。同源物中氢键的预期守恒形成了我们早期关于蛋白质氢键约束的工作的基础(van Beusekom等。, 2018【Beusekom,B.van,Touw,W.G.,Tatineni,M.,Somani,S.,Rajagopal,G.,Luo,J.,Gilliland,G.L.,Perrakis,A.&Joosten,R.P.(2018),蛋白质科学27,798-808.】). 然而,蛋白质-碳水化合物氢键的保守性较差。因此,我们得出结论,即使基于同源数据,蛋白质-碳水化合物氢键也不足以抑制。

3.4. 建立更好的碳水化合物模型

结构生物学家、wwPDB和大分子晶体学和验证工具的开发人员共同致力于生成更好的结构模型,这也是结构模型中碳水化合物部分的情况。自上个十年末以来,新PDB条目的碳水化合物环构象有了稳步改善(补充图S3)。这与第二波模型验证开发一致,这也导致了PDB验证工作组的成立(阅读等。, 2011[Read,R.J.等人(2011),《结构》,第19期,第1395-1412页。]).

这里的结果表明,PDB中有大量碳水化合物残留的情况可以改善。N-聚糖中残基和键的重新标记消除了对已知生物学的许多误解,是帮助下游研究N-糖基化位点的结构-功能关系的重要步骤。同时,我们知道还有其他情况无法自动更正,因此需要手动管理。这是一项巨大的任务,超出了PDB-重做只有在原始存款人的大量帮助下,wwPDB才能执行。PDB的新政策允许存款人更新他们的模型,而不必淘汰它们,这有望鼓励存款人在发现注释时更正注释。

重记符号和精细化在里面PDB-重做可以纠正某些错误并改善非数字中心的利手性。目前,环形构象仅在高分辨率下得到改善;在低分辨率下,环构象随着当前的约束条件而变得更差。在一些明显的情况下精细化不足以达到高质量的结果,其中注释和构造碳水化合物是正确的。在这些情况下碳水化合物需要(图4[链接]c(c)). 由于碳水化合物生成工具的大幅改进,最显著的是库特(埃姆斯利等。, 2010【Emsley,P.、Lohkamp,B.、Scott,W.G.和Cowtan,K.(2010),《水晶学报》D66、486-501。】),现在以交互方式执行变得相对简单。在以下背景下PDB-重做然而,这个过程应该以完全自动化和无监督的方式实现。尽管在这一方向上取得了稳步进展,但目前还没有实现这一自动化水平(阿吉雷等。, 2017【Agire,J.、Davies,G.J.、Wilson,K.S.和Cowtan,K.D.(2017),《当前手术结构生物学》44,39-47。】). 总的来说,糖蛋白结构还不是最佳的,但这里讨论的改进以及该领域的许多其他发展正在朝着正确的方向发展结构质量。

支持信息


脚注

当前地址:Gesellschaft für Innovative Personalwirtschaftssysteme mbH,Strahlenbergerstrasse 112,63067 Offenbach,Gesellschart für。

致谢

作者感谢荷兰癌症研究所的研究高性能计算设施为本研究提供和支持计算资源。

资金筹措信息

已确认以下资金:荷兰组织(批准号:723.013.003)。

工具书类

第一次引用Agire,J.、Davies,G.、Wilson,K.和Cowtan,K.(2015)。自然化学。生物。 11, 303. 科学网 交叉参考 谷歌学者
第一次引用Agire,J.、Davies,G.J.、Wilson,K.S.和Cowtan,K.D.(2017年)。货币。操作。结构。生物。 44, 39–47. 科学网 交叉参考 中国科学院 谷歌学者
第一次引用Agire,J.、Iglesias-Fernández,J.,Rovira,C.、Davies,G.J.、Wilson,K.S.和Cowtan,K.D.(2015)。自然结构。分子生物学。 22, 833–834. 科学网 交叉参考 中国科学院 谷歌学者
第一次引用Bernstein,F.C.,Koetzle,T.F.,Williams,G.J.,Meyer,E.F.,Brice,M.D.,Rodgers,J.R.,Kennard,O.,Shimanouchi,T.&Tasumi,M.(1977年)。分子生物学杂志。 112, 535–542. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Beusekom,B.van,Touw,W.G.,Tatineni,M.,Somani,S.,Rajagopal,G.,Luo,J.,Gilliland,G.L.,Perrakis,A.&Joosten,R.P.(2018年)。蛋白质科学。 27, 798–808. 谷歌学者
第一次引用Brändén,C.-I.&Jones,T.A.(1990年)。自然(伦敦)343, 687–689. 谷歌学者
第一次引用Brändén,C.-I.和Tooze,J.(1998)。蛋白质结构简介纽约:加兰。 谷歌学者
第一次引用Caramelo,J.J.和Parodi,A.J.(2008年)。生物学杂志。化学。 283, 10221–10225. 交叉参考 谷歌学者
第一次引用Cremer,D.&Pople,J.A.(1975年)。美国化学杂志。Soc公司。 97, 1354–1358. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Crispin,M.、Stuart,D.I.和Jones,E.Y.(2007年)。自然结构。分子生物学。 14, 354. 科学网 交叉参考 谷歌学者
第一次引用Emsley,P.、Lohkamp,B.、Scott,W.G.和Cowtan,K.(2010年)。《水晶学报》。D类66, 486–501. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Engh,R.A.和Huber,R.(1991)。《水晶学报》。A类47, 392–400. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
第一次引用Evans,P.R.(2007)。《水晶学报》。D类63, 58–61. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Feinberg,H.、Jégouzo,S.A.F.、Rex,M.J.、Drickamer,K.、Weis,W.I.和Taylor,M.E.(2017年)。生物学杂志。化学。 292, 13402–13414. 交叉参考 谷歌学者
第一次引用Ferraroni,M.、Westphal,A.H.、Borsari,M、Tamayo-Ramos,J.A.、Briganti,F.、de Graaff,L.H.和van Berkel,W.J.H.(2017)。生物催化, 1–21. 交叉参考 谷歌学者
第一次引用Frabutt,D.A.、Wang,B.、Riaz,S.、Schwartz,R.C.和Zheng,Y.-H.(2018)。J.维罗尔。 92,e01690-17交叉参考 谷歌学者
第一次引用Frank,M.、Lütteke,T.和von der Lieth,C.-W.(2007)。核酸研究。 35, 287–290. 交叉参考 谷歌学者
第一次引用Furukawa,K.、Ohkawa,Y.、Yamauchi,Y.、Hamamura,K.、Ohmi,Y.和Furukawa,K.(2012)。生物化学杂志。 151, 573–578. 交叉参考 谷歌学者
第一次引用Joosten,R.P。等。(2009年)。J.应用。克里斯特。 42, 376–384. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Jooston,R.P.、Joosten,K.、Murshudov,G.N.和Perrakis,A.(2012年)。《水晶学报》。D类68, 484–496. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Joosten,R.P.&Lütteke,T.(2017)。货币。操作。结构。生物。 44, 9–17. 科学网 交叉参考 中国科学院 谷歌学者
第一次引用Kiermaier,E。等。(2016).科学351, 186–190. 交叉参考 谷歌学者
第一次引用Kim,H.M.、Park,B.S.、Kim,J.-I.、Kim、S.E.、Lee,J.、Oh,S.C.、Enkhbayar,P.、Matsushima,N.、Lee、H.、Yoo、O.J.和Lee,J-O.(2007)。单元格130, 906–917. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Long,F.、Nicholls,R.A.、Emsley,P.、Graíulis,S.、Merkys,A.、Vaitkus,A.和Murshudov,G.N.(2017年)。《水晶学报》。D类73, 112–122. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Lütteke,T.、Frank,M.和von der Lieth,C.-W.(2004)。碳水化合物。物件。 339, 1015–1020. 谷歌学者
第一次引用Lütteke,T.、Frank,M.和von der Lieth,C.-W.(2005年)。核酸研究。 33,D242–D246谷歌学者
第一次引用Lütteke,T.和von der Lieth,C.-W.(2004)。BMC生物信息学5, 69. 谷歌学者
第一次引用McNicholas,S.、Potterton,E.、Wilson,K.S.和Noble,M.E.M.(2011年)。《水晶学报》。D类67, 386–394. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Murshudov,G.N.、Skubák,P.、Lebedev,A.A.、Pannu,N.S.、Steiner,R.A.、Nicholls,R.A、Winn,M.D.、Long,F.&Vagin,A.(2011)。《水晶学报》。D类67,355–367页科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Nigrovic,P.A.(2013年)。大黄性关节炎。 65, 2541–2544. 谷歌学者
第一次引用Ohtsubo,K.、Chen,M.Z.、Olefsky,J.M.和Marth,J.D.(2011)。自然医学。 17, 1067–1075. 交叉参考 谷歌学者
第一次引用Ramachandran,G.N.、Ramakrishnan,C.和Sasisekharan,V.(1963年)。分子生物学杂志。 7, 95–99. 交叉参考 公共医学 中国科学院 科学网 谷歌学者
第一次引用里德·R·J。等。(2011).结构19, 1395–1412. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Schnaar,R.L.(2015)。过敏临床杂志。免疫。 135, 609–615. 交叉参考 谷歌学者
第一次引用Stevens,J.、Blixt,O.、Paulson,J.C.和Wilson,I.A.(2006年)。《自然·微生物学评论》。 4, 857–864. 交叉参考 谷歌学者
第一次引用Tickle,I.J.(2012年)。《水晶学报》。D类68, 454–467. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Tytgat,H.L.P.和de Vos,W.M.(2016)。微生物趋势。 24, 853–861. 交叉参考 谷歌学者
第一次引用Vagin,A.A.、Steiner,R.A.、Lebedev,A.B.、Potterton,L.、McNicholas,S.、Long,F.和Murshudov,G.N.(2004)。《水晶学报》。D类60, 2184–2195. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Varki,A.(2017)。糖生物学27, 3–49. 交叉参考 谷歌学者
第一次引用Westbrook,J.D.、Shao,C.、Feng,Z.、Zhuravleva,M.、Velankar,S.&Young,J.(2015)。生物信息学31, 1274–1278. 科学网 交叉参考 公共医学 谷歌学者
第一次引用Wright,C.S.和Jaeger,J.(1993)。分子生物学杂志。 232, 620–638. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Yang,H.,Nguyen,H.T.,Carney,P.J.,Guo,Z.,Chang,J.C.,Jones,J.,Davis,C.T.,Villanueva,J.M.,Gubareva,L.V.&Stevens,J.(2015)。J.维罗尔。 89, 2801–2812. 交叉参考 谷歌学者
第一次引用J.Y.扬。等。(2017).结构25, 536–545. 科学网 交叉参考 中国科学院 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标结构生物学
通信
国际标准编号:2053-230X