1.简介
结构生物学为我们提供了对生命分子机制的洞察力(Brändén&Tooze,1998)). 这些机制大多是从蛋白质的角度来看的,因为它们具有许多作用,例如化学转换器、结构构建块和信号处理器,但蛋白质并不是单独起作用的。他们之间的互动核酸,小分子、离子甚至水分子构成了非常复杂的系统和相互作用网络的基础。对这些系统和网络进行管理,以应对功能要求的变化,例如在任何特定时间由于环境因素的变化。蛋白质共价结构的改变,即翻译后修改可能是最广为人知的监管形式。
糖基化不仅是蛋白质共翻译和翻译后修饰的最常见形式之一,也是最复杂的形式之一。聚糖链参与蛋白质折叠通过钙联蛋白/钙网蛋白循环(Caramelo&Parodi,2008),作为分子标记,影响蛋白质稳定性并影响蛋白质的功能(Varki,2017). 虽然N-聚糖的核心结构高度保守,但在N-聚糖核心外和O-聚糖中都可以发现各种不同的结构(Varki,2017). 这种类型的聚糖允许对蛋白质功能进行微调(Varki,2017; 大津博等。, 2011; 2013年,尼格罗维奇).葡聚糖在细胞信号传递和贩运中发挥重要作用(Furukawa等。, 2012; 基尔马耶等。, 2016)以及感染、炎症和免疫反应(瓦尔基,2017年; Schnaar,2015年; 弗拉巴特等。, 2018; Tytgat&Vos,2016年),其中聚糖被糖结合蛋白特异识别凝集素,或者通过抗体。在所有这些事件中,聚糖链的微小差异,例如单个C原子的不同立体化学或不同的连接位置,都会对生物功能产生重大影响。例如,流感病毒血凝素的碳水化合物再认识域对末端唾液酸残基和邻近半乳糖之间的特定联系具有特异性:禽流感病毒血凝素主要与(2–3)连接的唾液酸结合,而来自人类流感病毒的血凝素最好能识别(2–6)连接的唾液酸(史蒂文斯等。, 2006; 杨等。, 2015).
的三维结构糖蛋白类和蛋白质数据库(PDB;Bernstein)中的蛋白质-碳水化合物复合物等。, 1977)是了解糖基化对蛋白质影响的宝贵资源。此外,它们还提供了识别聚糖通过蛋白质。然而,不幸的是,这些结构的聚糖部分通常具有许多缺陷,从轻微的不规则到严重的错误(Lütteke等。, 2004; 克里斯宾等。, 2007; 戴维斯·阿吉雷等。, 2015). 这个问题有多个原因:糖蛋白类(2.4º)略低于PDB条目的一般值(2.0º);大多数结构生物学软件工具都是以蛋白质为中心的,不处理碳水化合物以及它们处理蛋白质;大多数晶体学家在处理这些问题上缺乏良好的训练碳水化合物;蛋白质上的糖基化位点可能不是解决结构的研究问题的一部分(也就是说,在这些方面花费的精力很少);验证碳水化合物不是标准结构阐明过程的一部分;以及wwPDB的沉积和注释过程(Young等。, 2017)不专注于碳水化合物。鉴于有关各方可用的资源有限,所有这些因素都是可以理解的,但仍有提高质量的动力碳水化合物在可用的结构模型中(读取等。, 2011).
这个PDB-重做“建设性验证”管道(Joosten等。, 2012)晶体结构模型的改进可以为晶体学和其他结构生物学家提高糖蛋白结构模型的质量提供服务,PDB-重做是以蛋白质为中心的。然而,它确实有一组可以改进的功能碳水化合物基于pdb护理(Lütteke&von der Lieth,2004年); Joosten&Lütteke,2017年). 因为PDB-重做管道是完全自动化的,它对模型的处理是一致的。然而,这只在管道的一个版本中是完全正确的。多年来,PDB-REDO数据库(Joosten等。, 2009)已经开发了相当多的软件版本,这使得很难可靠地分析PDB-重做关于碳水化合物。我们最近完全替换了PDB-REDO数据库,将所有内容都转换为单一版本(van Beusekom等。, 2018). 在这里,我们借此机会了解PDB-REDO在碳水化合物结构模型质量的各个方面所处的地位,以及PDB-REDO项目的未来体现中还有哪些可以改进的地方。
2.方法
2.1. 数据集选择
我们分析了最近更新的PDB-REDO数据库(van Beusekom)中的所有条目等。, 2018)其中任何单糖 β-D类-GlcpNAc、,α-D类-GlcpNAc、,α-D类-男人第页,β-D类-男人第页,β-D类-Glc公司第页,α-D类-Glc公司第页,β-D类-镓第页,α-D类-加仑第页,α-L(左)-操第页或β-L(左)-操第页存在并作为单独的残基进行注释。例如,只有当麦芽糖被标注为两个共价结合的葡萄糖残基而不是单个麦芽糖残基时,才能对其进行分析。为了强调这一区别,我们将参考单糖通过PDB化学成分词典(Westbrook等。, 2015)残留物名称:分别为NAG、NDG、MAN、BMA、BGC、GLC、GAL、GLA、FUC和FUL。本研究的数据集包括8114个PDB-REDO条目(共111 130个条目)及其对应的PDB条目。
2.4. 碳水化合物氢键和同源性
我们最近表明,在精炼可以帮助改进中低分辨率的蛋白质结构模型(van Beusekom等。, 2018).碳水化合物有大量的氢键供体和受体,但碳水化合物结构的相对质量较差。在这里,我们研究在糖蛋白类为碳水化合物创造氢键约束。
程序斯威西是为了分析涉及碳水化合物残基的氢键并找到它们的同源物。该程序基于HODER(发动机罩)(范博塞科姆等。, 2018)带有专门用于碳水化合物。读取输入PDB文件后,在CCP4单体库(Vagin等。, 2004). 对存在的碳水化合物残基的约束文件进行解析,以确定原子及其键序。根据这些,可以确定哪些原子是氢键供体和/或受体。二者之间的氢键碳水化合物蛋白质和碳水化合物之间的检测基于我们之前使用的相同几何标准(van Beusekom等。, 2018). 在当前的实现中,同源蛋白质-碳水化合物氢键仅被识别为N-连接糖基化树,因为它们可以可靠地匹配。识别形成蛋白质-碳水化合物氢键的蛋白质残基,然后识别同源物中的等效残基。此外,与糖基化树芽所来自的天冬酰胺同源的残基。从这个残基中,通过寻找糖基化树中相同相对位置的碳水化合物部分,可以找到同源的碳水化合物残基。应该注意的是,给定的碳水化合物残留类型被故意忽略,因为这些数据并不完全可靠。
评估一般氢键约束是否适用于碳水化合物是一个可行的选择,我们分析了糖蛋白类在我们的数据集中。此外,我们在同源结构中寻找守恒氢键,基于此可以生成基于同源的氢键约束。
3.结果和讨论
3.2. 模型质量指标
3.2.3. 阳极中心几何形状
分析了PDB和PDB-REDO中异聚中心(C1原子)的手性体积偏差的分布(图5). 残基的更名和糖苷键的异构体特异性约束的明确设置可能会导致与预期手性体积的较大初始偏差。如果手完全倒置[例如,当模型显示β(1–2)两个MAN残基之间的链接]失真在4和5之间。2到3之间的畸变表明,阳极中心几乎是平的。较低的扭曲度表明阳极中心的手是正确的。我们看到异常值在以下情况下明显减少PDB-重做即使是在异基因中心的手完全相反的情况下。并不是所有的问题都解决了:一些非聚合中心在PDB-重做。
| 图5 异头中心原子C1在PDB和PDB-REDO中的手性体积偏差(绝对值)的分布。手性体积的最佳值为−2.22(对于α-联动装置)或+2.22(对于β-联动);的更正手性因此预计将使手性体积改变约4.5。绝大多数情况下都可以观察到明显的改善(所有点都在对角线以下)。图中观察到三个不同的聚类:PDB和PDB-REDO中都有正确手的病例(左下),PDB中有错误手但PDB-REDO中有正确手(右下),以及PDB中的手不正确,而PDB-REOD中的阳极中心平齐的病例(右中)。 |
3.3. 氢键
我们在PDB-REDO中的两个碳水化合物部分之间检测到了17834个氢键(PDB中为2124个),在PDB中检测到68 563个氢键碳水化合物PDB-REDO中的氨基酸(PDB中的66 499)。PDB和PDB-REDO中的碳水化合物-蛋白质氢键的平均质量都高于碳水化合物-碳水化合物氢键:角度要好得多(即接近理想的180°角),碳水化合物-蛋白质氢键和氢供体和受体距离形成较窄的分布(图7).
| 图7 不同氢键类型的氢键参数分布。对于碳水化合物的情况,氢键长度分布(顶部)要比纯蛋白质氢键宽得多。氢键角度分布(底部)表明,典型的碳水化合物-碳水化合物氢键具有更尖锐的角度,表明它们相对较弱,不适合产生氢键约束。 |
生成蛋白质-碳水化合物氢键限制的方法在斯威西如中所示HODER(发动机罩)(范博塞科姆等。, 2018). 不同于HODER(发动机罩),斯威西只会对基于同源性的目标的确定产生限制。由于蛋白质-碳水化合物氢键具有非常特殊的分子背景,因此不会产生一般的靶点限制,这可以从其距离和角度的广泛分布中看出。
我们研究了同源氢键约束的生成程度。因此,我们过滤了之前发现的氢键集,只保留那些至少有五个可用同系物的氢键(这是基于同系物限制生成的下限),并只保留PDB和PDB-REDO结构中发现的氢链(以确保氢键的可靠性)。这给了我们总共6931个可能被抑制的氢键(补充图S2)。然而,我们注意到同系物中的等效原子通常不涉及氢键:只有在2013年,氢键才在所有同系物上完全保守。2060个氢键在50%或更少的时间内保持不变。同源物中氢键的预期守恒形成了我们早期关于蛋白质氢键约束的工作的基础(van Beusekom等。, 2018). 然而,蛋白质-碳水化合物氢键的保守性较差。因此,我们得出结论,即使基于同源数据,蛋白质-碳水化合物氢键也不足以抑制。
3.4. 建立更好的碳水化合物模型
结构生物学家、wwPDB和大分子晶体学和验证工具的开发人员共同致力于生成更好的结构模型,这也是结构模型中碳水化合物部分的情况。自上个十年末以来,新PDB条目的碳水化合物环构象有了稳步改善(补充图S3)。这与第二波模型验证开发一致,这也导致了PDB验证工作组的成立(阅读等。, 2011).
这里的结果表明,PDB中有大量碳水化合物残留的情况可以改善。N-聚糖中残基和键的重新标记消除了对已知生物学的许多误解,是帮助下游研究N-糖基化位点的结构-功能关系的重要步骤。同时,我们知道还有其他情况无法自动更正,因此需要手动管理。这是一项巨大的任务,超出了PDB-重做只有在原始存款人的大量帮助下,wwPDB才能执行。PDB的新政策允许存款人更新他们的模型,而不必淘汰它们,这有望鼓励存款人在发现注释时更正注释。
重记符号和精细化在里面PDB-重做可以纠正某些错误并改善非数字中心的利手性。目前,环形构象仅在高分辨率下得到改善;在低分辨率下,环构象随着当前的约束条件而变得更差。在一些明显的情况下精细化不足以达到高质量的结果,其中注释和构造碳水化合物是正确的。在这些情况下碳水化合物需要(图4c(c)). 由于碳水化合物生成工具的大幅改进,最显著的是库特(埃姆斯利等。, 2010),现在以交互方式执行变得相对简单。在以下背景下PDB-重做然而,这个过程应该以完全自动化和无监督的方式实现。尽管在这一方向上取得了稳步进展,但目前还没有实现这一自动化水平(阿吉雷等。, 2017). 总的来说,糖蛋白结构还不是最佳的,但这里讨论的改进以及该领域的许多其他发展正在朝着正确的方向发展结构质量。
致谢
作者感谢荷兰癌症研究所的研究高性能计算设施为本研究提供和支持计算资源。
资金筹措信息
已确认以下资金:荷兰组织(批准号:723.013.003)。
工具书类
Agire,J.、Davies,G.、Wilson,K.和Cowtan,K.(2015)。自然化学。生物。 11, 303. 科学网 交叉参考 谷歌学者
Agire,J.、Davies,G.J.、Wilson,K.S.和Cowtan,K.D.(2017年)。货币。操作。结构。生物。 44, 39–47. 科学网 交叉参考 中国科学院 谷歌学者
Agire,J.、Iglesias-Fernández,J.,Rovira,C.、Davies,G.J.、Wilson,K.S.和Cowtan,K.D.(2015)。自然结构。分子生物学。 22, 833–834. 科学网 交叉参考 中国科学院 谷歌学者
Bernstein,F.C.,Koetzle,T.F.,Williams,G.J.,Meyer,E.F.,Brice,M.D.,Rodgers,J.R.,Kennard,O.,Shimanouchi,T.&Tasumi,M.(1977年)。分子生物学杂志。 112, 535–542. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
Beusekom,B.van,Touw,W.G.,Tatineni,M.,Somani,S.,Rajagopal,G.,Luo,J.,Gilliland,G.L.,Perrakis,A.&Joosten,R.P.(2018年)。蛋白质科学。 27, 798–808. 谷歌学者
Brändén,C.-I.&Jones,T.A.(1990年)。自然(伦敦),343, 687–689. 谷歌学者
Brändén,C.-I.和Tooze,J.(1998)。蛋白质结构简介纽约:加兰。 谷歌学者
Caramelo,J.J.和Parodi,A.J.(2008年)。生物学杂志。化学。 283, 10221–10225. 交叉参考 谷歌学者
Cremer,D.&Pople,J.A.(1975年)。美国化学杂志。Soc公司。 97, 1354–1358. 交叉参考 中国科学院 科学网 谷歌学者
Crispin,M.、Stuart,D.I.和Jones,E.Y.(2007年)。自然结构。分子生物学。 14, 354. 科学网 交叉参考 谷歌学者
Emsley,P.、Lohkamp,B.、Scott,W.G.和Cowtan,K.(2010年)。《水晶学报》。D类66, 486–501. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Engh,R.A.和Huber,R.(1991)。《水晶学报》。A类47, 392–400. 交叉参考 中国科学院 科学网 IUCr日志 谷歌学者
Evans,P.R.(2007)。《水晶学报》。D类63, 58–61. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Feinberg,H.、Jégouzo,S.A.F.、Rex,M.J.、Drickamer,K.、Weis,W.I.和Taylor,M.E.(2017年)。生物学杂志。化学。 292, 13402–13414. 交叉参考 谷歌学者
Ferraroni,M.、Westphal,A.H.、Borsari,M、Tamayo-Ramos,J.A.、Briganti,F.、de Graaff,L.H.和van Berkel,W.J.H.(2017)。生物催化,三, 1–21. 交叉参考 谷歌学者
Frabutt,D.A.、Wang,B.、Riaz,S.、Schwartz,R.C.和Zheng,Y.-H.(2018)。J.维罗尔。 92,e01690-17交叉参考 谷歌学者
Frank,M.、Lütteke,T.和von der Lieth,C.-W.(2007)。核酸研究。 35, 287–290. 交叉参考 谷歌学者
Furukawa,K.、Ohkawa,Y.、Yamauchi,Y.、Hamamura,K.、Ohmi,Y.和Furukawa,K.(2012)。生物化学杂志。 151, 573–578. 交叉参考 谷歌学者
Joosten,R.P。等。(2009年)。J.应用。克里斯特。 42, 376–384. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Jooston,R.P.、Joosten,K.、Murshudov,G.N.和Perrakis,A.(2012年)。《水晶学报》。D类68, 484–496. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Joosten,R.P.&Lütteke,T.(2017)。货币。操作。结构。生物。 44, 9–17. 科学网 交叉参考 中国科学院 谷歌学者
Kiermaier,E。等。(2016).科学,351, 186–190. 交叉参考 谷歌学者
Kim,H.M.、Park,B.S.、Kim,J.-I.、Kim、S.E.、Lee,J.、Oh,S.C.、Enkhbayar,P.、Matsushima,N.、Lee、H.、Yoo、O.J.和Lee,J-O.(2007)。单元格,130, 906–917. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
Long,F.、Nicholls,R.A.、Emsley,P.、Graíulis,S.、Merkys,A.、Vaitkus,A.和Murshudov,G.N.(2017年)。《水晶学报》。D类73, 112–122. 科学网 交叉参考 IUCr日志 谷歌学者
Lütteke,T.、Frank,M.和von der Lieth,C.-W.(2004)。碳水化合物。物件。 339, 1015–1020. 谷歌学者
Lütteke,T.、Frank,M.和von der Lieth,C.-W.(2005年)。核酸研究。 33,D242–D246谷歌学者
Lütteke,T.和von der Lieth,C.-W.(2004)。BMC生物信息学,5, 69. 谷歌学者
McNicholas,S.、Potterton,E.、Wilson,K.S.和Noble,M.E.M.(2011年)。《水晶学报》。D类67, 386–394. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Murshudov,G.N.、Skubák,P.、Lebedev,A.A.、Pannu,N.S.、Steiner,R.A.、Nicholls,R.A、Winn,M.D.、Long,F.&Vagin,A.(2011)。《水晶学报》。D类67,355–367页科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Nigrovic,P.A.(2013年)。大黄性关节炎。 65, 2541–2544. 谷歌学者
Ohtsubo,K.、Chen,M.Z.、Olefsky,J.M.和Marth,J.D.(2011)。自然医学。 17, 1067–1075. 交叉参考 谷歌学者
Ramachandran,G.N.、Ramakrishnan,C.和Sasisekharan,V.(1963年)。分子生物学杂志。 7, 95–99. 交叉参考 公共医学 中国科学院 科学网 谷歌学者
里德·R·J。等。(2011).结构,19, 1395–1412. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
Schnaar,R.L.(2015)。过敏临床杂志。免疫。 135, 609–615. 交叉参考 谷歌学者
Stevens,J.、Blixt,O.、Paulson,J.C.和Wilson,I.A.(2006年)。《自然·微生物学评论》。 4, 857–864. 交叉参考 谷歌学者
Tickle,I.J.(2012年)。《水晶学报》。D类68, 454–467. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Tytgat,H.L.P.和de Vos,W.M.(2016)。微生物趋势。 24, 853–861. 交叉参考 谷歌学者
Vagin,A.A.、Steiner,R.A.、Lebedev,A.B.、Potterton,L.、McNicholas,S.、Long,F.和Murshudov,G.N.(2004)。《水晶学报》。D类60, 2184–2195. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
Varki,A.(2017)。糖生物学,27, 3–49. 交叉参考 谷歌学者
Westbrook,J.D.、Shao,C.、Feng,Z.、Zhuravleva,M.、Velankar,S.&Young,J.(2015)。生物信息学,31, 1274–1278. 科学网 交叉参考 公共医学 谷歌学者
Wright,C.S.和Jaeger,J.(1993)。分子生物学杂志。 232, 620–638. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
Yang,H.,Nguyen,H.T.,Carney,P.J.,Guo,Z.,Chang,J.C.,Jones,J.,Davis,C.T.,Villanueva,J.M.,Gubareva,L.V.&Stevens,J.(2015)。J.维罗尔。 89, 2801–2812. 交叉参考 谷歌学者
J.Y.扬。等。(2017).结构,25, 536–545. 科学网 交叉参考 中国科学院 谷歌学者
| 结构生物学 通信 |
国际标准编号:2053-230X
打开访问