研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标生物
结晶学
国际标准编号:1399-0047

蛋白质中氨基酸有序水合的结构:晶体结构分析

十字标记_颜色_方形_文本.svg

捷克共和国布拉格142 20 Videnska 1083,中科院生物技术研究所生物分子识别实验室
*通信电子邮件:lada.biedermannova@ibt.cas.cz

编辑:Z.S.Derewenda,美国弗吉尼亚大学(2015年6月10日收到; 2015年8月20日接受; 在线2015年10月27日)

结晶学提供了关于蛋白质表面附近水分子排列的独特信息。使用分辨率高于1.8的非冗余2818个蛋白质晶体结构根据残基构象、二级结构和溶剂可及性,分析了所有20个标准氨基酸残基的水合壳的大小和结构。结果表明,水合作用如何取决于氨基酸构象及其发生的环境。在对单个残基进行构象聚类后,汇编了水分子的密度分布,并将优选的水合位点确定为水分布的伪电子密度表示中的最大值。许多水合位点与主链和侧链氨基酸原子相互作用,以及几种典型接触较少的水合位点,如碳-供体氢键、OH-π还报道了与芳香杂原子的相互作用和离面相互作用。关于蛋白质中经验确定的首选水合位点的位置和相对重要性的信息在改进现有水合位点预测方法方面具有应用分子替换, 从头算蛋白质结构预测和分子动力学模拟的建立。

1.简介

蛋白质在水环境中发挥作用,并在进化上适应水环境。水分子是蛋白质分子的组成部分,其结构、动力学和功能,理解水环境和多肽链之间的关系至关重要。水参与蛋白质折叠(Busch等。, 2013【Busch,S.、Bruce,C.D.、Redfield,C.、Lorenz,C.D.和McLain,S.E.(2013)。Angew.Chem.Int.Ed.52,13091-13095.】; 丸山和原野,2013年【Maruyama,Y.和Harano,Y.(2013),《化学物理快报》581,85-90。】; 鲍德温,2014【Baldwin,R.L.(2014),美国国家科学院院刊,11113052-13056。】),结构(Takano等。, 2003【Takano,K.、Yamagata,Y.和Yutani,K.(2003),《蛋白质工程》16,5-9。】; Park&Saven,2005年【Park,S.&Saven,J.G.(2005)。蛋白质,60,450-463。】)和动力学(Frauenfeld等。, 2009【Frauenfelder,H.、Chen,G.、Berendzen,J.、Fenimore,P.W.、Jansson,H.,McMahon,B.H.、Stroe,I.R.、Swenson,J.&Young,R.D.(2009)。美国国家科学院院刊,106,5129-5134。】; 等。, 2009[张,L.,杨,Y.,Kao,Y.-T.,Wang,L.&Zhong,D.(2009).美国化学学会期刊131,10677-10691.]; Combet和Zanotti,2012年【Combet,S.和Zanotti,J.-M.(2012),《物理化学化学物理》第14期,第4927-4934页。】)以及蛋白质功能,如酶活性(阳等。, 2004【Yang,L.,Dordick,J.S.&Garde,S.(2004),《生物物理学杂志》第87期,第812-821页。】; 卢武铉等。, 2006[Roh,J.H.,Curtis,J.E.,Azzam,S.,Novikov,V.N.,Peral,I.,Chowdhuri,Z.,Gregory,R.B.&Sokolov,A.P.(2006),《生物物理学杂志》91,2573-2588。]),配体结合(Ramirez等。, 2008[拉米雷斯,U.D.,福西娅,P.J.&弗雷曼,D.M.(2008),《结晶学报》D64,1043-1053。]; 塞蒂等。, 2013【Setny,P.、Baron,R.、Kekenes-Huskey,P.M.、McCammon,J.A.和Dzubiella,J.(2013)。美国国家科学院院刊,110,1197-1202。】),生物分子识别(Reichmann等。, 2008[Reichmann,D.,Phillip,Y.,Carmi,A.&Schreiber,G.(2008).生物化学,471051-1060.]; 艾哈迈德等。2011年[Ahmed,M.H.,Spyrakis,F.,Cozzini,P.,Tripathi,P.K.,Mozzarelli,A.,Scarsdale,J.N.,Safo,M.&Kellogg,G.E.(2011).公共科学图书馆一期,6,e24712.])和聚合(Chong&Ham,2014【Chong,S.-H.&Ham,S.(2014),Angew.Chem.Int.Ed.53,3961-3964.】). 一系列实验和计算方法被用于阐明生物分子周围水环境的结构和动力学(Chalikian,2008)【Chalikian,T.V.(2008),《物理化学杂志》,第112期,第911-917页。】). 研究表明,蛋白质周围的水合层具有不同于散装水环境的物理特性;然而,确切的参数(如层厚度和动态特性以及其结构程度)存在争议,并取决于所应用的方法和观察到的特性(Halle,2004【Halle,B.(2004),《Philos.Trans.R.Soc.B生物科学》359,1207-1224。】; 等。2011年[Zhong,D.,Pal,S.K.和Zewail,A.H.(2011).化学物理学报503,1-11.]). X光(陈等。, 2008【Chen,X.,Weber,I.&Harrison,R.W.(2008),《物理化学杂志》,第112期,第12073-12080页。】; Kysilka和Vondrášek,2013年【Kysilka,J.和Vondrášek,J.(2013),《分子识别》,第26期,第479-487页。】)和中子衍射(Niimura&Bau,2008【Niimura,N.&Bau,R.(2008),《晶体学报》,A64,12-22。】)研究提供了蛋白质和核酸晶体结构中有序第一水合壳的独特信息。当在许多结构上取平均值时,这些结晶水分子会固结成定义明确的首选水合位置(Schneider&Berman,1995【Schneider,B.&Berman,H.M.(1995),《生物物理学杂志》69,2661-2669。】; 施耐德等。, 1998【Schneider,B.、Patel,K.和Berman,H.M.(1998)。生物物理杂志75,2422-2434。】; 马卡洛夫等。, 2002【Makarov,V.、Pettitt,B.M.和Feig,M.(2002),《美国化学研究》第35期,第376-384页。】; Auffinger&Hashem,2007年[Auffinger,P.和Hashem,Y.(2007)。生物信息学,231031-1037]). 关于水合密度、动力学和停留时间的信息可以从NMR实验中获得(Nucci等。2011年【Nucci,N.V.、Pometun,M.S.和Wand,A.J.(2011),《自然结构分子生物学》,第18期,第245-249页。】)、其他光谱技术(张等。, 2007[张,L.,王磊,高,Y.-T.,邱,W.,杨,Y.,Okobiah,O.&Zhong,D.(2007).美国国家科学院学报,10418461-18466.]; 拜伊等。, 2014【拜伊·J·W·、梅利加·S·、费拉乔·D·、辛克·G·、泽特勒·J·A·和福尔科纳·R·J·(2014)。《物理化学杂志》,第118期,第83-88页。】)和分子动力学(MD)模拟(Halle&Persson,2013【Halle,B.&Persson,F.(2013),《化学理论计算杂志》,第9期,第2838-2848页。】),也可以提供水合热力学的估算(Cui等。, 2013[Cui,G.,Swails,J.M.&Manas,E.S.(2013),《化学理论计算杂志》9,5539-5549.]; Hu&Lill,2014年[Hu,B.&Lill,M.(2014),《计算化学杂志》第35期,第1255-1260页。]).

在这篇论文中,我们在单个氨基酸残基的详细水平上研究了晶体结构中蛋白质的水合作用。在20世纪80年代和90年代的几项研究中也应用了类似的方法(Goodfellow等。, 1993【Goodfellow,J.M.、Thanki,N.和Thornton,J.M(1993)。《水与生物大分子》,E.Westhof编辑。伦敦:CRC出版社。】; Roe&Teeter,1993年[Roe,S.M.和Teeter,M.(1993),分子生物学杂志,229419-427。]; 弗拉纳根等。1995年【Flanagan,K.,Walshaw,J.,Price,S.L.&Goodfellow,J.M.(1995),《蛋白质工程》第8期,第109-116页。】). 尽管这些研究仅使用了少数晶体结构,但它们提供了关于蛋白质功能基团周围首选水位置的宝贵信息。观察到的水分子分布与氢键的立体化学基本一致,反映了蛋白质原子的供体和受体性质。该信息已用于蛋白质结构预测软件,如罗塞塔(江)等。, 2005[Jiang,L.,Kuhlman,B.,Korteme,T.&Baker,D.(2005).蛋白质,58893-904.])和水瓶座(皮特等。, 1993【Pitt,W.R.、Murray-Rust,J.和Goodfellow,J.M.(1993),《计算化学杂志》第14期,第1007-1018页。】). 最近,基于大量数据(~18)重新计算了极性蛋白质原子周围水分子的概率分布蛋白质晶体结构(Matsuoka&Nakasako,2009)【Matsuoka,D.和Nakasako,M.(2009),《物理化学杂志》,第113期,第11274-11292页。】). 该分析证实了先前研究的结论,但提供了更平滑的分布,从而可以进行更精确的预测(Matsuoka&Nakasako,2013【Matsuoka,D.和Nakasako,M.(2013),《化学物理》419,59-64。】). 等。(2013[Zheng,M.,Li,Y.,Xiong,B.,Jiang,H.&Shen,J.(2013).计算化学杂志.34,583-592.])计算了不同类型蛋白质原子周围水的径向分布函数,并计算了相应的平均力势(wPMF)。这使得作者能够为蛋白质结构中的单个水分子指定wPMF分数,并预测潜在的水合位点。

考虑到水分子可以同时作为最多两个氢键的受体和另外两个氢链的供体,很明显,水的位置不仅反映了最近官能团的身份,而且还反映了其更广泛的结合环境中其他基团的身份。因此,在分析首选的水位置时,不仅要考虑氨基酸的特性,还要考虑它的旋转体状态及其环境,例如它所处的二级结构(古德费罗等。, 1993【Goodfellow,J.M.,Thanki,N.和Thornton,J.M.(1993)。《水和生物大分子》,E.Westhof编辑。伦敦:CRC出版社。】). 当忽略这些因素时,产生的分布由不同构象状态的叠加组成,在某些情况下导致结构上无法解释的广泛分布(Matsuoka&Nakasako,2009【Matsuoka,D.和Nakasako,M.(2009),《物理化学杂志》,第113期,第11274-11292页。】). 因此,第一层水化壳没有有序的结论是不正确的。在以前的一些研究中已经考虑了氨基酸构象的因素(莫里斯等。, 1992【Morris,A.S.、Thanki,N.和Goodfellow,J.M.(1992),《蛋白质工程》第5期,第717-728页。】)其中,丝氨酸、苏氨酸和酪氨酸的主链水合作用和水合作用已根据氨基酸二级结构进行了分解,但不是根据侧链旋转体状态进行的。除了忽略残基构象外,氨基酸水合作用的现有分析还存在接触定义过于严格的问题,通常只考虑极性蛋白质原子(氧和氮),并单独考虑侧链和主链。这可能导致忽视非常规的水-蛋白质相互作用以及主链和侧链之间的联系。例如,色氨酸和组氨酸侧链的氮杂原子被证明参与了与水的离面相互作用(Stollar等。, 2004【Stollar,E.J.、Gelpí,J.L.、Velankar,S.、Golovin,A.、Orozco,M.和Luisi,B.F.(2004)。蛋白质,57,1-8。】),水-氮距离为3.0至3.4以及与主链水的额外协调。

本研究的目的是分析蛋白质晶体结构中氨基酸残基周围的水合作用,考虑氨基酸残基的整体结构、构象、溶剂可及性和二级结构。我们验证了这样的假设:第一个水合壳层位于空间上定义的水合位置,其位置取决于残余构象和环境。蛋白质水合作用在一组2818个连续非冗余单体蛋白质晶体结构中进行分析,晶体分辨率高于1.8Å. 我们研究了20个标准氨基酸残基的水合作用与其溶剂可及表面积(SASA)、二级结构环境和侧链旋转体状态的依赖性。为了从结构上解释观察到的差异,我们对氨基酸残基进行构象聚类和傅里叶平均(Schneider等。, 1993【Schneider,B.、Cohen,D.M.、Schleifer,L.、Srinivasan,A.R.、Olson,W.K.和Berman,H.M.(1993)。生物物理杂志65,2291-2303。】)并解析了主要构象状态的水化位点位置。结果表明,水合位点的位置如何依赖于氨基酸构象,它们可以与侧链和主链蛋白质原子同时相互作用,并指出碳-供体氢键、OH-π芳香杂原子的相互作用和离面相互作用。这些发现可用于改进当前验证协议和基于知识的水预测程序。

2.材料和方法

2.1、。蛋白质结构的选择

选择一组具有低序列同源性的分辨率高的蛋白质结构进行分析。为此,蛋白质数据库(PDB;Berman等。2002年【Berman,H.M.等人(2002),《结晶学报》,D58,899-907。】)于2015年1月27日被问及以下标准:生物组装中的一条蛋白链,链长50–400个残基,分辨率≤1.8Å,R(右)因子<0.22,序列同源性<50%。检查氨基酸残基和水分子的数量,并清除不含水的条目。

2.2. 蛋白质结构的制备

结构经过处理减少(文字等。, 1999【Word,J.M.,Lovell,S.C.,LaBean,T.H.,Taylor,H.C.,Zalis,M.E.,Presley,B.K.,Richardson,J.S.&Richardsson,D.C.(1999),《分子生物学杂志》2851711-1733。】),它是摩尔概率软件(陈等。, 2010【Chen,V.B.、Arendall,W.B.、Headd,J.J.、Keedy,D.A.、Immormino,R.M.、Kapral,G.J.,Murray,L.W.、Richardson,J.S.和Richardsson,D.C.(2010),《晶体学报》,D66,12-21。】),以纠正Asn、Gln和His残基的翻转状态,并移除存在的H原子。Arg、Asp、Glu、Lys和His残基中酸碱的电离态,以及咪唑(His)和羧酸(天冬氨酸、谷氨酸)未纳入本研究。的对称相关邻域非对称单元然后通过生成单位电池和隔壁的牢房。因此单位电池向各个方向添加,在中央细胞周围添加26个细胞。为此,对性别来自的程序中央处理器4套房(优胜者等。2011年[Winn,M.D.等人(2011),《晶体学报》,第67卷,第235-242页。])已使用。修改后的性别该程序允许处理含有更多原子的结构,并标记添加到相邻单元中的原子,以便于处理。如果非对称单元包含多条蛋白质链,仅选择第一条进行分析。如果原子具有交替位置,则只考虑“A”位置。来自单位电池和来自所有细胞的水分子(单位电池再加上对称生成的相邻细胞),然后使用供应商管理部(汉弗莱等。, 1996【Humphrey,W.,Dalke,A.&Schulten,K.(1996),《分子生物学杂志》,第14期,第33-38页。】).

2.3. 距离分布

对于每个氨基酸残基通过计算任意剩余重原子在给定距离内的水分子数,处理数据集中给定类型的所有氨基酸残基,计算水分子的类型、距离分布。基于此分析,设定了提取单个水合氨基酸残基的距离截止值。

2.4. 单个氨基酸的水合作用

当残留SASA是蛋白质链的一部分时,它被计算为溶剂可接近的表面积百分比。氨基酸的二级结构使用STRIDE(步态)(弗里希曼和阿尔戈斯,1995年【Frishman,D.&Argos,P.(1995)。蛋白质,23,566-579。】)在供应商管理部(汉弗莱等。1996年【Humphrey,W.,Dalke,A.&Schulten,K.(1996),《分子生物学杂志》,第14期,第33-38页。】).STRIDE(步态)将每个残留物分配给以下二级结构之一:α-螺旋,310-螺旋线,π-螺旋,延伸(β-板)构造、隔离桥、匝或线圈(以上均不是)。侧链的构象χ1扭转角分配如下:60°,高卢人+(克+);180°,反式(t) ;300°,高卢人−(克负极). 分配给所有符合者的偏差最大为±60°。然后在选定的截止距离内,从蛋白质结构和水分子中提取单个氨基酸残基。

2.5. 构象聚类

提取的氨基酸残基及其周围的水分子与具有相同二级结构的模板残基对齐。二级结构类的分配如上所述;只有残留物在α-螺旋形或β-进一步分析了板材的二次结构。N、 CA、C和CB原子用于所有残基的比对,Gly除外,在这种情况下,使用N、CA、C、O原子。在由相同类型的残基、二级结构和χ1角度,构象聚类是使用在供应商管理部(汉弗莱等。, 1996【Humphrey,W.,Dalke,A.&Schulten,K.(1996),《分子生物学杂志》,第14期,第33-38页。】). 所有数据的平方根偏差(r.m.s.d.)氨基酸残基原子被用作QT算法的“距离函数”,截止值为0.4Å. 每个类别中最大(人口最多)的集群,即Conformer1,被选择用于后续分析。

2.6. 水合场所

对于每个类别中的Conformer1,密度表示方法(傅里叶平均;施耐德等。, 1993【Schneider,B.、Cohen,D.M.、Schleifer,L.、Srinivasan,A.R.、Olson,W.K.和Berman,H.M.(1993)。生物物理杂志65,2291-2303。】)用于寻找水化位点作为水分布的最大值。为了为伪电子密度计算设置合适的晶胞尺寸,笛卡尔空间中的最小和最大坐标(xyz公司)对每个Conformer1簇进行了测量(簇中的所有氨基酸残基以及所有相关的水分子,考虑到范德瓦尔斯半径)。然后使用中央处理器4套房(优胜者等。2011年【Winn,M.D.等人(2011),《结晶学报》,D67,235-242。】). 这允许使用峰值最大值来自的程序中央处理器4套房。然后使用反向变换“细化”水位置F类计算Schneider&Berman(1995)中描述的值【Schneider,B.&Berman,H.M.(1995),《生物物理学杂志》69,2661-2669。】)获取伪-B类作为衡量水合物分布的因素。该程序是在REFMAC公司5(穆尔舒多夫等。2011年【Murshudov,G.N.,Skubák,P.,Lebedev,A.A.,Pannu,N.S.,Steiner,R.A.,Nicholls,R.A..,Winn,M.D.,Long,F.&Vagin,A.A..(2011),《晶体学报》,D67,355-367。】)来自中央处理器4套房(优胜者等。2011年【Winn,M.D.等人(2011),《结晶学报》,D67,235-242。】). 单个水合位点的重要性是根据它们的伪占有率来估计的,伪占有率是根据之后水合位点位置的局部电子密度来计算的精炼如Schneider&Berman(1995)所述【Schneider,B.&Berman,H.M.(1995),《生物物理学杂志》69,2661-2669。】);除非另有说明,否则在进一步分析中只考虑假准确度大于0.10的水合位点。

3.结果

3.1. 分析数据集

PDB查询得到2818个蛋白质晶体结构,其中587个所选蛋白链中的212个氨基酸残基和555个667个结晶有序水分子在3.2以内所选蛋白质链的ω。尽管选择了具有相对较高晶体学分辨率的晶体结构,但所选链组中0.9的平均水与氨基酸比率的标准偏差很大,为0.3。

在下文中,我们首先讨论了所有20个标准氨基酸残基的水距离分布(图1和补充图S1)以及水合程度对残基的溶剂可及性和二级结构环境的依赖性(表1[链接]),然后在χ1扭转角(表2[链接]). 然后,我们更详细地描述了五种选定氨基酸残基(Asp、His、Thr、Trp和Tyr)的第一水合壳的结构,以及丙氨酸的水合作用,作为无阻碍主链水合作用的模型(图3和图4,补充图S2-S6和补充表S4-S10)。PDB文件格式的支持信息中提供了所有20个氨基酸残基在其主要构象状态下的几何结构及其水合位点。

表1
残基SASA和残基二级结构对水氨基酸比的依赖性

正文中详细讨论的残留物以粗体突出显示。

    南非国家安全局 二级结构
    <5% 5–30% >30% H(H) E类 T型
疏水的 阿拉 0.4 1 1.3 0.6 0.4 1.1
0.4 0.8 1.1 0.4 0.5 1
Trp公司 0.7 1.2 1.5 0.7 0.9 1.4
全部 0.4 0.9 1.2 0.4 0.5 1
中等极性 伊斯 1.1 1.6 1.9 1.5 1.3 1.7
序列号 1 1.6 2 1.5 1.4 1.7
1 1.6 2 1.3 1.5 1.6
提尔 1 1.6 1.9 1.2 1.3 1.8
全部 1 1.6 2 1.3 1.4 1.7
极性 精氨酸 1.5 2.1 2.3 2.1 2 2.4
Asn公司 1.3 2.2 2.4 2.1 1.9 2.2
天冬氨酸 1.7 2.6 2.7 2.7 2.3 2.5
格林 1.3 2.2 2.3 2 2 2.3
谷氨酸 1.7 2.5 2.5 2.3 2.4 2.6
赖氨酸 1.3 1.8 1.9 1.7 1.7 2
全部 1.5 2.3 2.3 2.2 2 2.4
所有氨基酸   0.6 1.5 2 1.2 1 1.6
†小时,α-螺旋线;E、 扩展β-板材;T、 转动。
根据Rose定义残留物类型等。(1985【Rose,G.D.,Geselowitz,A.R.,Lesser,G.J.,Lee,R.H.和Zehfus,M.H.(1985)。科学,229834-838。】).

表2
水:氨基酸比率对χ的依赖性1扭角构象(g+/克负极/t) 在各种次级结构中

正文中详细讨论的残留物以粗体突出显示。

  α-螺旋线(H) β-表(E) 转弯(T)
  + 负极 t吨 + 负极 t吨 + 负极 t吨
疏水的
0.6 0.4 0.2 0.2 0.5 0.5 1 1 0.9
Trp公司 1 0.7 0.7 0.8 1 0.8 1.3 1.4 1.4
全部 0.6 0.4 0.3 0.4 0.5 0.5 0.8 0.9 1
中等极性
伊斯 1.7 1.5 1.4 1.2 1.3 1.3 1.6 1.8 1.6
序列号 1.5 1.4 1.5 1.4 1.6 1.3 1.6 1.8 1.5
1.3 1.3 1.3 1.4 1.8 0.9 1.6 1.7 1.4
提尔 1.7 1.2 1.2 1.2 1.3 1.3 1.7 1.7 1.9
全部 1.4 1.3 1.3 1.3 1.5 1.2 1.6 1.8 1.6
极性
精氨酸 2.4 2.2 1.9 1.8 2 2 2.4 2.4 2.4
Asn公司 1.8 2.2 2 1.5 2 1.7 1.8 2.4 2.2
天冬氨酸 2.3 2.8 2.4 2.1 2.5 2.2 2.3 2.8 2.4
格林 2 2 1.9 1.8 2 2 2 2.3 2.3
谷氨酸 2.3 2.3 2.3 2.1 2.4 2.4 2.5 2.6 2.7
赖氨酸 2 1.8 1.6 1.5 1.7 1.8 2 2 2.1
全部 2.2 2.3 2 1.8 2.1 2 2.2 2.4 2.3
所有氨基酸 1.4 1.4 1.1 1.1 1.1 1.1 1.5 1.8 1.8
†根据Rose定义残留物类型等。(1985[Rose,G.D.、Geselowitz,A.R.、Lesser,G.J.、Lee,R.H.和Zehfus,M.H.(1985年),《科学》,第229834-838页。]).
†不包括Gly和Ala残基。

3.2. 水距离分布

图1[链接]显示了水与氨基酸的比率作为距离的函数(计算范围在0.1以内来自任何重原子的选定氨基酸(Ala、Asp、His、Leu、Thr、Trp和Tyr);所有20个氨基酸的分布如补充图S1所示。在所有情况下,分布显示最大值约为2.8-2.95对应于水O原子和氨基酸极性原子之间的氢键距离。毫不奇怪,带负电荷的Asp和Glu残基的最大值最强,疏水性残基的最小值,疏水性残基只能通过主链的NH和CO基团形成氢键。峰值出现在稍短的距离(~2.8侧链中含氧残基(天冬氨酸、谷氨酸、苏氨酸、丝氨酸和酪氨酸)中的氧含量高于含氮残基中的氧,精氨酸和色氨酸残基的最大值约为2.95Å. 有趣的是,His残留物的最大值为~2.85Å,它被改短了相互作用距离,可能是由于其N原子与π-咪唑环体系(Dikanov等。, 2007【Dikanov,S.,Holland,J.T.,Endeward,B.,Kolling,D.R.J.,Samoilova,R.I.,Prisner,T.F.&Crofts,A.R.(2007),《生物化学杂志》282,25831-25841。】). 侧链(Asn和Gln)中同时含有氮和氧的残基显示出双峰,与氧和氮的氢键的峰明显重叠。这些观察结果与之前的研究一致,在之前的研究中报告了类似的距离(Thanki等。, 1988【Thanki,N.、Thornton,J.M.和Goodfellow,J.M(1988),《分子生物学杂志》202、637-657。】; Kysilka和Vondrášek,2013年【Kysilka,J.和Vondrášek,J.(2013),《分子识别》,第26期,第479-487页。】). 大多数疏水残基(Cys、Ile、Leu、Met、Phe和Val)在2.9左右出现类似的峰值Å. 有趣的是,Pro、Gly和Ala的峰值高于其余疏水残基的峰值,这可能是因为它们的尺寸较小,且主链易于接近。

[图1]
图1
水分子在选定氨基酸残基周围的距离分布。

第二个峰值约为3.6-3.8φ较宽,但对大多数残基来说都很明显,对应于典型的范德瓦尔斯(vdW)相互作用距离, 囊性纤维变性。甲烷二聚体(Takatani&Sherrill,2007【Takatani,T.和Sherrill,C.D.(2007),《物理化学》,《物理》,第9卷,第6106-6114页。】). 这与Walshaw和Goodfellow的发现一致,他们报告了丙氨酸的CB原子、缬氨酸的CG1和CG2原子以及亮氨酸的CD1和CD2原子周围的水的距离分布最大,约为3.8奥(Walshaw&Goodfellow,1993)【Walshaw,J.&Goodfellow,J.M.(1993),《分子生物学杂志》,第231期,第392-414页。】). 对于一些残基(Arg、Lys、Trp、Tyr、Phe和Pro),此vdW相互作用峰的振幅与疏水残基中的氢结合峰的振幅相当。除Pro外,这些都是含有亲水端基和广泛的脂肪族(Arg和Lys)或芳香族(Tyr和Phe)CH系统的大残基x个组。图1所示的分布[链接]与陈的结果一致等。(2008【Chen,X.,Weber,I.&Harrison,R.W.(2008),《物理化学杂志》,第112期,第12073-12080页。】),他计算了105个晶体结构的水-蛋白质径向分布函数,并观察到两个最大值:第一个在半径2.75处他们将其归因于蛋白质和水之间的氢键相互作用,第二个为3.65这归因于水和非极性蛋白质原子之间的vdW相互作用,形成笼状结构。

第三个峰,大多数残留物在4.9左右可见?,可以归因于第二层壳水,类似于液态水和冰中的第二层,这在两个实验测量中都可以在相似的距离处观察到(芬尼等。, 2002【Finney,J.L.、Hallbrucker,A.、Kohl,I.、Soper,A.K.和Bowron,D.T.(2002)。《物理评论稿》88、225503。】; Gordon&Johnson负责人,2006年【Head-Gordon,T.&Johnson,M.E.(2006),美国国家科学院院刊,103,7973-7977。】)和从头算模拟(Titantah和Karttunen,2013年【Titantah,J.T.和Karttunen,M.(2013),科学报告3,2991。】). 天冬氨酸和谷氨酸残基的峰最高,表明与强第一壳峰协同作用。根据所描述的距离分布,我们选择了3.2的截止值对应于大多数氨基酸残基的氢键和vdW相关峰的最小分离。利用截止值提取单个氨基酸残基以及相关水,以进行进一步分析。

3.3. 水合作用对残余环境的依赖性

对于提取的氨基酸,我们分析了其水合作用如何取决于溶剂可及性和二级结构(表1[链接]). 在表1中[链接],残留物根据玫瑰的分类进行分组等。(1985[Rose,G.D.、Geselowitz,A.R.、Lesser,G.J.、Lee,R.H.和Zehfus,M.H.(1985年),《科学》,第229834-838页。])疏水残基包括Ala、Cys、Gly、Ile、Leu、Met、Phe、Pro、Trp和Val,中等极性残基包括His、Ser、Thr和Tyr,极性残基包括Arg、Asn、Asp、Gln、Glu和Lys。表1中以粗体突出显示了更详细讨论的残基Ala、Leu、Asp、His、Thr、Trp和Tyr[链接].

首先,我们分析了提取蛋白质链中SASA残基对水氨基酸比的依赖性。有趣的是,SASA值为5–30%和SASA值>30%时的水合作用差异很小,在极性残基组(相对数和绝对数)中的差异非常小,在疏水残基组中的差异略高。此外,即使SASA值极低(SASA小于5%),极性残留物仍保持50%以上的水合作用。这表明,氢键水合水是蛋白质的一部分,水合作用是残留物类型的特征,而不是其溶剂暴露,无论是溶剂暴露还是埋藏。它还证明了水分子深入蛋白质结构的能力,这可能对蛋白质的结构完整性以及催化功能很重要(威廉姆斯等。, 1994【Williams,M.、Goodfellow,J.M.和Thornton,J.M(1994)。蛋白质科学,1224-1235。】; Park&Saven,2005年【Park,S.&Saven,J.G.(2005)。蛋白质,60,450-463。】; 底部等。, 2006【Bottoms,C.A.、White,T.A.和Tanner,J.J.(2006)。蛋白质,64,404-421。】). 由于不同SASA水平下的水与氨基酸比率之间的差异相对较小,因此在随后的分析中对所有SASA水平的氨基酸残基进行了分析。

其次,我们分析了残基发生的二级结构类型对水与氨基酸比率的依赖性。每个氨基酸的水分子数的平均比率(在3.2以内在不同的二级结构中[α-螺旋线(H),β-表(E)和圈(T)]显示了疏水残基和极性残基的显著不同模式(表1[链接]). 在所有残基中,轮匝的水合程度最高,但尽管中等极性和高极性残基在所有分析的二级结构中具有相似的水:氨基酸比例,但疏水性残基之间的差异要大得多。Gly和Ala残基的行为与大多数其他氨基酸相似,并证明了空间不受阻碍的蛋白质主链的水合作用。一个有趣的例外是Asp,它在α-螺旋线比旋转。类似地,Glu,它只是一个CH2基团较长,水合作用类似于所有其他氨基酸残基:较少α-螺旋线比旋转。这表明氨基酸水合作用不仅取决于残基类型,还取决于残体构象所产生的特定环境。

3.4. 水合作用对残渣构象的依赖性

接下来,我们分析了水合程度如何取决于氨基酸的构象χ1扭转角,连接主链和侧链的CA-CB键周围的扭转。表2[链接]表明水合作用依赖于χ1扭转角分类为高卢人+,高卢人−或反式; 补充表S1总结了更多详细信息。水合作用不同于χ1扭转构象非常显著;在Thr_Eg的情况下,相同二级结构内的差异高达0.9水/氨基酸负极 Thr_E_t。其他较大差异涉及Asn_E_g+ Asn_E_g(Asn _ E_g)负极(相差0.5),Asn_T_g+ Asn_T_g(Asn _ T_g)负极(0.6的差值)和类似的Asp_E_g+ Asp_E_g(_g)负极(相差0.4)和Asp_T_g+ Asp_T_g(_g)负极(相差0.5)。疏水残基的相对差异最为显著,因为它们的水合物最少。例如,H_g中疏水残基的水合作用+构象是H_t构象的2.0倍。g水合作用之间的显著差异+,克负极和t的一致性χ1也观察到β-片状构象,其中最疏水的残基在E_g中更加水合负极和E_t构象比E_g构象+构象。下文针对选定的构象讨论了这些差异的可能结构解释。

3.5. 选定构象的水合位点

为了能够分析氨基酸残基周围水分子的空间分布,需要对其进行分类χ1旋转体状态。为此,我们对氨基酸残基进行了构象聚类。对于每个χ1旋转体状态和每种的二级结构类型氨基酸残基(构象类别)我们确定了人口最多的集群,表示为“Conformer1”。对于具有“turn”二级结构的残基,不能进行聚类,因为turn在主链扭转角上有很大的变化φψ补充表S2列出了每个Conformer1簇中氨基酸残基的百分比。对于大多数氨基酸残基,Conformer1代表特定氨基酸残基的很大一部分χ1旋转加速器。事实上,对于除精氨酸外的所有残留物,它代表20%或更多的观察值,对于一半以上的类别,它甚至更具代表性,占观察值的50%以上。正如预期的那样,只有一个侧链扭转角的残基(Cys、Val、Thr和Ser)以及Gly、Ala和Pro都是如此。相反的极值由Arg表示,Arg具有五个侧链扭转角,Conformer1簇的大小根据构象类别从3.8%到10.3%不等。

所有Conformer1转子分离器的配水,三个中有20个氨基酸残基χ1如施耐德所述,对旋转体状态和两种二级结构类型[正好是两个丙氨酸+两个甘氨酸+四个脯氨酸+(17×3×2)剩余氨基酸-水分布]进行傅里叶平均等。(1993【Schneider,B.、Cohen,D.M.、Schleifer,L.、Srinivasan,A.R.、Olson,W.K.和Berman,H.M.(1993)。生物物理杂志65,2291-2303。】). 伪电子密度的最大值代表水分子的首选位置,水合位点。它们的位置和伪-B类然后对因子进行细化,并根据后一个位置的伪电子密度值估计它们的伪概率精炼如Schneider&Berman(1995)所述【Schneider,B.和Berman,H.M.(1995)。生物物理杂志692661-2669。】);期间,水合物侧的位置几乎保持不变精细化。这里我们应该注意到,由于水合位置代表状态的叠加,因此假概率代表给定水合位置存在水的概率;它也可以理解为自由能超曲面局部极小值深度的度量。在这种情况下,几乎所有氨基酸中都存在定义明确的局部水合位点,这是水分分布的一个基本特征。在给定Conformer1中,通过傅里叶平均确定的水合位点的占有率总和与水:氨基酸比率相关(图2[链接]),包含晶体结构中有序和观察到的大约一半的水。因此,水合位置代表了第一水合壳水看似混沌分布的重要部分。图2中的图表[链接]还说明了疏水残基和极性残基水合作用的差异,前者的水与氨基酸比率低于0.8,后者的水与酸比率高于1.2。例外情况是Trp_H_g+和Trp_E_g负极,水与氨基酸的比值异常高,分别为1.2和1.3,而Thr_E_t的水与氨基酸比值异常低,为0.9。下文讨论了这些观察结果的可能结构解释。每个类别中水合Conformer1的坐标可在PDB文件格式的支持信息中获得;Conformer1簇中的水与氨基酸比率汇总在补充表S3中。

[图2]
图2
在20种氨基酸的Conformer1中,水合部位占用量总和与总水与氨基酸比率的相关性。疏水残基的数据点用圆圈标记,中等极性残基用三角形标记,极性残基用十字标记。决定系数R(右)2最小二乘回归的系数为0.73,直线斜率为0.47。

几个水合位点的距离,例如。那些与天冬氨酸侧链羧基相互作用的细胞明显较短,为2.4–2.6Ω,比典型氢键距离约2.8的预期值?(见图1[链接]和补充表S4–S10)。这可以归因于强的负电荷辅助氢键(Gilli&Gilli,2000【Gilli,G.和Gilli P.(2000),《分子结构杂志》552,1-15。】)由于蛋白质结构中大多数天冬氨酸残基的脱质子作用。然而,不能完全排除短距离在某种程度上也是由较轻阳离子(通常是钠或镁)与带负电荷的羧酸盐相互作用引起的。这些阳离子的相互作用距离比水-氧短,但电子密度与水-氧相似,在精炼衍射数据的处理。钠和钾等碱金属离子尤其如此,因为它们的配位球不如碱土金属离子的配位球规则(Zheng等。2008年【Zheng,H.,Chruszcz,M.,Lasota,P.,Lebioda,L.&Minor,W.(2008),《无机生物化学杂志》102,1765-1776。】). 因此,用“溶剂化位点”一词代替“水合位点”更准确地表示所有小溶剂物种(包括水和离子)的位点。

此外,我们还讨论了氨基酸水合作用构象依赖性的最有启发性的例子。根据残基的物理化学性质及其Conformer1簇的大小,我们在α-螺旋形和β-用于此详细分析的片状构象。此外,我们还讨论了丙氨酸的水合作用作为蛋白质主链水合作用的模型,以及亮氨酸作为典型疏水性脂肪族氨基酸的水合模型。图3显示了所选残留物最密集构象周围的水密度分布和相应的水合位置[链接]和4[链接]和补充图S2–S6。补充表S4-S10列出了详细分析的所有构象水合位点的几何特征。Conformer1簇的水化程度(见补充表S3)与χ1类别(见表2[链接]),表明Conformer1代表给定类别的水合作用。因此,构象簇合使得可以探索不同氨基酸构象不同水合水平背后的可能结构原因,如下所述。

[图3]
图3
Ala构象的水合位点()α-螺旋形和(b条)扩展β-板材二级结构。水合位点的位置显示为球体,并标记其占用率和到最近极性原子的距离。α-螺旋构象用网格在每种氨基酸0.10水的占有率水平上绘制水的分布轮廓。β-床单构造它的轮廓在0.04和0.08的占用水平。
3.5.1. 丙氨酸的水合作用(图3[链接]和补充表S4)

这个α-螺旋构象显示出有序的水合结构,主链氮和羰基各有一个局部水合位点。羰基位点很强,占0.38。水化结构β-片状构象完全不同:水分布在两个紧密定位的主链极性基团之间,所有水合位点都很弱,最强的是氮的水合位点,占据率为0.09,呈细长形状。羰基O原子周围的水分布形成了一个部分无序的环状结构,具有两个弱水合位点。羰基水合作用的这种构象依赖性,以及下文讨论的其他残基的特定侧链相互作用,可能解释了先前研究中观察到的肽键周围水分子的复杂分布(Matsuoka&Nakasako,2009)【Matsuoka,D.和Nakasako,M.(2009)。物理化学杂志B,11311274-11292。】).

3.5.2. 天冬氨酸水合作用(图4[链接]和补充表S5)

两者中主链氮的水合位置α-螺旋形和β-片状构象与相应的Ala构象具有相似的几何参数。然而,它们的占用率在异构体之间有所不同:而在Asp_E_g中+氮的水合位置在Asp_Eg中占有率低负极它的占有率为0.25,可能是由于侧链OD2原子的几何位置,这使得能够同时与两个原子形成氢键。类似地,N和OD1原子在Asp_H_g中共享一个强水合位点+.在Asp_H_g中负极,主链氮水合位点中的水可以与侧链的羧基相互作用通过职业健康–π互动。

[图4]
图4
天冬氨酸构象物的水合位点:()Asp_Hg(_g)+, (b条)Asp_Hg(_g)负极, (c(c))Asp_H_t(d日)Asp_E_g(_g)+, (e(电子))Asp_E_g(_g)负极和((f))Asp_E_t。水合位点的位置显示为球体,其占有率和到最近极性原子的距离被标记,以及其他接触,如OH–π与羧基(Asp_Hg)的相互作用负极andn Asp_E_t)和侧链和主链之间的桥(Asp_H_g+、Asp_H_t和Asp_E_g负极). 使用网格以0.10的占用水平绘制配水曲线。

主链羰基的水合位点具有与相应的Ala构象类似的几何形状和占有率。所有三种螺旋构象的占用率都很高(~0.20或更高);Asp_H_t中O与侧链OD1原子共享水合位点。相反,O水合作用在延长时间内较弱(~0.10或更低)β-薄板构造。在Asp_E_t中,羰基水合位点的水可以与侧链的羧基相互作用通过职业健康–π互动。

天冬氨酸侧链OD1和OD2原子水合不均。在除Asp_H_g以外的所有考虑的构象中+OD2原子有两个水合位点,都位于羧基平面内,与先前研究中报道的Asp水合位点一致(Roe&Teeter,1993【Roe,S.M.和Teeter,M.M.(1993),《分子生物学杂志》229,419-427。】; Matsuoka&Nakasako,2009年【Matsuoka,D.和Nakasako,M.(2009),《物理化学杂志》,第113期,第11274-11292页。】). OD2的水合位点与主链没有相互作用。相反,OD1原子也可能具有位于羧基平面外的水合位点,这些水合位点通常(但并不总是)与主链极性原子相互作用。这些非平面水合位置很重要,其占有率高达0.20,但在之前的研究中尚未观察到(Roe&Teeter,1993【Roe,S.M.和Teeter,M.M.(1993),《分子生物学杂志》229,419-427。】; Matsuoka&Nakasako,2009年【Matsuoka,D.和Nakasako,M.(2009),《物理化学杂志》,第113期,第11274-11292页。】). Asp_H_g中水合位点的更多数量和占有率负极和Asp_E_g负极与其他构象相比,构象对应着其整体较高的水合作用(见表2[链接]).

3.5.3. His的水合作用(补充图S2和补充表S6)

主链N原子的水合位点仅在延伸的β-床单他的同类。它们的几何参数与β-Ala的片状构象,His_E_g中的水合位点除外+,其具有不同的位置,这可能是由于与ND1原子的额外的平面外相互作用。主羰基的水合位点在α-螺旋状His构象,以及在His_E_t中,水合位置通过额外的非常短的(3.38ω)与CD2的碳-供体氢键。与CD2原子类似的碳-供体氢键也能稳定His_H_g中两个主要羰基水合位点之一+His_H_g中的另一个主要羰基水合位点+,这是一个较强的位点,其位置类似于在Ala_H中观察到的位置,并且不通过任何桥接相互作用而稳定。在His_H_g中负极羰基水合位点也与侧链ND1原子相互作用。

在所有六种考虑的组氨酸构象体中都观察到两个强侧链水合位点。ND1和NE2水合位置都很强(占用率~0.30–0.35);ND2站点通常更强。His_E_g中ND1位点的氢键距离+His_H_t非常短,为2.52Å. 有趣的是,在这两种构象中,ND1原子也与主链水合位点相互作用通过Stollar描述的离面相互作用等。(2004【Stollar,E.J.、Gelpí,J.L.、Velankar,S.、Golovin,A.、Orozco,M.和Luisi,B.F.(2004)。蛋白质,57,1-8。】).

3.5.4. 亮氨酸水合作用(图S3和补充表S7)

在六个构象中的三个构象(两个构象)中观察到了主链氮的水合作用β-表和一个α-螺旋形);水合位点与相应的丙氨酸构象相似。仅在两种情况下观察到主链羰基的水合作用α-螺旋构象;水合位置与丙氨酸的位置一致,但其占有率是可变的,从Leu_H_g的0.43开始+在Leu_H_t中低于0.10。有趣的是注意到水合位点的立体化学和占有率是如何对应于侧链旋转体状态的:在疏水侧链远离水合位点(Leu_H _g+; 补充图S3),而水化侧占用率较低(Leu_H_g负极; 补充图S3b条)或完全没有水合位置(Leu_H_t;补充图S3c(c))在旋转床中,水合位置和侧链之间的距离较短。

3.5.5. 苏氨酸水合(补充图S4和补充表S8)

主链氮的水合位点仅在Thr_H_t和Thr_E_g中观察到负极,两者都接近于相应丙氨酸构象型中水合位点的位置。在所有螺旋构象和β-仅在Thr_E_g中的板材一致性负极; 所有这些水合位点的位置与丙氨酸的位置相似。Thr_H_t羰基的水合位点与侧链OG1原子共用。

侧链OG1原子通常由两到三个水合位点包围,CA-CB-OG1-W扭转角约为±90和180°;±90°的水合位点经常与主链相互作用,例如。Thr_Eg中非常强的水合位点负极入住率为0.45的酒店就在附近(3.45Å),或更具体地在OH–π与前一残基的肽键的相互作用。在Thr_H_g中负极在0°左右观察到Thr_H_t Conformer1簇水合位点,二者都通过与主链的额外接触而稳定。因此,在几乎所有分析的构象中,至少有一个水合位点桥接侧链和主链。

值得注意的是,Thr_E_g负极与其他Thr构象相比,两个主链水合位点和一个非常强的侧链水合部位都被分解的构象也具有更高的水:氨基酸比率(见表2[链接]和补充表S3)。相反,在Thr_E_t构象体中,侧链甲基的疏水性质接近两个主链极性基团,可能导致水与主链相互作用的倾向降低,从而导致Thr_E_t中异常低的水合作用。

3.5.6. Trp的水合作用(补充图S5和补充表S9)

主链的水合物是可变的。在六个构象中的四个构象上观察到了氮水合位点,其位置与相应丙氨酸构象中观察到的位置一致。在两种情况下,Trp_E_g负极和Trp_H_g+其中氮水合位点也可以与侧链CD1原子相互作用通过作为碳-供体氢键,水合位点占有率很高(分别为0.45和0.53)。这些高占有率水合位点解释了这两种Trp构象异常高的水:氨基酸比率(见表2[链接]). 主链羰基的水合位置在两个α-螺旋构象,Trp_Hg+和TrpH_t,两者的位置类似于丙氨酸羰基水合位点,并且都与侧链有额外的相互作用。在Trp_H_t的情况下,羰基水合位点与侧链NE1原子相互作用通过离机交互(Stollar等。, 2004【Stollar,E.J.、Gelpí,J.L.、Velankar,S.、Golovin,A.、Orozco,M.和Luisi,B.F.(2004)。蛋白质,57,1-8。】);在Trp_H_g的情况下+它相互作用通过碳原子氢键(Petrella&Karplus,2004【Petrella,R.J.和Karplus,M.(2004)。蛋白质,54,716-726。】)与CE3原子(尽管距离相对较长,为4.5哦,水合位点正好位于侧链的平面上)。

与可变主链水合作用相比,Trp侧链NE1原子的水合作用在所有分析的Conformer1簇中的占据率(0.23到0.36之间)和几何参数方面都非常相似。

3.5.7. Tyr的水合作用(补充图S6和补充表S10)

主链N原子的水合位点在所有构象中被解析,其位置通常与相应的Ala构象一致;Tyr_Hg是例外负极没有水合位点和Tyr_E_g+侧链的空间排斥使水合位点发生偏转。水合位点中的水可以与苯环相互作用通过职业健康–π互动。在Tyr_H_g中观察到非常紧密的接触(碳-供体氢键)+在氮水合位点和侧链的CD2原子之间。

主链羰基水合位点在所有螺旋Tyr构象中都被分解,但只有一个β-片状构象,Tyr_E_t。它们的位置与相应Ala构象中的位置相似,但Tyr_H_g除外+,其中水合位置正好位于苯基环平面,其位置由碳-氢键稳定。所有观察到的羰基水合位点都与侧链接触通过碳原子氢键或通过职业健康–π互动。

在所有六个分析的酪氨酸构象中,侧链OH原子被两个水合位点水合,这两个水合物都位于苯基环平面上。有趣的是,这两个位置并不完全对称;在大多数情况下,W-OH-CZ-CE1扭转角为0°左右的水化位置较短相互作用距离在180°角时比水合场地低,占用率略低(平均0.260.24).

4.讨论

在本研究中,我们研究了结晶有序水的数量和立体化学如何依赖于氨基酸构象和环境。我们的假设是,不同的残基构象具有特定的水合模式,这是由水分子与多个水分子同时相互作用引起的功能群残留物。因此,我们预计残留物的二级结构和侧链旋转体状态会影响水合位点的首选位置。我们还对水合作用对残余溶剂可及性的依赖性感兴趣。我们从PDB中选择了一组2818个分辨率良好的单体蛋白质结构,并计算了水分子在所有20个标准氨基酸残基周围的距离分布。分布的第一个最大值介于2.80和2.95之间?(见图1和补充图S1)。大多数水分子可以归因于与主链和侧链极性蛋白质原子的氢键相互作用。第二个峰值出现在~3.8Ω,对应于典型的范德瓦尔斯距离。这两个峰值之间的最小值约为3.2–3.3所有残留物均为。因此,值为3.2在随后的所有分析中,选择了?作为截止距离。

我们观察到残留物的水合作用对其SASA的依赖性小得惊人。SASA大于30%的残基和SASA在5%和30%之间的残基中的水与氨基酸比率相似(见表1[链接]). 此外,在极性较高的残留物中,当SASA值低于5%时,也保留了很大一部分水合作用。这表明,水分子在很大程度上与这些极性残基是不可分割的,因为自由能对完全去溶剂化会太高。

水合程度及其立体化学取决于二级结构氨基酸残基发生。此外,还观察到极性残基和疏水残基的水合程度有不同的趋势α-螺旋形,延伸β-薄板和回转二级结构(见表1[链接]). 对于极性残基,在不同二级结构残基的水与氨基酸比率之间仅观察到微小差异,而对于疏水性残基来说,二级结构的转角水合物大约是二级结构水合物的两倍α-螺旋线和β-表。这再次表明,极性残基的水合作用是残基本身的一个特征,而疏水残基的水化作用取决于结构背景。

水合作用还取决于残留物的构象,特别是其旋转体状态χ1扭转角(见表2[链接]). 我们观察到χ1在Thr_E_g的情况下,每个氨基酸高达0.9水的扭转构象负极 Thr_E_t;水化作用的显著差异χ1还观察到Phe、Asn和Asp残基的构象。

为了检查氨基酸残基周围水分子的空间分布,并从结构上解释观察到的差异,残基必须在构象上聚集在它们之外χ1扭转角度。为此,使用QT算法对残基进行聚类,以r.m.s.d.作为残基、其二级结构和χ1角度。在每个类别中最大的构象簇中(见补充表S2),水的分布通过傅里叶平均(施耐德等。, 1993[Schneider,B.,Cohen,D.M.,Schleifer,L.,Srinivasan,A.R.,Olson,W.K.和Berman,H.M.(1993),《生物物理杂志》第65期,第2291-2303页。]). 然后将水合位点确定为密度分布中的最大值;坐标和占用在PDB文件格式的支持信息中提供。

对七种代表性氨基酸残基的结果进行了详细分析(见图3[链接]和4[链接],补充图S2–S6和补充表S3–S10)。它们显示出很好的局部孤立水合位点,但也经常出现由主链和侧链蛋白质原子共享的水合位点。我们还观察到同一残余物类型的不同构象的不同水合位点位置和占有率不同,并描述了几种典型接触较少的水合位点的出现,如碳氢键、OH–π芳香杂原子的相互作用和离面相互作用。构象依赖性和稳定主链水合作用的特定侧链相互作用的作用也可以解释之前观察到的水分子在肽键周围的重叠分布(Matsuoka&Nakasako,2009【Matsuoka,D.和Nakasako,M.(2009),《物理化学杂志》,第113期,第11274-11292页。】).

我们的方法的局限性是越来越多的构象状态,带有较长侧链的残基可以细分为这些构象状态。对于侧链较短的残基,最大的簇代表大多数残基。在这种情况下,这里使用的六个类别足以描述α-螺旋和延伸β-板材次级结构。然而,随着侧链的延长和可能的扭角组合数量的增加,最大簇所代表的异构体的百分比迅速下降。一个极端的例子是精氨酸,具有五个侧链扭转角,其中六种构象类别中最大簇的大小在4%到10%之间。另一方面,精氨酸和赖氨酸等残基中的侧链和主链极性原子之间的距离越大,其水合位点之间的相互影响越小。因此,如其他研究(Matsuoka&Nakasako,2009)中所述,对主链和侧链水合作用进行了独立描述【Matsuoka,D.和Nakasako,M.(2009),《物理化学杂志》,第113期,第11274-11292页。】),对这些残留物来说更为合理。

由于主链扭转角变化很大,因此必须通过构象对残基进行聚类,这也阻止了我们将这种方法应用于被归类为转向二级结构的残基。这当然是一个主要缺点,因为正如我们自己的统计分析(见表1)所示,这种类型的二级结构是最水合的[链接]). 然而,可以设想不同的聚类方案,其中考虑到几个顺序相邻的残基,并根据它们的整体构象类别进行聚类,例如肽块(约瑟夫等。, 2010[Joseph,A.P.,Agarwal,G.,Mahajan,S.,Gelly,J.C.,Swapna,L.S.,Offmann,B.,Cadet,F.,Bornot,A.,Tyagi,M.,Valadié,H.,Schneider,B.,Etchebest,C.,Srinivasan,N.&De Brevern,A.G.(2010),《生物物理学》,第2版,第137-147页。]). 这种方法可以区分不同类型的转向,从而解决其特定的水合模式。

因此,未来的挑战是结合不同的聚类方法,并开发可靠的能量函数,该函数可以真实可靠地描述任何几何构型中蛋白质和水合水之间的相互作用,例如将蛋白质或药物装配到DNA螺旋(Ge等。, 2005【Ge,W.,Schneider,B.&Olson,W.K.(2005),《生物物理杂志》88,1166-1190。】). 实证研究有助于发展结构生物信息学领域的计算方法,如蛋白质结构预测(Papoian等。, 2004【Papoian,G.、Ulander,J.、Eastwood,M.P.、Luthey-Schulten,Z.和Wolynes,P.G.(2004)。美国国家科学院院刊,101,3352-3357。】; 等。, 2005[Jiang,L.,Kuhlman,B.,Korteme,T.&Baker,D.(2005).蛋白质,58893-904.]),预测蛋白质与配体的相互作用(De Beer等。, 2010【De Beer,S.B.A.,Vermeulen,N.P.E.&Oostenbrick,C.(2010),《当前顶尖医学化学》第10期,第55-66页。】)和其他生物分子(布埃诺等。, 2010【Bueno,M.、Temiz,N.A.和Camacho,C.J.(2010)。蛋白质,78,3226-3234。】)和蛋白质-蛋白质对接(Kastritis等。, 2013【Kastritis,P.L.、Visscher,K.M.、van Dijk,A.D.J.和Bonvin,A.M.J.(2013)。蛋白质,81,510-518。】; Parikh&Kellogg,2014年【Parikh,H.I.&Kellogg,G.E.(2014),《蛋白质》,82,916-932。】). 我们认为蛋白质中氨基酸残基的构象特异性水合作用也可以用于在晶体结构中更准确地放置水精炼和验证(Matsuoka&Nakasako,2013【Matsuoka,D.和Nakasako,M.(2013),《化学物理》419,59-64。】)以及在MD模拟的准备过程中预测蛋白质周围有序水分子的位置(Wallnoefer等。2011年【Wallnoefer,H.G.,Liedl,K.R.&Fox,T.(2011),《化学信息杂志》,模型51,2860-2867。】). 经验确定的水合位点也有助于理解大量有序的水分子的作用,在蛋白质-蛋白质或蛋白质-DNA界面上观察到的热振动极小(Schneider等。, 2014【Schneider,B.,Gelly,J.-C.,de Brevern,A.G.&Choern,J.(2014),《水晶学报》第70期,第2413-2419页。】).

总之,我们认为,考虑到二级结构和侧链构象的依赖性,我们的研究代表了迄今为止最复杂的蛋白质水合模型。我们已经证明了相同的不同构象氨基酸残基由于水分子通常与多个水分子相互作用,因此可以具有显著不同的水合模式功能群水合模式还取决于氨基酸发生的二级结构。

支持信息


致谢

作者感谢中科院生物技术研究所的JiříChern博士提供了性别本研究中使用的程序。本研究在中科院生物技术研究所(RVO:86652036)进行,得到了ERDF项目BIOCEV CZ.1.05/1.1.00/02.0109和捷克科学基金会(GA CR)P205/12/P729号拨款的支持。非常感谢使用MetaCentrum(LM2010005)的计算和存储设施。

工具书类

第一次引用Ahmed,M.H.、Spyrakis,F.、Cozzini,P.、Tripathi,P.K.、Mozzarelli,A.、Scarsdale,J.N.、Safo,M.和Kellogg,G.E.(2011年)。公共科学图书馆一号,6,e24712交叉参考 公共医学 谷歌学者
第一次引用Auffinger,P.&Hashem,Y.(2007年)。生物信息学,23, 1035–1037. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Baldwin,R.L.(2014)。程序。国家科学院。科学。美国,111, 13052–13056. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用H.M.伯曼。等。(2002).阿克塔·克里斯特。D类58, 899–907. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Bottoms,C.A.、White,T.A.和Tanner,J.J.(2006)。蛋白质,64, 404–421. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Bueno,M.、Temiz,N.A.和Camacho,C.J.(2010年)。蛋白质,78, 3226–3234. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Busch,S.、Bruce,C.D.、Redfield,C.、Lorenz,C.D.和McLain,S.E.(2013)。安圭。化学。国际编辑。 52, 13091–13095. 交叉参考 中国科学院 谷歌学者
第一次引用Bye,J.W.、Meliga,S.、Ferachou,D.、Cinque,G.、Zeitler,J.A.和Falconer,R.J.(2014)。《物理学杂志》。化学。A类,118,83–88交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Chalikian,T.V.(2008)。《物理学杂志》。化学。B类,112, 911–917. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Chen,V.B.、Arendall,W.B.、Headd,J.J.、Keedy,D.A.、Immormino,R.M.、Kapral,G.J.,Murray,L.W.、Richardson,J.S.和Richardsson,D.C.(2010)。阿克塔·克里斯特。D类66, 12–21. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Chen,X.、Weber,I.和Harrison,R.W.(2008)。《物理学杂志》。化学。B类,112, 12073–12080. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Chong,S.-H.&Ham,S.(2014)。安圭。化学。国际编辑。 53, 3961–3964. 交叉参考 中国科学院 谷歌学者
第一次引用Combet,S.和Zanotti,J.-M.(2012年)。物理学。化学。化学。物理。 14,4927–4934交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Cui,G.、Swails,J.M.和Manas,E.S.(2013年)。化学杂志。理论计算。 9, 5539–5549. 交叉参考 中国科学院 谷歌学者
第一次引用De Beer,S.B.A.、Vermeulen,N.P.E.和Oostenbrick,C.(2010年)。货币。顶部。医药化学。 10, 55–66. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Dikanov,S.、Holland,J.T.、Endeward,B.、Kolling,D.R.J.、Samoilova,R.I.、Prisner,T.F.和Crofts,A.R.(2007)。生物学杂志。化学。 282, 25831–25841. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Finney,J.L.、Hallbrucker,A.、Kohl,I.、Soper,A.K.和Bowron,D.T.(2002年)。物理学。修订稿。 88, 225503. 交叉参考 公共医学 谷歌学者
第一次引用Flanagan,K.、Walshaw,J.、Price,S.L.和Goodfellow,J.M.(1995)。蛋白质工程。 8, 109–116. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Frauenfelder,H.、Chen,G.、Berendzen,J.、Fenimore,P.W.、Jansson,H.,McMahon,B.H.、Stroe,I.R.、Swenson,J.&Young,R.D.(2009)。程序。国家科学院。科学。美国,106, 5129–5134. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Frishman,D.&Argos,P.(1995)。蛋白质,23, 566–579. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Ge,W.,Schneider,B.&Olson,W.K.(2005)。生物物理学。J。 88, 1166–1190. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用吉利·G·和吉利·P·(2000)。J.分子结构。 552, 1–15. 科学网 交叉参考 中国科学院 谷歌学者
第一次引用Goodfellow,J.M.、Thanki,N.和Thornton,J.M(1993)。水和生物大分子由E.Westhof编辑。伦敦:CRC出版社。 谷歌学者
第一次引用Halle,B.(2004)。菲洛斯。事务处理。R.Soc.B生物。科学。 359, 1207–1224. 交叉参考 中国科学院 谷歌学者
第一次引用Halle,B.和Persson,F.(2013年)。化学杂志。理论计算。 9, 2838–2848. 交叉参考 中国科学院 谷歌学者
第一次引用Head-Gordon,T.&Johnson,M.E.(2006年)。程序。国家科学院。科学。美国,103,7973–7977公共医学 中国科学院 谷歌学者
第一次引用Hu,B.和Lill,M.(2014)。J.计算。化学。 35, 1255–1260. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Humphrey,W.、Dalke,A.和Schulten,K.(1996)。J.摩尔图。 14, 33–38. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Jiang,L.,Kuhlman,B.,Korteme,T.&Baker,D.(2005)。蛋白质,58, 893–904. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Joseph,A.P.,Agarwal,G.,Mahajan,S.,Gelly,J.C.,Swapna,L.S.,Offmann,B.,Cadet,F.,Bornot,A.,Tyagi,M.,Valadié,H.,Schneider,B.,Etchebest,C.,Srinivasan,N.&De Brevern,A.G.(2010)。生物物理学。版次。 2, 137–147. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Kastritis,P.L.、Visscher,K.M.、van Dijk,A.D.J.和Bonvin,A.M.J.(2013)。蛋白质,81,510–518交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Kysilka,J.和Vondrášek,J.(2013)。J.分子识别。 26, 479–487. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Makarov,V.、Pettitt,B.M.和Feig,M.(2002)。Acc.Chem.化学。物件。 35, 376–384. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Maruyama,Y.和Harano,Y.(2013年)。化学。物理学。莱特。 581, 85–90. 交叉参考 中国科学院 谷歌学者
第一次引用Matsuoka,D.和Nakasako,M.(2009年)。《物理学杂志》。化学。B类,113, 11274–11292. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Matsuoka,D.和Nakasako,M.(2013)。化学。物理。 419, 59–64. 交叉参考 中国科学院 谷歌学者
第一次引用Morris,A.S.、Thanki,N.和Goodfellow,J.M.(1992年)。蛋白质工程。。 5, 717–728. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Murshudov,G.N.、Skubák,P.、Lebedev,A.A.、Pannu,N.S.、Steiner,R.A.、Nicholls,R.A、Winn,M.D.、Long,F.&Vagin,A.(2011)。阿克塔·克里斯特。D类67, 355–367. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Niimura,N.&Bau,R.(2008)。阿克塔·克里斯特。A类64, 12–22. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Nucci,N.V.、Pometun,M.S.和Wand,A.J.(2011年)。自然结构。分子生物学。 18, 245–249. 交叉参考 中国科学院 谷歌学者
第一次引用Papoian,G.、Ulander,J.、Eastwood,M.P.、Luthey-Schulten,Z.和Wolynes,P.G.(2004)。程序。国家科学院。科学。美国,101, 3352–3357. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Parikh,H.I.&Kellogg,G.E.(2014)。蛋白质,82, 916–932. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Park,S.&Saven,J.G.(2005)。蛋白质,60, 450–463. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Petrella,R.J.和Karplus,M.(2004)。蛋白质,54, 716–726. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Pitt,W.R.、Murray-Rust,J.和Goodfellow,J.M.(1993)。J.计算。化学。 14,1007–1018交叉参考 中国科学院 谷歌学者
第一次引用Ramirez,U.D.、Focia,P.J.和Freymann,D.M.(2008)。阿克塔·克里斯特。D类64, 1043–1053. 交叉参考 IUCr日志 谷歌学者
第一次引用Reichmann,D.、Phillip,Y.、Carmi,A.和Schreiber,G.(2008)。生物化学,47, 1051–1060. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Roe,S.M.和Teeter,M.M.(1993)。分子生物学杂志。 229, 419–427. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Roh,J.H.、Curtis,J.E.、Azzam,S.、Novikov,V.N.、Peral,I.、Chowdhuri,Z.、Gregory,R.B.和Sokolov,A.P.(2006年)。生物物理学。J。 91, 2573–2588. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Rose,G.D.、Geselowitz,A.R.、Lesser,G.J.、Lee,R.H.和Zehfus,M.H.(1985年)。科学类,229,834–838页交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Schneider,B.和Berman,H.M.(1995)。生物物理学。J。 69, 2661–2669. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Schneider,B.、Cohen,D.M.、Schleifer,L.、Srinivasan,A.R.、Olson,W.K.和Berman,H.M.(1993)。生物物理学。J。 65, 2291–2303. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Schneider,B.,Gelly,J.-C.,de Brevern,A.G.&Chern,J.(2014)。阿克塔·克里斯特。D类70, 2413–2419. 交叉参考 IUCr日志 谷歌学者
第一次引用Schneider,B.、Patel,K.和Berman,H.M.(1998)。生物物理学。J。 75, 2422–2434. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Setny,P.、Baron,R.、Kekenes-Huskey,P.M.、McCammon,J.A.和Dzubiella,J.(2013)。程序。国家科学院。科学。美国,110, 1197–1202. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Stollar,E.J.、Gelpí,J.L.、Velankar,S.、Golovin,A.、Orozco,M.和Luisi,B.F.(2004)。蛋白质,57, 1–8. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Takano,K.、Yamagata,Y.和Yutani,K.(2003)。蛋白质工程。 16, 5–9. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Takatani,T.&Sherrill,C.D.(2007年)。物理学。化学。化学。物理。 9, 6106–6114. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Thanki,N.、Thornton,J.M.和Goodfellow,J.M(1988)。分子生物学杂志。 202, 637–657. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Titantah,J.T.和Karttune,M.(2013年)。科学。代表。 3, 2991. 交叉参考 公共医学 谷歌学者
第一次引用Wallnoefer,H.G.、Liedl,K.R.和Fox,T.(2011)。化学杂志。Inf.模型。 51, 2860–2867. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Walshaw,J.和Goodfellow,J.M.(1993)。分子生物学杂志。 231, 392–414. 交叉参考 中国科学院 公共医学 科学网 谷歌学者
第一次引用Williams,M.、Goodfellow,J.M.和Thornton,J.M(1994)。蛋白质科学。 3, 1224–1235. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Winn医学博士。等。(2011).阿克塔·克里斯特。D类67, 235–242. 科学网 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Word,J.M.,Lovell,S.C.,LaBean,T.H.,Taylor,H.C.,Zalis,M.E.,Presley,B.K.,Richardson,J.S.&Richardsson,D.C.(1999)。分子生物学杂志。 285, 1711–1733. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Yang,L.、Dordick,J.S.和Garde,S.(2004)。生物物理学。J。 87, 812–821. 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Zhang,L.,Wang,L.、Kao,Y.-T.、Qiu,W.、Yang,Y.、Okobiah,O.和Zhong,D.(2007)。程序。国家科学院。科学。美国,104, 18461–18466. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Zhang,L.,Yang,Y.,Kao,Y.-T.,Wang,L.&Zhong,D.(2009)。美国化学杂志。Soc公司。 131,10677–10691交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Zheng,H.、Chruszcz,M.、Lasota,P.、Lebioda,L.和Minor,W.(2008年)。无机生物化学杂志。 102, 1765–1776. 科学网 交叉参考 公共医学 中国科学院 谷歌学者
第一次引用Zheng,M.、Li,Y.、Xiong,B.、Jiang,H.和Shen,J.(2013)。J.计算。化学。 34, 583–592. 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Zhong,D.、Pal,S.K.和Zewail,A.H.(2011)。化学。物理学。莱特。 503, 1–11. 交叉参考 中国科学院 谷歌学者

这是一篇根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标生物
结晶学
国际标准编号:1399-0047