跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
科学。作者手稿;2018年10月17日PMC发布。
以最终编辑形式发布为:
PMCID公司:PMC6192703型
NIHMSID公司:美国国立卫生研究院991708
PMID:29439243

低复杂性蛋白质片段的原子结构揭示了组装网络的扭结β片

关联数据

补充资料

摘要

亚细胞无膜组装是生物学中一个新的研究领域,对这些组装中的低复杂性蛋白质结构域之间的作用力进行了热烈的科学讨论。为了阐明这些力,我们确定了与无膜组装相关的五段蛋白质低复杂度结构域的原子结构。它们的共同结构特征是节段堆叠成扭结的β-片,这些β-片配对成原丝。与淀粉样纤维的立体拉链不同,扭结的片材通过极性原子和芳香侧链进行弱相互作用。通过对人类蛋白质组在扭曲结构上的计算线程,我们确定了数百个可能能够形成这种相互作用的低复杂性片段。这些片段存在于诸如RNA结合物、核孔蛋白和角蛋白等多种蛋白质中,这些蛋白质形成网络并定位于无膜组装体。

一句话总结:

穿线揭示了人类蛋白质组中数百个低复杂性片段,能够形成扭结的多价原丝。

无膜细胞器,如P小体、核副啄和应激颗粒(SG),在哺乳动物细胞中形成并重新溶解以响应刺激(1,2). 这种相分离是能够相互多价相互作用的大分子的一种特性,产生的液相浓度是大分子整体液相浓度的约100倍(,4). 这种相分离通常见于结合核酸并包含低复杂性结构域(LCD)的蛋白质(1,2,5——8). 例如,SG相关蛋白hnRNPA1、hnRNPA2和FUS进行液-液相分离(9——12)它们含有液晶显示器,可以随着时间的推移或在较高的蛋白质浓度下转变为可逆的半固态水凝胶(1,5,9). 液晶显示器在人类蛋白质组中很常见;它们基本上是内在无序的(13),在已知3D结构的蛋白质数据库(PDB)中表现严重不足(14)。

电子显微镜显示这种水凝胶含有蛋白质原纤维,水凝胶的X射线衍射产生交叉β图案(图S1C-E)(5,15)让人想起淀粉样蛋白。然而,在FUS水凝胶中发现的纤维对热和SDS敏感(5)淀粉样纤维抵抗SDS和煮沸变性。淀粉样纤维的棘含有一对紧密结合的β-片,沿着纤维轴排列。残基侧链与相对β-片的侧链紧密交叉,形成称为立体拉链的干燥界面,如淀粉样β(aβ)的NKGAII结构所示(图1A)(16,17). 立体拉链解释了一些致病性淀粉样蛋白的非凡稳定性。显然,水成蛋白之间相对不稳定的多价相互作用是不同的;虽然重要的是,ssNMR已经表明,FUS的214个残基LCD中有57个形成了有序的原丝核,其余残基动态无序(18)。

保存图片、插图等的外部文件。对象名称为nihms-991708-f0001.jpg
LARKS(B-F)的结构与立体拉链(a)相比。

所有结构由两个配对的β-片组成,一个紫色,另一个黄色。左栏显示了配对床单的主干线,以突出LARKS主干线中的扭结和立体拉链中经典β-床单的褶皱。第二列显示了从原纤维轴向下观察的配合片的原子结构。第三栏显示了几乎垂直于纤维轴的配对β-片的卡通。每个界面的特征是形状互补得分(Sc=1.0表示完全互补)和匹配片之间的埋藏溶剂可及表面积(Ab)(单位:Au²)。碳原子呈紫色或黄色,氮原子呈蓝色,氧原子呈红色。晶体中成千上万的β片中显示出五层β片。LARKS的扭结结构在交配β片中很少见;几十个其他成对的β-板形成立体拉链(35)。

为了研究SG蛋白的液晶显示器之间相对较弱的粘附性,我们寻找了相关的原子结构。以FUS和RBM14液晶显示器的研究为指导,研究表明,酪氨酸残基被丝氨酸连续替换会降低其形成水凝胶的能力(1,5),我们扫描了FUS的LCD,寻找形式为[G/S]Y[G/S]的串联序列基序,发现了两个这样的片段:FUS-37系统42和FUS-54SYSSYGQS系统61(图S1A). 除了通过3D分析确定的其他三个片段的结构外,还确定了两个片段结晶为微米级针状物,并确定了两种原子结构(见下文):243GYNGFG公司248来自蛋白质hnRNPA1,77STGGYG公司82来自FUS,以及116GFGNFGTS公司123从nup98(图1). 为了证实这些结构与液晶显示器的粘附性和多价性的相关性,一种水凝胶是由连接FUS上述三个片段的26个残基合成肽构建物形成的(图2). 所有5个晶段、该水凝胶和FUS-LCD水凝胶的粉末衍射模式表明它们都具有交叉β结构(图S2-3)。

保存图片、插图等的外部文件。对象名称为nihms-991708-f0002.jpg
合成LARKS构建物形成不稳定水凝胶。

带有序列的合成LARKS构造SYSGYS公司GDT公司SYSSYGQS系统天然气发电厂STGGYG公司当以50mg/ml溶解在水中并在4°C下放置过夜时,会形成不稳定的水凝胶。水凝胶在将样品加热至60°C两小时后融化。将气泡(蓝色箭头)引入样品中,以显示液体状态(气泡上升)和水凝胶状态(气泡不上升)之间的差异。电子显微镜证实纤维确实熔化了。这个三重LARKS序列的水凝胶形成特性表明,正是在许多液晶显示器中发现的多重LARKS赋予了它们形成水凝胶的不同寻常的特性。比例尺等于200nm。

所有五段结晶为扭结β-片对(图1). 每一个β-片都是晶体的长度,由大约300000个片段堆积而成,所有结构都在甘氨酸或芳香族残基处出现扭结,而不是延伸(图S4). 这些结构具有共同的粘合特征,包括与下面相同的部分对齐的氢键(图1B-F,图S5). 无论是片间稳定还是片内稳定,芳香族残基都占主导地位。在片状物中,芳香侧链以能量上有利的构象堆积,环的平面平行堆积,间距为3.4º(19——21)(图S5). 这些芳香“阶梯”增强了每个β-片的稳定性。扭结允许主干接近,从而在板材之间提供有利的范德华或氢键相互作用(图S5). 这些紧密的相互作用通过结构互补性Sc进行量化(图1),反映板材之间的粘合。然而,扭结阻止侧链在β-板界面上交叉,因此扭结界面埋藏的表面积比致病性淀粉样纤维中发现的表面积小,并且可能具有较低的结合能。由于扭结结构与致病性立体拉链的区别,我们将其称为低复杂性富含芳香的扭结片段,或LARKS。

计算和实验支持了我们的结构推断,即LARK比立体拉链具有更小的结合能。我们通过应用原子溶剂化参数估算了LARKS和空间拉链中β-片对的分离能量(22,23)我们的结构:LARKS界面分离的平均原子溶剂化能为567±556 cal/mol/β-链,而75个立体拉链结构的平均原子溶液化能为1431±685 cal/mol/β-链(图S6). 这些粗略估计表明,LARKS中一对β-链的粘附能与热能的数量级相当,因此,β-片对只能通过链的多价相互作用粘附。相比之下,立体拉链中一对线的粘合能是热能的几倍图2轻轻加热就会溶解。因此,LARKS的成对扭结β-片与淀粉样蛋白原纤维中的成对β-片结合强度较低,但仍产生具有致病性淀粉样蛋白交叉β-衍射模式的原纤维。

为了确定人类蛋白质组中潜在的LARKS,我们使用了计算3D分析,这是一种测试查询序列与模板结构兼容性的方法(24,25). 在这里,我们将人类序列连接到SYSGYS、GYNGFG和STGGYG的主干上,放置并优化重新包装侧链,然后评估Rosetta能量(图3A)(26). 我们将线程推进了一步,并重复该过程,直到到达查询序列的末尾。该3D分析预测核穿孔蛋白在LARKS中富集(图3C). 我们对这一预测的信心得到了早期预测的支持,即GYNGFG和STGGYG可以基于仅使用SYSGYS模板的线程形成LARKS。在这里,我们再次通过从porin nup98确定GFGNFGTS的结构来验证我们的剖析算法,从而确认LARKS体系结构(图1F)并提供证据证明LARKS存在于不同类型的无膜细胞器中(27)。

保存图片、插图等的外部文件。对象名称为nihms-991708-f0003.jpg
3D剖析以识别人类蛋白质LC域中的LARKS。

(A)方法:从LARKS的一个原子结构的主干中移除侧链。然后,通过将查询侧链放置在模板主干上,将感兴趣的序列(如图所示为hnRNPA1)贯穿六个剩余模板。重新包装侧链,并使用Rosetta能量函数估计结构是否有利于螺纹序列。然后序列以一个残基增量穿过模板,生成连续的模型。(B)1725种人类蛋白质中LARKS数量的频率预测至少容纳两个LARKS。预计具有两个或更多LARKS的蛋白质具有形成网络和凝胶的能力。(C)400个蛋白质的注释功能与预测最多的LARKS。

通过分析UniProt 20120个序列的非冗余人类蛋白质组,我们发现5867个带有液晶显示器的蛋白质。其中,2500个蛋白质包含至少一个LARKS,1725个蛋白质包含两个或多个LARKS,因此能够形成多价相互作用,从而形成蛋白质网络和凝胶。数百种蛋白质容纳三种或更多LARKS(图3B). LARK含量最高的400个人类LCD平均为14个LARK。

我们根据Uniprot注释将细胞功能分配给这400个蛋白质(图3C):16%为DNA结合,17%为RNA结合,4%为核苷酸结合,与无膜细胞器中核苷酸结合蛋白的报道一致(2,8). LARKS中也富含角蛋白(5%)、角蛋白相关蛋白(9%)和角质化包膜蛋白(4%)。角蛋白的发现与实验一致(28)显示角蛋白颗粒被输送到细胞皮层,在那里融合并最终成熟为丝状。LARKS中也富含核糖核蛋白颗粒中的蛋白质,如剪接体或核仁(图4). 含有FG重复序列的核蛋白nup54和nup98富含预测的LARKS,纯化的FG重复片段形成水凝胶(27,29). 核孔蛋白的FG重复序列可能在孔的扩散屏障中形成LARKS,这一可能性得到了我们从nup98获得的GFGNFGTS结构的支持。我们从相关的基因本体论(GO)术语中为这400种蛋白质分配了额外的细胞功能。我们发现GO术语在人类蛋白质组中富集,用于RNA转运、加工定位、SG组装和上皮细胞分化,这是由于LARKS中富集了大量角蛋白。因此,我们建议将LARKS的3D分析作为一种工具,以识别可能通过多价相互作用形成网络和凝胶并参与无膜细胞器的蛋白质(图S10)。

保存图片、插图等的外部文件。对象名为nihms-991708-f0004.jpg

LARKS中最丰富的400种蛋白质以及它们所属的动态胞内体中的蛋白质的功能。

结论:

真核蛋白质组中液晶显示的普遍性早已被认识(30),但这些域的作用尚未完全定义。以前的发现包括:液晶显示器可以“功能聚合”(31); 带有液晶显示器的蛋白质通常会形成更多的蛋白质相互作用(32,33) ; 蛋白质可以通过LC结构域同型和异型相互作用(1,5,34). 我们的原子结构支持这样的假设,即LC域具有形成凝胶状网络的能力。LARKS具有三种性质,这与它们在由LC结构域形成的蛋白质凝胶中作为粘附元素的功能一致:i)高比例的亲水残基(丝氨酸、谷氨酰胺和天冬酰胺)促成了高水溶性;ii)高甘氨酸含量确保灵活性;iii)每条链上有多个交互图案(图3B)赋予它们多价性,使它们相互缠绕,形成凝胶中的网络(图2). 每个LARKS提供的粘附力只能与热能相媲美,这表明许多LARKS必须在凝胶形成中合作,并且相互作用必须依赖于浓度并且可能是暂时的。如果立体拉链起到了分子胶的作用,那么液晶显示器中的LARKS就起到了尼龙搭扣的作用。这些特性与LARKS是一种蛋白质相互作用基序的假设相一致,该基序提供了液晶显示器在蛋白质凝胶和无膜组装中的粘附(图S10)。

补充材料

图S1至S10以及补充表S1和S2

单击此处查看。(2500万,docx)

致谢:

我们的X射线衍射数据是在东北合作访问团队光束线24-ID-E处收集的,该光束线由美国国立卫生研究院国家普通医学科学研究所资助(P41 GM103403)。这项研究使用了先进光子源的资源,这是美国能源部(DOE)科学办公室用户设施,由阿贡国家实验室根据合同号DE-AC02-06CH11357为DOE科学办公室运营。原子坐标和结构因子已存放在PDB中,其加入码如下:SYSGYS(6BWZ)、SYSSYGQS(6BXV)、STGGYG(6BZP)、GYNGFG(6BXX)和GFGNFGTS(6BZ)。我们感谢NSF MCB-1616265、NIH AG-054022、DOE和HHMI的支持。

缩写:

LARKS公司低复杂性富芳香族扭折段
液晶显示器低复杂度域
Sc公司结构互补性
新加坡应力颗粒
固态核磁共振固态核磁共振

参考文献和注释:

1Hennig S公司等。,RNA结合蛋白中的类朊蛋白结构域对于构建亚核副啄木鸟至关重要。 细胞生物学杂志 210, 529–539 (2015).[PMC免费文章][公共医学][谷歌学者]
2阿古齐A,阿尔特迈耶M,相分离:将细胞隔室化与疾病联系起来。 细胞生物学趋势 26,547–558(2016年)。[公共医学][谷歌学者]
三。Banani SF、Lee HO、Hyman AA、Rosen MK、,生物分子凝聚物:细胞生物化学的组织者。 自然修订分子细胞生物学 18, 285–298 (2017).[PMC免费文章][公共医学][谷歌学者]
4李鹏等。,多价信号蛋白组装中的相变。 自然 483, 336–340 (2012).[PMC免费文章][公共医学][谷歌学者]
5加藤M等。,RNA颗粒的无细胞形成:低复杂性序列域在水凝胶中形成动态纤维。 单元格 149, 753–767 (2012).[PMC免费文章][公共医学][谷歌学者]
6Elbaum-Garfinkle S、Brangwyne CP、,液体、纤维和凝胶:神经变性的多阶段。 开发单元 35, 531–532 (2015). [公共医学][谷歌学者]
7Lin Y、Protter DSW、Rosen MK、Parker R、,RNA-结合蛋白相分离液滴的形成和成熟。 分子电池 60, 208–219 (2015).[PMC免费文章][公共医学][谷歌学者]
8Harrison AF、Shorter J、,健康和疾病中带有朊蛋白样结构域的RNA结合蛋白。 生物化学。J型 474, 1417–1438 (2017).[PMC免费文章][公共医学][谷歌学者]
9村上T等。,ALS/FTD突变导致FUS液滴和可逆水凝胶向不可逆水凝胶的相变,损害RNP颗粒功能。 神经元 88, 678–690 (2015).[PMC免费文章][公共医学][谷歌学者]
10帕特尔A等。,疾病突变加速了ALS蛋白FUS的液-固相转变。 单元格 162, 1066–1077 (2015). [公共医学][谷歌学者]
11莫利克斯A等。,低复杂性结构域的相分离促进应力颗粒的组装并驱动病理性纤维化。 单元格 163, 123–133 (2015).[PMC免费文章][公共医学][谷歌学者]
12向S等。,hnRNPA2的LC结构域在水凝胶聚合物、类液滴和核中采用类似的构象。 单元格 163, 829–839 (2015).[PMC免费文章][公共医学][谷歌学者]
13Kumari B、Kumar R、Kumar M、,蛋白质的低复杂性和无序区域具有不同的结构和氨基酸偏好。 分子生物晶体 11, 585–594 (2015). [公共医学][谷歌学者]
14伍顿JC,蛋白质序列中的非球结构域:使用复杂性度量的自动分割。 计算。化学 18, 269–285 (1994). [公共医学][谷歌学者]
15Schwartz JC、Cech TR、Parker RR、,FET蛋白质的生化特性和生物学功能。 年。生物化学评论 84, 355–379 (2015).[PMC免费文章][公共医学][谷歌学者]
16纳尔逊·R等。,淀粉样纤维交叉β棘的结构。 自然 435, 773–778 (2005).[PMC免费文章][公共医学][谷歌学者]
17Sawaya MR公司等。,淀粉样交叉β棘的原子结构揭示了不同的空间拉链。 自然 447, 453–457 (2007). [公共医学][谷歌学者]
18默里DT等。,FUS蛋白纤维的结构及其与低复杂结构域的自组装和相分离的相关性。 单元格 171615–627.e16(2017)。[PMC免费文章][公共医学][谷歌学者]
19辛诺克罗特MO、瓦列夫EF、谢里尔CD、,pi-pi相互作用从头算极限的估计:苯二聚体。 美国化学杂志。Soc公司 124, 10887–10893 (2002). [公共医学][谷歌学者]
20McGaughey GB、GagnéM、RappéAK、,pi-堆叠交互。活的,蛋白质含量高。 生物学杂志。化学 273, 15458–15463 (1998). [公共医学][谷歌学者]
21Arunan E、Gutowsky HS、,苯二聚体的旋转光谱、结构和动力学。 化学杂志。物理 98(1992).[谷歌学者]
22艾森伯格D,麦克拉克伦AD,蛋白质折叠和结合中的溶解能。 自然 319, 199–203 (1986). [公共医学][谷歌学者]
23Eisenberg DE、Wesson M、Yamashita M、,用原子溶剂化参数解释蛋白质折叠和结合。 化学。紧急停堆 29安,217–221(1989年)。[谷歌学者]
24Bowie JU、Lüthy R、Eisenberg D、,一种识别折叠成已知三维结构的蛋白质序列的方法。 科学类 253, 164–170 (1991). [公共医学][谷歌学者]
25Goldschmidt L、Teng PK、Riek R、Eisenberg D、,鉴定淀粉体,即能够形成淀粉样纤维的蛋白质。 程序。国家。阿卡德。科学。美国 107, 3487–3492 (2010).[PMC免费文章][公共医学][谷歌学者]
26Leaver-Fay A公司等。,ROSETTA3:用于模拟和设计大分子的面向对象软件套件。 酶学方法 487,545–574(2011年)。[PMC免费文章][公共医学][谷歌学者]
27Frey S、Richter RP、Görlich D、,富含FG的核孔蛋白重复序列形成具有水凝胶性质的三维网络。 科学类 314, 815–817 (2006). [公共医学][谷歌学者]
28Windoffer R、Wöll S、Strand P、Leube RE、,活细胞角蛋白纤维网络周转新原理的鉴定。 分子生物学。单元格 15, 2436–2448 (2004).[PMC免费文章][公共医学][谷歌学者]
29阿德尔C等。,核孔蛋白FG水凝胶中淀粉样相互作用。 程序。国家。阿卡德。科学。美国 107, 6281–6285 (2010).[PMC免费文章][公共医学][谷歌学者]
30Sim KL、Creamer TP、,真核生物蛋白质简单序列的丰度和分布。 摩尔细胞。蛋白质组学MCP 1, 983–995 (2002). [公共医学][谷歌学者]
31托雷茨基JA、赖特PE、,集合:由细胞相分离形成的功能单元。 细胞生物学杂志 206, 579–588 (2014).[PMC免费文章][公共医学][谷歌学者]
32科尔塔A等。,蛋白质序列中的低复杂性区域具有位置依赖性作用。 BMC系统。生物 4, 43 (2010).[PMC免费文章][公共医学][谷歌学者]
33Uversky VN、Oldfield CJ、Dunker AK、,人类疾病中的内在无序蛋白质:引入D2概念。 年。生物物理学评论 37, 215–246 (2008). [公共医学][谷歌学者]
34权一等。,RNA聚合酶II与低复杂性结构域纤维聚合物的磷酸化调节结合。 单元格 155, 1049–1060 (2013).[PMC免费文章][公共医学][谷歌学者]
35艾森伯格DS,Sawaya MR,淀粉样蛋白的分子水平结构研究。 年。生物化学评论 86,69–95(2017年)。[公共医学][谷歌学者]
36麦考伊AJ等。,相位晶体软件。 J.应用。结晶器 40, 658–674 (2007).[PMC免费文章][公共医学][谷歌学者]
37Murshudov GN、Vagin AA、Dodson EJ、,用最大似然法改进大分子结构。 水晶女演员。D生物结晶仪 53, 240–255 (1997). [公共医学][谷歌学者]
38Sheldrick总经理,SHELX的简短历史。 水晶女演员。A类 64, 112–122 (2008). [公共医学][谷歌学者]
39Kabsch W,扩展。 水晶女演员。D生物结晶仪 66, 125–132 (2010).[PMC免费文章][公共医学][谷歌学者]
40海特恩J等。,MicroED数据收集和处理。 水晶女演员。第节。已找到。副词 71, 353–360 (2015).[PMC免费文章][公共医学][谷歌学者]
41Afonine光伏等。,使用phenix.refine实现自动晶体结构细化。 水晶女演员。D生物结晶仪 68, 352–367 (2012).[PMC免费文章][公共医学][谷歌学者]
42布兰科E等。,BUSTER-TNT中具有最大似然的严重不完整结构的精化。 水晶女演员。D生物结晶仪 60, 2210–2221 (2004). [公共医学][谷歌学者]
43Emsley P、Lohkamp B、Scott WG、Cowtan K、,Coot的特点和发展。 水晶女演员。D生物结晶仪 66, 486–501 (2010).[PMC免费文章][公共医学][谷歌学者]
44Winn医学博士等。,CCP4套件概述和当前发展。 水晶女演员。D生物结晶仪 67, 235–242 (2011).[PMC免费文章][公共医学][谷歌学者]
45UniProt联盟,UniProt:通用蛋白质知识库。 核酸研究 45,D158–D169(2017)。[PMC免费文章][公共医学][谷歌学者]
46基因本体联盟,基因本体联盟:前进。 核酸研究 43,D1049–1056(2015)。[PMC免费文章][公共医学][谷歌学者]
47Halfmann R,低复杂度序列的玻璃动物园。 货币。操作。结构。生物 38, 18–25 (2016).[PMC免费文章][公共医学][谷歌学者]