摘要
通过基于结构的设计控制蛋白质构象和动力学的能力在各种情况下都很有用,包括疫苗的病毒抗原工程。一种有效的设计策略是将残基替换为脯氨酸氨基酸,这是因为其独特的环状侧链可以有利于并刚性化关键骨架构象。为了为社区提供一种容易识别和探索感兴趣的靶蛋白脯氨酸设计的方法,我们开发了Proscan网络服务器。Proscan提供了对主干角、基于能量和深度学习的偏好分数以及输入结构每个位置脯氨酸替代的其他参数的评估,以及结构上主干角和候选替代位点的交互式可视化。它确定了已知的病毒抗原的良好脯氨酸替代,并根据深度突变扫描和热力学测量的脯氨酸替代稳定性效应数据集进行了基准测试。该工具可以使研究人员识别并优先考虑预期疫苗抗原靶点的设计,或其他有利于关键蛋白质构象稳定性的设计。Proscan网址:https://proscan.ibbr.umd.edu.
介绍
脯氨酸取代代表了一种有用而有效的蛋白质设计策略,由于脯氨酸吡咯烷环的存在,使得关键的首选局部构象和三级结构得到了有利和刚性化,从而限制了主链二面角。正如最近一篇综述中所讨论的那样,这已成功用于多种疫苗抗原,以帮助稳定病毒蛋白的预融合构象(1). 一个值得注意的例子是由两个连续的脯氨酸取代组成的“2P”冠状病毒尖峰设计,该设计最初被发现用于稳定2017年MERS-CoV尖峰糖蛋白(以及其他冠状病毒的尖峰糖苷)的预融合状态(2). 2P设计后来被用于稳定SARS-CoV-2预融合峰,从而能够确定首次报告的SARS-CoV-2峰结构(三),并用于大多数批准的SARS-CoV-2疫苗(1). 基于SARS-CoV-2尖峰结构,Hsieh等人确定了一组额外的四个脯氨酸替代物,以进一步稳定预融合SARS-CoV-2尖峰(4),这种“HexaPro”设计(2P加上四个以上脯氨酸)已用于许多后续的结构和免疫原性研究(5–8). 其他病毒抗原的脯氨酸设计示例包括广泛使用的HIV包膜SOSIP设计,其中包含关键脯氨酸残基替代物(I559P)(9)以及丙型肝炎病毒(HCV)E2糖蛋白中基于结构的脯氨酸替代,从而改善中和抗体结合和免疫原性(10). 其他研究探索了基于结构的脯氨酸设计,以提高其他系统的稳定性和刚性,例如稳定T细胞受体和抗体环结构以改善抗原结合(11,12).
除了需要多种计算工具外,脯氨酸设计在以往研究中的成功和实用性(10)或需要大规模筛选策略(13),强调需要一种工具来系统分析蛋白质结构,以确定候选脯氨酸替代。5年前报道了一条计算脯氨酸设计管道(14),但由于其可下载代码的可用性,具有有限计算专业知识的研究人员可能无法访问它,而其他人则提出了决策树脯氨酸设计管道(15). 另一种方法是在Rosetta程序中使用计算突变(16)结合Ramachandran主干结构图分析(10),但由于该研究中使用的Ramachandran绘图网络服务器目前不可用(17)并且需要在该算法中运行多个单独的工具,因此不可能轻易地将其用于前瞻性设计研究。
为了为社区提供脯氨酸设计资源和工具,我们开发了Proscan web服务器,其中包括我们团队以前用于抗原设计的Ramachandran图分析和Rosetta突变功能(10)以及最近开发的基于结构的深度学习设计工具ProteinMPNN的分析(18),以及其他感兴趣的注释,包括二级结构和野生型残基相互作用。这个易于使用的服务器以蛋白质结构为输入,在几秒钟到几分钟内返回结果(取决于结构大小),其结果页面包括结果的交互式可视化和带有分数和注释的格式化表格。Proscan可以使研究能够针对当前和未来疫苗目标设计和优化抗原,并可用于其他设计方案,以稳定关键构象并调节蛋白质动力学。
材料和方法
Web服务器实现
界面和可视化
ProScan web服务器是使用Python3 Flask框架开发的,并与Apache一起部署。输入蛋白质数据库(PDB)(19)和CIF格式的文件使用Biopython PDB包的组合进行解析(20)和自定义脚本,而使用Biopython PDB包从PDB代码检索PDB文件。拉马钱德朗的情节是用巧妙的手法渲染的(网址:https://plot.ly),使用来自MolProbity的Ramachandran图角度分布(21)Top8000结构数据库。使用NGL Viewer在结果页面上显示蛋白质结构(22).
结构分析
Biopython PDB软件包计算了输入结构的Φ和Ψ主干二面角,Φ/Ψ角概率分类基于先前建立的结构验证标准(23)“首选”、“可接受”和“可疑”分别指脯氨酸或前脯氨酸角度分布的98%以内、99.5%以内和之外。使用Rosetta v2.3(rosettacommons.org)和“界面”突变协议计算脯氨酸取代的能量稳定性效应,该协议在结构上对突变侧链建模,并使用基于能量的评分函数计算稳定性变化(ΔΔGs)(16). 由于罗塞塔2.3的速度及其在以前的设计和分析研究中的实用性,因此在这种情况下使用它(10,11,24)包括在丙氨酸点替代ΔΔG的比较基准测试方面表现出色(25). 蛋白质MPNN(18)从其Github存储库下载(https://github.com/dauparas/ProteinMPNN网站)2023年5月,使用默认参数和模型权重(v_48_020)在输入结构上运行,并从ProteinMPNN输出解析位置脯氨酸有利值(0-1,与每个位置的其他可能氨基酸的比例)。二级结构信息从DSSP程序获得(26),氢键由hbplus程序决定(27)和N-聚糖是通过使用从输入PDB/mmCIF文件的LINK和struct_connection记录中提取聚糖信息的脚本解析输入结构来检测的。
基准数据集
MegaScale数据集
MegaScale深度突变扫描研究的ΔΔG数据集(28)进行过滤,以确定脯氨酸替代的测量值。野生型蛋白的序列是从相应的PDB结构中获得的,并使用MMseqs2以30%的身份截断进行聚类(29),从每个簇中选择一个PDB,从选择中排除NMR结构。这导致了16个结构和652个脯氨酸替换,并测量了稳定性效应。
Protherm数据集
从ProthermDB下载了实验测量的脯氨酸突变ΔΔG值的附加数据集(30). 对照相应的原始参考,检查脯氨酸点取代的实测ΔΔG值,以确认Δ△G值和实测极性。最终精选的数据集包含来自9个蛋白质结构的27个独特脯氨酸突变体。
病毒抗原
从文献中鉴定了病毒抗原脯氨酸设计的实例。
结果
服务器概述
Proscan网络服务器采用蛋白质结构作为输入,可通过输入页面提供(图1安培)作为用户输入PDB文件,或用于指定结构的PDB代码。控制行为的选项包括仅使用某些链或从分析中排除某些链的能力,以及跳过RosettaΔΔG计算,这可以加快运行时间,特别是对于大型结构物。Proscan结果页面(图1B年,C)包含一个显示主链Φ和Ψ角分布的Ramachandran图,一个突出显示潜在脯氨酸替代位点的结构查看器,以及一个包含脯氨酸替代分析相关得分和注释的表格。Proscan提供的主要得分和数据包括脯氨酸骨架构象(当前残基)和前脯氨酸骨架构型(先前残基)的Ramachandran图有利性注释,脯氨酸取代(ΔΔG)的Rosetta稳定性变化(近似单位kcal/mol),以及最近开发的深度学习蛋白质设计工具ProteinMPNN的脯氨酸位置概率得分(18). RosettaΔΔG和Ramachandran图分析主要分别代表侧链取代的有利性和骨架相容性,此前已用于为病毒抗原和其他设计目标选择有利的脯氨酸设计(10–12). 深度学习蛋白质设计工具ProteinMPNN使用基于图形的神经网络预测结构每个位置的氨基酸偏好性,并证明在结构和蛋白质界面的设计方面是有效的(18)以及蛋白质稳定性的改善(31). 交互式Proscan输出页面允许用户下载结果表以进行进一步分析,根据特定残留物筛选表和查看器,并根据评分标准和注释筛选表(例如二级结构,野生型残留物的氢键)。为了方便起见,位置根据ProteinMPNN评分截止值(如下所述)定义的有利性突出显示,但用户可以根据需要根据附加或其他标准进行排序或筛选。Proscan运行时间取决于输入的蛋白质大小,对于大多数标准大小的蛋白质(<400个残基),通常需要几秒到几分钟的时间,而忽略RosettaΔΔG计算只需要几秒钟。
![Proscan提交和结果页面。(A) Proscan提交页面,允许用户输入PDB结构或PDB代码输入,以及用户特定的选项。(B) 结果页面可视化,带有脯氨酸Ramachandran图,显示输入结构残留物Φ/Ψ主干角,绘制为点(左),以及交互式结构查看器(右)。根据预测的脯氨酸亲和力和评分标准对Ramachandran图点和结构上的残基进行着色。(C)结果页表,显示每个残基的评分和注释以及脯氨酸替代亲和力。单元格根据分数偏好进行着色。(B)和(C)的示例结构为HCV E2糖蛋白核心(PDB代码4MWF,链D)(36)。结果表行和图中的残留物根据预测的脯氨酸有利性进行着色(浅绿色=可能有利,绿色=可能有益)。](https://oup.silverchair-cdn.com/oup/backfile/Content_public/Journal/nar/PAP/10.1093_nar_gkae408/1/m_gkae408fig1.jpeg?Expires=1721825373&Signature=BiMZgUvMS~JTN4ySe2KzZ9Q-Y8w~LYf2z7etoUWwgqbUKoRVTlHIkz8Y3Xmz3iRWXZrNc8X6Nqz8DYamXx7RlV-dtCUY3QqMJIlERIfVB-Vz2r3ZBQAfJCzlm5kaUJNesGCLiw6vCYTZY9rg~1ok9yrk~DNoTDPQkqs6ooezM2-D9WmgDbHg6oivxYCwW6gn5eGaVCBzZE7mUNTxoKQL4-72XqGk8eqnVfiELReKS9JNxXSr6U2vRg9DCxEMtp6HRfr1LP-M-2GMxTfYsqFchVaGvGrFNlx1XH0T-kd5DkeFK6NTnBC4~UlhqIzyB8pign6VrL1HZZOOK0YUWszE-A__&Key-Pair-Id=APKAIE5G5CRDK6RD3PGA)
图1。
Proscan提交和结果页面。(A类)Proscan提交页面,允许用户输入PDB结构或PDB代码输入,以及用户特定的选项。(B类)结果页面可视化,带有脯氨酸Ramachandran图,显示输入结构残留物Φ/Ψ主干角,绘制为点(左),以及交互式结构查看器(右)。根据预测的脯氨酸亲和力和评分标准,对Ramachandran图点和结构上的残基进行着色(C类)结果页表格,显示每个残基的得分和注释以及脯氨酸替代的有利性。单元格根据分数偏好进行着色。(B)和(C)的示例结构为HCV E2糖蛋白核心(PDB代码4MWF,链D)(36). 结果表行和图中的残留物根据预测的脯氨酸有利性进行着色(浅绿色=可能有利,绿色=可能有益)。
标杆管理和分数截止
为了检查Proscan是否能够正确评估已知有益的脯氨酸替代,我们使用Proscan评估了一组先前发表的脯氨酸替换,这些替换位于病毒抗原蛋白结构中,具有可用未突变蛋白的高分辨率结构。如表所示1,Proscan基于大多数指标对HCV E2、严重急性呼吸系统综合征冠状病毒2型刺突Hexapro、埃博拉病毒gp、呼吸道合胞病毒F和登革热E脯氨酸设计进行了有利评估。需要注意的是,包含设计的脯氨酸替代的结构(HCV E2和登革热E设计除外)位于可能的ProteinMPNN训练集内,然而,尚不清楚ProteinMP NN模型及其输出是否会受到这些潜在实例的影响。
表1。Proscan对先前描述的病毒抗原脯氨酸设计的评估
PDB公司. | 氨基酸. | 残留物数量. | 链条. | 菲律宾比索. | 精神分裂症. | 蛋白质MPNN. | 拉马钱德兰脯氨酸. | 罗塞塔ΔΔG. |
---|
丙型肝炎病毒E2 H445P(10) | | | | | |
4Z0倍 | 高速钢 | 445 | C类 | −66.4 | 147 | 0.712 | 首选 | −0.6 |
SARS-CoV-2 Spike Hexapro公司(4) | | | | | |
6VSB型 | PHE公司 | 817 | A类 | −54.8 | −50.7 | 0.316 | 首选 | −0.8 |
6VSB型 | ALA公司 | 892 | A类 | −63.5 | 147.8 | 0.113 | 首选 | −1.7 |
6VSB型 | ALA公司 | 899 | A类 | −58.6 | −36.3 | 0.056 | 首选 | −1.2 |
6VSB型 | ALA公司 | 942 | A类 | −68.3 | 166.8 | 0.667 | 首选 | −1.3 |
RSV F S215P型(37) | | | | | | |
7UJA公司 | SER公司 | 215 | A类 | −77.2 | −61.34 | 0.742 | 值得怀疑的 | −0.2 |
埃博拉gp T577P(38) | | | | | | |
5个JQ3 | 推力 | 577 | B类 | −102.3 | −7.0 | 0.015 | 首选 | 0.6 |
登革热E T280P(39) | | | | | | |
1TG8号机组 | THR | 280 | A类 | −59.45 | −45.7 | 0.872 | 首选 | −0.9 |
PDB公司. | 氨基酸. | 残留物数量. | 链条. | 菲律宾比索. | 磅/平方英寸. | 蛋白质MPNN. | 拉马钱德兰脯氨酸. | 罗塞塔ΔΔG. |
---|
丙型肝炎病毒E2 H445P(10) | | | | | |
4Z0倍 | 高速钢 | 445 | C类 | −66.4 | 147 | 0.712 | 首选 | −0.6 |
SARS-CoV-2 Spike Hexapro公司(4) | | | | | |
6VSB型 | PHE公司 | 817 | A类 | −54.8 | −50.7 | 0.316 | 首选 | −0.8 |
6VSB型 | ALA公司 | 892 | A类 | −63.5 | 147.8 | 0.113 | 首选 | −1.7 |
6VSB型 | ALA公司 | 899 | A类 | −58.6 | −36.3 | 0.056 | 首选 | −1.2 |
6VSB型 | ALA公司 | 942 | A类 | −68.3 | 166.8 | 0.667 | 首选 | −1.3 |
RSV F S215P型(37) | | | | | | |
7UJA公司 | SER公司 | 215 | A类 | −77.2 | −61.34 | 0.742 | 值得怀疑的 | −0.2 |
埃博拉gp T577P(38) | | | | | | |
5个JQ3 | 推力 | 577 | B类 | −102.3 | −7.0 | 0.015 | 首选 | 0.6 |
登革热E T280P(39) | | | | | | |
1TG8号机组 | 推力 | 280 | A类 | −59.45 | −45.7 | 0.872 | 首选 | −0.9 |
表1。Proscan对先前描述的病毒抗原脯氨酸设计的评估
PDB公司. | 氨基酸. | 残留物数量. | 链条. | 菲律宾比索. | 磅/平方英寸. | 蛋白质MPNN. | 拉马钱德兰脯氨酸. | 罗塞塔ΔΔG. |
---|
丙型肝炎病毒E2 H445P(10) | | | | | |
4Z0倍 | 高速钢 | 445 | C类 | −66.4 | 147 | 0.712 | 首选 | −0.6 |
严重急性呼吸系统综合征冠状病毒2型刺突六肽(4) | | | | | |
6VSB型 | PHE公司 | 817 | A类 | −54.8 | −50.7 | 0.316 | 首选 | −0.8 |
6VSB型 | ALA公司 | 892 | A类 | −63.5 | 147.8 | 0.113 | 首选 | −1.7 |
6VSB型 | ALA公司 | 899 | A类 | −58.6 | −36.3 | 0.056 | 首选 | −1.2 |
6VSB型 | ALA公司 | 942 | A类 | −68.3 | 166.8 | 0.667 | 首选 | −1.3 |
RSV F S215P公司(37) | | | | | | |
7UJA公司 | SER公司 | 215 | A类 | −77.2 | −61.34 | 0.742 | 值得怀疑的 | −0.2 |
埃博拉gp T577P(38) | | | | | | |
5个JQ3 | 推力 | 577 | B类 | −102.3 | −7.0 | 0.015 | 首选 | 0.6 |
登革热E T280P(39) | | | | | | |
1TG8号机组 | 推力 | 280 | A类 | −59.45 | −45.7 | 0.872 | 首选 | −0.9 |
PDB公司. | 氨基酸. | 残留物数量. | 链条. | 菲律宾比索. | 磅/平方英寸. | 蛋白质MPNN. | 拉马钱德兰脯氨酸. | 罗塞塔ΔΔG. |
---|
丙型肝炎病毒E2 H445P(10) | | | | | |
4Z0倍 | 高速钢 | 445 | C类 | −66.4 | 147 | 0.712 | 首选 | −0.6 |
SARS-CoV-2 Spike Hexapro公司(4) | | | | | |
6VSB型 | PHE公司 | 817 | A类 | −54.8 | −50.7 | 0.316 | 首选 | −0.8 |
6VSB型 | ALA公司 | 892 | A类 | −63.5 | 147.8 | 0.113 | 首选 | −1.7 |
6VSB型 | ALA公司 | 899 | A类 | −58.6 | −36.3 | 0.056 | 首选 | −1.2 |
6VSB型 | ALA公司 | 942 | A类 | −68.3 | 166.8 | 0.667 | 首选 | −1.3 |
RSV F S215P型(37) | | | | | | |
7UJA公司 | SER公司 | 215 | A类 | −77.2 | −61.34 | 0.742 | 值得怀疑的 | −0.2 |
埃博拉gp T577P(38) | | | | | | |
5个JQ3 | 推力 | 577 | B类 | −102.3 | −7.0 | 0.015 | 首选 | 0.6 |
登革热E T280P(39) | | | | | | |
1TG8号机组 | 推力 | 280 | A类 | −59.45 | −45.7 | 0.872 | 首选 | −0.9 |
为了更系统地评估Proscan的预测性能及其输出分数,我们使用了最近发布的MegaScale深度突变扫描数据集(28),从中我们获得了一组600多个测得的脯氨酸取代稳定性效应(补充表S1). 我们检查了分数和标准的性能,以将近似稳定或保持稳定(ΔΔG<0.5)的替代品与破坏稳定(△ΔG>0.5)的替代物进行分类。注意,ΔΔG值与原始数据集值取反(28)将其极性与大多数ΔΔG测量值和预测值对齐(正表示不太有利),单位约为kcal/mol。如图所示2安培,Rosetta和ProteinMPNN评分均根据接收操作特征(ROC)曲线和曲线下面积(ROC AUC)对具有相似性能的稳定替代与非稳定替代进行分类。考虑到数据集有些不平衡(约4:1失稳替代与稳定替代),我们还将ProteinMPNN和Rosetta与精确再调用曲线进行了比较(图2B型),表明ProteinMPNN在预测脯氨酸替代效应方面总体上更好,这并不意外,因为在基于物理的建模程序(如Rosetta)中建模脯氨酸替代的主干和其他效应可能具有挑战性。
![ProteinMPNN和Rosetta对来自MegaScale蛋白质稳定性数据集的脯氨酸替代稳定性影响的分类准确性(28)。(A) ProteinMPNN和Rosetta评分的稳定与不稳定脯氨酸替代的受体操作特性(ROC)曲线(0.5 kcal/molΔΔG截止值)。点数为126(稳定)和526(不稳定),并显示了曲线下面积(AUC)值。(B) (A)中相同脯氨酸取代的ProteinMPNN和Rosetta评分的精确重新调用曲线,显示AUC值。](https://oup.silverchair-cdn.com/oup/backfile/Content_public/Journal/nar/PAP/10.1093_nar_gkae408/1/m_gkae408fig2.jpeg?Expires=1721825373&Signature=raHcAp7HTYqdUykU1xOTrjUUboptEJzrIgB~jgz6HmlZg~JEAo6qrklCL94xzygG4szO~8Nix3SvQAsglSGT7s1UywnBxYp57drPrWSkL1S5X-wNRwcPF7AZymLHjvAP7iP6wCP8IkZH52XmalauZfbhyWf9dQZtyV16raTu6x-aBxh6kfyuiC~8B7rtoMRnWkKAz7N-NCdY2UvuQgSuOWaEhrwMvnCFqk-JiNjK~YGUBL6WgIG8FBNBLsVJdbpU29E9ZNgt2MRsWISzNINLsQHnpDAgdn2QBVb2kWCRtD4pmAahTFWNaSwQUAHnM00jWYZF90vDWK3uQJeh52l6-w__&Key-Pair-Id=APKAIE5G5CRDK6RD3PGA)
图2。
ProteinMPNN和Rosetta对MegaScale蛋白质稳定性数据集脯氨酸取代稳定性影响的分类精度(28). (A类)ProteinMPNN和Rosetta评分的稳定与不稳定脯氨酸替代的受体操作特性(ROC)曲线(0.5 kcal/molΔΔG截止值)。点数为126(稳定)和526(不稳定),并显示了曲线下面积(AUC)值。(B类)来自(A)的相同脯氨酸取代的ProteinMPNN和Rosetta评分的精确回忆曲线,显示AUC值。
我们使用MegaScale数据集对Ramachandran图标准、Rosetta(ΔΔG值截止值0.1)和ProteinMPNN(概率得分截止值0.2和0.01)的分类精度进行了更详细的分析(补充表S2). 虽然基于骨架角度的分类(脯氨酸的当前残基Preferable或Preferable/Acceptable/No_angle)能够有效识别一些阴性(不稳定)突变,但许多假阳性(不稳定的)突变都通过了角度过滤器。测试截止点的RosettaΔΔG显示出一定的特异性(精度=0.59),但没有正确识别大多数有利/中性替代(召回率=0.35)。ProteinMPNN在分类替换方面表现良好,更严格的临界值(0.2)显示出1.0的精度值(尽管只检测到14%的有利/中性替换),而更宽容的临界点(0.01)显示出更好的平衡,精度为0.64,召回率为0.56。在测试分数截止点,基于主干角的滤波器组合并没有显著改善Rosetta和ProteinMPNN的性能。基于ProteinMPNN在这方面的卓越性能,Proscan使用ProteinMP NN得分和两个定义的得分截止值(0.2,0.01),分别在结果页表和图中突出高度有利和有利的预测替代。
为了提供有关Proscan及其指标预测性能的更多信息,我们从Protherm数据库中确定了一组27个实验测量的脯氨酸取代稳定性变化(ΔΔGs)(30) (补充表S3). Proscan计算的具有野生型结构的ProteinMPNN脯氨酸概率(log-transformed)和RosettaΔΔG值与实验测量的Δ△Gs高度相关,ProteinMPNN和Roset塔的Pearson相关性分别为0.69和0.66(补充图S1).
示例用例
作为Proscan的示例用例,我们分析了HC84.26.5D-E2的抗原链434-446抗体-抗原复合物结构(PDB代码4Z0X)(32),以确定无结合抗体上下文的未结合抗原链是否会显示H445P替代的有利分数,正如我们在表中观察到的抗体-抗原复合物结构中的位置1。输入PDB代码4Z0X,并为“Only Include Chains”指定链C,以单独扫描抗原链,从而给出如所示的输出结果表补充图S2可以看出,根据ProteinMPNN和Rosetta得分,残基445是脯氨酸替代未结合抗原的最有利位置,ProteinMPNN得分为0.69(满分1),RosettaΔG为-1.0。
讨论
我们开发了Proscan服务器,使研究人员能够轻松识别并优先考虑有利的脯氨酸替代物,以稳定病毒抗原和其他感兴趣的蛋白质。考虑到已经用脯氨酸成功构建的抗原范围(1),很有可能通过脯氨酸取代来优化额外的病毒和病原体抗原,从而有利于优选构象。由于当前和未来新出现的病原体,这种设计方法是防备大流行的有用工具(33)以S-2P和六种冠状病毒尖峰设计为例(4,34)未来基于结构的抗原设计有可能通过使用基于深度学习的精确建模方法(如AlphaFold)的结构模型从序列中进行(35).
Proscan的使用有几个可能的限制和注意事项。虽然Proscan无法直接进行多状态设计,以不利于某些构象(如融合后抗原构象),而有利于其他构象(融合前构象),但通过下载两个或多个分析结构的Proscan结果表,可以对结果进行分析和比较,以有效解决此类情况。此外,虽然由于某些结构分析程序的敏感性,结构质量有限(例如分辨率>3.5°)可能会影响Proscan的性能和输出效用,但用户可以在Proscan输入之前进行结构优化,以解决可疑或错误的几何体。虽然Proscan预计会优先考虑有利的脯氨酸替代,但可以对Proscan排名靠前的候选人进行更详细的替代潜在动态和能量影响模拟,以进一步确定优先顺序。
数据可用性
本文的基础数据可在文章及其在线上获得补充材料.
补充数据
补充数据可从NAR Online获取。
致谢
我们感谢生物科学和生物技术研究所的IT人员,包括盖尔·莱恩,为Proscan的实施提供支持。我们感谢Jaafar Haidar就脯氨酸设计策略进行的早期讨论,以及Yuxing Li和Andrey Galkin在网络服务器上发表的有益意见。我们还感谢ProteinMPNN团队分享他们的算法和代码。
作者贡献:Nathaniel Felbinger:概念化、形式分析、方法论、验证、写作——初稿、写作——审查和编辑。Helder V.Ribeiro-Filho:形式分析、方法论、写作——评论和编辑。布莱恩·皮尔斯(Brian G.Pierce):概念化、方法论、写作——初稿、写作——审查和编辑。
基金
国立卫生研究院[AI168048,AI102766,AI175439 to B.G.P.];圣保罗研究基金会(FAPESP)研究奖学金项目[2022/04260-6至H.V.R-F.]。开放存取费用的资金来源:NIH。
利益冲突声明.未申报
工具书类
1砂光机
相对湿度。
,摩尔
J.P.公司。
病毒疫苗:蛋白质更喜欢脯氨酸
.宿主与微生物
.2021
;29
:327
–333
. 2帕莱森
J。
,王
N。
,科贝特
韩国。
,包装
D。
,柯奇多尔
注册号。
,特纳
H.L.公司。
,科特雷尔
首席执行官。
,贝克尔
医学硕士。
,王
L。
,施
西。
等。
合理设计的MERS-CoV棘突抗原的免疫原性和结构
.程序。国家。阿卡德。科学。美国。
2017
;114
:E7348型
–E7357型
. 三。包装
D。
,王
N。
,科贝特
韩国。
,戈德史密斯
J.A.公司。
,谢
C.L.公司。
,阿比奥纳
O。
,格雷厄姆
英国标准。
,麦克莱伦
J.S.公司。
预融合构象中2019-nCoV尖峰的Cryo-EM结构
.科学类
.2020
;367
:1260
–1263
. 4谢
C.L.公司。
,戈德史密斯
J.A.公司。
,绍布
J.M.公司。
,迪维尼雷
上午。
,郭
高压断路器。
,爪哇马迪
英国。
,勒
K.C.公司。
,包装
D。
,李
美国政府。
,线路接口单元
年。
等。
基于结构的预融合稳定SARS-CoV-2尖峰设计
.科学类
.2020
;369
:1501
–1505
. 5巴恩斯
C.O.公司。
,杰特
首席执行官。
,阿伯纳西
机械工程师。
,大坝
K.A.公司。
,埃斯魏因
S.R.公司。
,格栅
H.B.公司。
,马柳丁
美国政府。
,谢拉夫
N.G.公司。
,休伊·塔布曼
K.E.公司。
,李
是的。
等。
SARS-CoV-2中和抗体结构为治疗策略提供信息
.自然
.2020
;588
:682
–687
. 6王
Z.公司。
,施密特
F、。
,魏斯布卢姆
年。
,穆埃克施
F、。
,巴恩斯
首席执行官。
,芬金
美国。
,谢弗·巴巴乔
D。
,奇波拉
M。
,格布勒
C、。
,利伯曼
J.A.公司。
等。
SARS-CoV-2和循环变体的mRNA疫苗合法抗体
.自然
.2021
;592
:616
–622
. 7琼斯
英国工程师协会。
,布朗·阿格斯堡
P.L.公司。
,科贝特
韩国。
,韦斯坦多夫
英国。
,戴维斯
J。
,库杰克
T.P.公司。
,维特霍夫
客户经理。
,布莱克本
法学博士。
,亨氏(Heinz)
文学学士。
,培养
D。
等。
中和抗体LY-CoV555可保护非人灵长类动物免受SARS-CoV-2感染
.科学。Transl.公司。医学。
2021
;13
:eabf1906
. 8卢
M。
,倒角
M。
,张
年。
,Ye(是)
C、。
,德拉维德
第页。
,公园
J.G.公司。
,马赫什
K.C.公司。
,特里维迪
美国。
,穆尔西
美国。
,夏尔马
H。
等。
由六个而不是两个脯氨酸稳定的SARS-CoV-2预融合尖峰蛋白更能诱导中和相关病毒变体的抗体
.程序。国家。阿卡德。科学。美国。
2022
;119
:e2110105119号
. 9砂光机
相对湿度。
,Derking公司
R。
,库波
答:。
,朱利安
J.P.公司。
,亚斯敏
答:。
,德瓦尔
N。
,基姆
H.J.公司。
,布拉特纳
C、。
,德拉佩纳
海拔高度。
,Korzun公司
J。
等。
下一代裂解可溶性HIV-1 Env三聚体BG505 SOSIP.664 gp140表达广泛中和但非中和抗体的多个表位
.《公共科学图书馆·病理学》。
2013
;9
:e1003618号
. 10皮尔斯
英国政府。
,凯克
Z.Y.先生。
,王
R。
,刘
第页。
,加拉古西
英国。
,埃尔科利
英国。
,托斯
E.A.公司。
,乌尔巴诺维奇
注册会计师。
,来宾
J.D.(医学博士)。
,阿格尼霍特里
第页。
等。
丙型肝炎病毒E2糖蛋白的结构设计改善血清结合和交叉中和
.J.维罗尔。
2020
;94
:电子00704-20
. 11皮尔斯
英国政府。
,赫尔曼
L.M.有限公司。
,侯赛因
M。
,辛格
不适用。
,范德库伊
C.W.公司。
,翁
Z.公司。
,贝克
B.M.公司。
治疗性T细胞受体亲和力和特异性的计算设计
.公共科学图书馆计算。生物。
2014
;10
:e1003478号
. 12海达尔
J.N.公司。
,朱
西。
,Lypowy公司
J。
,皮尔斯
英国政府。
,巴里
答:。
,佩尔绍德
英国。
,卢娜
十、。
,斯内维利
M。
,路德维希
D。
,翁
Z.公司。
CDR3的主链柔性与抗原免疫识别动力学的计算和实验研究
.分子生物学杂志。
2013
;426
:1583
–1599
. 13沙利文
J·T。
,苏利
C、。
,尼洛
答:。
,亚斯敏
答:。
,奥佐罗夫斯基
G.公司。
,砂光机
相对湿度。
,病房
A.B.公司。
,克拉斯
P.J.公司。
,摩尔
J.P.公司。
,多兰兹
B.J.公司。
高通量蛋白工程提高可溶性HIV-1包膜糖蛋白SOSIP三聚体的抗原性和稳定性
.J.维罗尔。
2017
;91
:电子00862-17
. 14拉维
R。
,沈
C.H.公司。
,广
P.D.公司。
,创
通用电气。
CRISPro:脯氨酸稳定蛋白质构象的自动化管道
.化学杂志。信息模型。
2018
;58
:2189
–2192
. 15巴贾杰
英国。
,马杜苏德汗
医学硕士。
,阿德卡尔
私人有限公司。
,克拉巴尔蒂
第页。
,拉马克里希南
C、。
,萨利
答:。
,瓦拉达拉扬
R。
预测脯氨酸突变对蛋白质稳定性影响的立体化学标准
.公共科学图书馆计算。生物。
2007
;三
:第241页
. 16Korteme公司
T。
,贝克
D类
蛋白质复合物结合能热点的简单物理模型
.程序。国家。阿卡德。科学。美国。
2002
;99
:14116
–14121
. 17安德森
R.J.公司。
,翁
Z.公司。
,坎贝尔
R.K.(英国)。
,江
十、。
氨基酸的主链构象倾向
.蛋白质
.2005
;60
:679
–689
. 18Dauparas公司
J。
,阿尼什琴科
一、。
,贝内特
N。
,白
H。
,拉戈特
R.J.公司。
,米尔斯
L.F.有限责任公司。
,威奇
B.I.M.公司。
,库尔贝
答:。
,德哈斯
R.J.公司。
,贝瑟尔
N。
等。
基于ProteinMPNN的稳健深度学习蛋白质序列设计
.科学类
.2022
;378
:49
–56
. 19玫瑰色
P.W.公司。
,贝兰
B。
,Bi公司
C、。
,布卢姆
W.F.公司。
,季米特罗普洛斯
D。
,古德塞尔
D.S.公司。
,Prlic公司
答:。
,奎萨达
M。
,奎因
通用电气公司。
,韦斯特布鲁克
J.D.(医学博士)。
等。
RCSB蛋白质数据库:重新设计的网站和web服务
.核酸研究。
2011
;39
:D392号
–D401型
. 20公鸡
P.J.公司。
,安踏
T。
,常
J·T。
,查普曼
文学学士。
,考克斯
C.J.公司。
,达尔克
答:。
,弗里德伯格
一、。
,哈默利克
T。
,考夫
F、。
,维尔钦斯基
B。
等。
Biopython:用于计算分子生物学和生物信息学的免费Python工具
.生物信息学
.2009
;25
:1422
–1423
. 21威廉姆斯
C.J.公司。
,标题
J.J.公司。
,莫里亚蒂
西北。
,普里桑
M.G.公司。
,维多
有限责任公司。
,戴斯
法律公告。
,维玛
对。
,基迪
D.A.公司。
,辛采
B.J.公司。
,陈
副总裁。
等。
MolProbity:更多更好的参考数据,用于改进全原子结构验证
.蛋白质科学。
2018
;27
:293
–315
. 22玫瑰色
美国科学院。
,布拉德利
阿拉伯联合酋长国。
,瓦拉萨塔瓦
年。
,杜阿尔特
J.M.公司。
,普里奇
答:。
,玫瑰色
P.W.公司。
NGL查看器:大型综合体的基于网络的分子图形
.生物信息学
.2018
;34
:3755
–3758
. 23洛弗尔
S.C.公司。
,戴维斯
I.W.(内径)。
,阿伦达尔
W.B.公司。
第三,德巴克
P.I.公司。
,单词
J.M.公司。
,普里桑
M.G.公司。
,理查森
J.S.公司。
,理查森
哥伦比亚特区。
Calpha几何结构验证:φ、psi和cbeta偏差
.蛋白质
.2003
;50
:437
–450
. 24皮尔斯
英国政府。
,凯克
Z年。
,刘
第页。
,福韦勒
C、。
,戈沙曼
R。
,博梅尔
财政部。
,富尔斯特
相对湿度。
,马里乌扎
注册会计师。
,芬
S.K.H.公司。
丙型肝炎病毒E2糖蛋白抗体识别的全球定位:对疫苗设计的影响
.程序。国家。阿卡德。科学。美国。
2016
;113
:E6946型
–E6954型
. 25阴
R。
,来宾
J.D.(医学博士)。
,塔赫尔扎德
G.公司。
,戈沙曼
R。
,米特拉牌手表
一、。
,Quackenbush公司
J。
,皮尔斯
英国政府。
SARS-CoV-2受体结合域抗体识别的结构和能量分析以及循环变异的影响
.公共科学图书馆计算。生物。
2021
;17
:e1009380号
. 26卡布施
西。
,砂光机
C、。
蛋白质二级结构词典:氢键和几何特征的模式识别
.生物聚合物
.1983
;22
:2577
–2637
. 27麦当劳
I.K.(印度)。
,桑顿
J.M.公司。
满足蛋白质中的氢键潜力
.分子生物学杂志。
1994
;238
:777
–793
. 28津保山
英国。
,Dauparas公司
J。
,陈
J。
,莱恩
E.公司。
,莫赫塞尼·贝巴哈尼
年。
,温斯坦
J.J.公司。
,曼根
N.M.(最小值)。
,夫钦尼科夫
美国。
,Rocklin公司
G.J.(通用)。
生物和设计中蛋白质折叠稳定性的大规模实验分析
.自然
.2023
;620
:434
–444
. 29施泰因格尔
M。
,铺草皮
J。
MMseqs2支持对大量数据集进行敏感的蛋白质序列搜索分析
.自然生物技术。
2017
;35
:1026
–1028
. 30尼卡姆
R。
,Kulandaisamy公司
答:。
,哈里尼
英国。
,夏尔马
D。
,格罗米哈
医学硕士。
ProThermDB:15年后重新访问蛋白质和突变体的热力学数据库
.核酸研究。
2021
;49
:D420型
–D424号
. 31苏迈达
K.H.公司。
,努内兹·佛朗哥
R。
,羽衣甘蓝
一、。
,佩洛克
S.J.公司。
,威奇
B.I.M.公司。
,米尔斯
L.F.有限责任公司。
,Dauparas公司
J。
,王
J。
,基普尼斯
年。
,詹姆逊
N。
等。
使用ProteinMPNN改善蛋白质表达、稳定性和功能
.美国化学杂志。Soc公司。
2024
;146
:2054
–2061
. 32凯克
Z年。
,王
年。
,刘
第页。
,隆德
G.公司。
,兰加拉詹
美国。
,福韦勒
C、。
,廖
总承包商。
,霍尔茨伯格
F.W.公司。
,沃菲尔德
K.L.公司。
,阿曼
医学博士。
等。
预防小鼠急性丙型肝炎病毒感染的广泛中和人单克隆抗体的亲和力成熟
.肝病学
.2016
;64
:1922
–1933
. 33科贝特
韩国。
,爱德华兹
D.K.公司。
,莱斯特
S.R.公司。
,阿比奥纳
O.M.公司。
,博约格鲁-巴努姆
美国。
,吉莱斯皮
注册会计师。
,希曼苏
美国。
,Schafer公司
答:。
,紫瓦沃
C.T.公司。
,迪皮亚扎
海拔高度。
等。
通过原型病原体准备实现SARS-CoV-2 mRNA疫苗设计
.自然
.2020
;586
:567
–571
. 34柯奇多尔
注册号。
,王
N。
,帕莱森
J。
,包装
D。
,特纳
H.L.公司。
,科特雷尔
首席执行官。
,科贝特
韩国。
,格雷厄姆
英国标准。
,麦克莱伦
J.S.公司。
,病房
A.B.公司。
稳定的冠状病毒尖峰对受体识别或蛋白水解引起的构象变化具有抵抗力
.科学。代表。
2018
;8
:15701
. 35跳跃者
J。
,埃文斯
R。
,普里策尔
答:。
,绿色
T。
,菲古尔诺夫
M。
,龙内贝格尔
O。
,Tunyasuvunakool公司
英国。
,贝茨
R。
,齐德克
答:。
,波塔片科
答:。
等。
AlphaFold高精度蛋白质结构预测
.自然
.2021
;596
:583
–589
. 36香港
L。
,江
E.公司。
,尼乌斯玛
T。
,卡达姆
相对单位。
,科格伯恩
K.E.公司。
,华
年。
,戴
十、。
,斯坦菲尔德
相对湿度。
,伯顿
直径。
,病房
A.B.公司。
等。
丙型肝炎病毒E2包膜糖蛋白核心结构
.科学类
.2013
;342
:1090
–1094
. 37克拉鲁普
答:。
,特鲁安
D。
,Furmanova-Hollenstein公司
第页。
,博盖尔特
L。
,布奇(Bouchier)
第页。
,毕晓普
国际期刊。
,Widjojotmodjo公司
制造商编号。
,扎恩
R。
,斯海特马克
H。
,麦克莱伦
J.S.公司。
等。
基于融合机制结构分析的高稳定性RSV F预融合疫苗
.国家公社。
2015
;6
:8143
. 38鲁顿
L。
,吉尔曼
硕士。
,布洛克兰
美国。
,尤拉斯泽克
J。
,麦克莱伦
J.S.公司。
,兰盖迪克
J.P.M.公司。
基于结构的预融合稳定丝状病毒糖蛋白三聚体的设计
.单元格代表。
2020
;30
:4540
–4550
. 39库德拉克
不锈钢。
,梅茨
美国。
,蒂奥诺
D。
,佩恩
上午。
,潘
T.T.N.公司。
,田
美国。
,福斯伯格
洛杉矶。
,马奎尔
J。
,塞姆
一、。
,张
美国。
等。
设计的、高表达、耐热的登革热病毒2包膜蛋白二聚体引发四表位抗体
.科学。副词。
2021
;7
:eabg4084
.
©作者2024。由牛津大学出版社代表核酸研究出版。