下载引文
下载引文
链接到html
基因组学时代已经出现了大量数据库的传播,这些数据库包含易于访问的数据,研究人员经常使用这些数据来解释结果和产生新想法。大多数调查人员认为从科学数据库中提取的数据是无错误的。然而,所有实验技术生成的数据都包含错误,有些数据(包括蛋白质数据库(PDB)中的坐标)也包含了实验者的主观解释。本文探讨了蛋白质晶体学家常用的蛋白质结构质量指标的决定因素。这些指标可用于数据库中的大多数结构,包括R(右)因素,R(右)自由的、实空间相关系数、Ramachandran违规。基于九个不同的质量指标,对PDB中的所有结构的整体质量进行了分析。多元统计分析表明,虽然技术进步增加了已确定结构的数量,但结构的总体质量保持不变。结构基因组学倡议所保存的结构的质量通常优于单个研究人员实验室的结构质量。最显著的结果是结构质量与结构首次发表的期刊之间的关联。罪魁祸首显然是影响较大的普通科学期刊。在竞争激烈的环境中急于发表高影响力的作品,可能导致了劣质作品的泛滥。

跟随Acta Cryst。D类
注册电子通知
跟随Acta Cryst。在推特上
在脸书上关注我们
注册RSS订阅源