计划
下载节目手册副本(PDF文件,1.3MB)
一、标准信息交换形式
09:05结晶学中的相干信息流B.麦克马洪摘要|演示文稿
从最初作为结构测定实验的描述性框架开始,CIF已经发展成为结晶实践许多方面的强大框架。它描述或积极用于原始数据收集(如衍射图像)、数据还原(如结构因子或Rietveld剖面)、结构解决方案和精细化,以及晶体和分子结构的出版、数据库管理和可视化。虽然它不是结构科学中常用的唯一格式,但它对小单元-细胞和大分子结构的结构确定至关重要,其本体论方法为整个晶体学研究中的信息和数据处理提供了最佳实践。
布莱恩·麦克马洪是国际结晶学联合会驻英国切斯特办事处的研发官,也是国际晶体学联合会科学数据委员会CODATA的前代表。他是COMCIFS的协调秘书,也是《晶体学国际表》第G卷:晶体学数据的定义和交换的合编人。 (隐藏| 全部隐藏)
09:30 mmCIF和结构生物信息学J.韦斯特布鲁克摘要 |演示
蛋白质数据库是结构生物学皇冠上的一颗明珠,是蛋白质和核酸结构的无与伦比的档案。它的操作依赖于信息丰富的关系数据库,其模式有效地表示为大分子CIF(mmCIF)形式。可存储在数据库中的离散实体在CIF-format数据字典中进行了描述,该字典表达了广泛用于结构基因组学、核磁共振、低温电子显微镜和蛋白质生产等领域的本体。
约翰·卫斯布鲁克是罗格斯大学RCSB蛋白质数据库的项目团队负责人。他在创建和维护PDB数据库模式、开发支持PDB操作的许多软件工具以及与其他结构生物学社区开发正式本体方面发挥了关键作用。他是COMCIFS的成员。 (隐藏| 全部隐藏)
09:55 pdCIF和真实数据的混乱世界B.H.托比摘要 |演示
粉末衍射很可能是单晶衍射的贫困表亲,但对于许多材料和测量,没有其他选择;对从简单盐到蛋白质等材料的粉末进行了结构分析。许多其他类型的材料表征可以用粉末衍射法进行。根据研究的需要和照明源的类型,有优秀的仪器可以以不同的方式测量粉末衍射。成功的建模要求数据以接近原始测量的形式保存,这给粉末CIF字典(pdCIF)带来了复杂性。最初的pdCIF词典问世已经将近15年了,我们将考虑pdCIF的成功与失败。
布莱恩·托比在化学工业、学术和政府部门拥有广泛的专业经验,后者包括同步加速器和研究反应堆设施。他的研究兴趣是了解固体中原子的排列如何决定材料的化学或物理功能,以及这些研究技术的开发和教学。为此,他从事软件和仪器开发,并进行测量和分析结果。他与学术界、工业界和政府的研究人员合作,发表了120篇论文,被引用近6000次。他是COMCIFS的前成员,是粉末CIF(pdCIF)字典开发工作的领导者。 (隐藏| 全部隐藏)
二、。改进实验数据的管理
10:40科学研究中的数据爆炸和管理不同数据源的需要-S.J.科尔斯摘要 |演示文稿
晶体结构测定已经成为一项高通量的活动,甚至在部门实验室一级,自动化在管理实验以及从实验及其后续处理、分析和传播中收集的数据方面越来越重要。英国国家晶体学服务中心是一个中等规模的机构,除了努力实现最佳实验实践外,还需要解决数据管理、问责制和传播问题。在为化学家和晶体学家提供服务的过程中,它在跨学科本体构建、通过存储库平台发布数据以及与实验室管理系统集成方面积累了大量经验。
西蒙·科尔斯现任英国国家晶体学服务中心主任,南安普顿大学化学系教职员。 (隐藏| 全部隐藏)
11:05原始衍射图像的沉积和使用J.R.海利维尔摘要 |演示文稿
IUCr执行委员会已责成一个工作组评估存放原始实验数据集(最初重点放在X射线衍射图像上)的潜在益处,以及这样做的成本、技术和结构影响。有许多存放原始图像的潜在位置,允许在验证、重新定义、重新分析新科学、教育和软件开发中重复使用这些图像,例如在特定学科的数据中心、大型仪器设施或机构存储库中。这些并不一定是排他性的(例如,中央数据中心可能只存档与已发布结构相关的数据集),澳大利亚TARDIS等举措展示了联合独立存储库平台的方法。这些联邦档案之间的互操作性至关重要的是定义明确的元数据和程序标准。
约翰·赫利维尔在物理学和分子生物物理学方面受过训练,现为曼彻斯特大学结构化学名誉教授。他是国际结晶学联合会期刊的前任编辑兼欧洲结晶学协会前任主席。他的研究涉及应用于结构化学和生物学的结晶学方法的发展。他目前是国际自然科学联合会科学数据委员会(CODATA)和国际科学技术信息理事会(ICSTI)的代表,并担任国际自然科学委员会衍射数据保存工作组主席。他还是CODATA/VAMAS纳米材料描述工作组的成员。 (隐藏| 全部隐藏)
11:30管理各种科学实验的研究数据-E.杨摘要 |演示文稿
卢瑟福德·阿普尔顿实验室是英国国家设施,负责大量实验研究,并操作许多产生大量数据的仪器,如ISIS脉冲中子源、中央激光设施和金刚石光源。它开发了一个核心科学元数据模型(CSMD),用于以统一的方式管理设施的数据资源。本次演讲讨论了在大型实验室环境中系统管理数据的可用性带来的新机遇,以及在现实世界开放数据基础设施开发中广泛使用这些数据的技术障碍。将介绍CSMD的最新发展,以突出我们在PaNData-ODI项目背景下的当前方向,该项目是一个欧洲合作项目,涉及13个世界级的主要研究实验室,在欧洲运行一个或多个中子或光子源。
埃里卡·杨她是STFC卢瑟福-阿普尔顿实验室的高级计算机科学家,在科学计算部工作。她还是国家实验室服务联络官,负责制定STFC国家实验室的可持续长期数据服务研发战略和路线图。她曾与英国国家晶体学服务中心和剑桥大学合作,为英国结构科学界开发跨组织数据基础设施技术。她还管理和指导涉及STFC设施、大规模数据和HPC基础设施的项目。在欧盟FP7项目“PaNData-ODI”中,她与国际设施(如ESRF、ILL、DESY)密切合作,为欧盟光子和中子社区定义和开发一个全面集成的跨设施数据管理路线图和服务。 (隐藏| 全部隐藏)
11:55使用集成CIF、HDF5和NeXus管理设施中的晶体学数据-H.J.伯恩斯坦摘要 |演示文稿
大型科学设施内互操作性的一个具体方面是管理与不同领域相关的不同数据格式。NeXus、HDF5和CIF是在某些领域重叠的科学数据格式(例如在X射线衍射图像的捕获和管理方面),通过协调它们的内容并努力实现最大互操作性,可以获得相当大的好处。语法级别的格式转换可能是一个简单的过程,但真正可互操作的软件应用程序需要不同表示标准之间的功能映射。目前正在尝试通过构建一个DDL2字典来实现这一点,作为现有NeXus和imgCIF格式之间的协调。NeXus和imgCIF之间的完全互换依赖于方法评估,并且可能使用新的字典定义语言DDLm和评估引擎(如dREL)。
赫伯特·J·伯恩斯坦是纽约奥克代尔道林学院数学和计算机科学教授。他是COMCIFS的成员,imgCIF字典工作组主席,CIFtbx(一个用于处理CIF数据的Fortran库)的首席开发人员。他还是NeXus国际咨询委员会(NIAC)的成员。 (隐藏| 全部隐藏)
12:20研究数据管理和英国资助政策-S.霍德森摘要 |演示文稿 III、 已发布信息的完整性
13:45《晶体学学报》小单元结构的出版M.A.霍兰德摘要 |演示文稿
IUCr出版的结构期刊围绕CIF标准建立了高效的工作流程。对于小单元结构,作者以这种格式提交他们的文章,以他们的结构解决方案/优化软件直接创建的文件为基础。确定结构的处理过的实验数据(结构因子、Rietveld剖面)也以这种格式上传,允许对结构建模的质量进行严格的技术同行评审。所有已发布的结构都附有允许其重新确定的基础数据,并且可以通过三维可视化和分析工具在在线出版物中进行探索。
迈克尔·霍兰德是英国切斯特国际结晶学联合会的系统开发人员。他维护用于验证小单元结构的checkCIF web服务,是IUCr期刊作者提交和审查系统的首席开发人员。 (隐藏| 全部隐藏)
14:10验证小单元结构;了解checkCIF报告-A.林登摘要 |演示文稿
当提交小型结构在IUCr期刊上发表时,软件套件checkCIF会将其作为同行评审过程的一部分进行分析。该分析的目的是参考可用的实验数据以及与已知化学的一致性水平,对已发布结构的质量和可靠性进行客观评估。
为了更好地工作,验证协议必须跟上结构确定方法的进步。因此,重要的是,资本投资基金工具和定义既实用,又能定期扩展和修订。用户、审稿人和期刊编辑也必须容易理解验证的目的和输出,其中一些人可能不是专业的晶体学家。
安东尼·林登是苏黎世大学有机化学研究所X射线晶体学设施的研究小组组长,也是《晶体学学报》C辑的编辑。 (隐藏| 全部隐藏)
14:35用publBio-M.维斯摘要 |演示文稿
对于生物大分子来说,结构和实验数据传统上存放在中央档案馆(蛋白质数据库)中,将结构数据与衍生出版物整合起来更为复杂。IUCr期刊开发了一种在线出版工具,可以从档案中提取沉积的大分子数据,并提示作者提供所需的额外信息,以确定大分子结构的完整特征。同样,目标是最大限度地提高科学讨论的完整性。
曼菲尔德·威斯在柏林亥姆霍兹中心的软物质和功能材料研究所工作,是《晶体学学报》F版的编辑。自2002年以来,他一直是《晶体学学报》D版的联合编辑,是IUCr晶体学教学委员会的成员,也是IUCr生物大分子委员会的顾问。 (隐藏| 全部隐藏)
15:00大分子结构的沉积和验证S.Velankar公司摘要 |演示文稿
结构生物学界越来越意识到,蛋白质数据库(PDB)中存储的结构的质量需要使用信息丰富、定义明确和社区接受的验证方法进行关键评估。为了获得适用于PDB中新沉积和现有结构的验证方法和标准的建议,世界蛋白质数据库(wwPDB)召集了几个验证工作组(VTF)。wwPDB X射线VTF建议的验证方法和标准将用于验证PDB中存放的所有X射线结构以及档案中已经存在的所有晶体结构。演讲将强调验证的重要性,并描述X射线VTF建议的实施情况。还将讨论新wwPDB X射线验证管道生成的验证报告的显著特征。希望所有发表生物大分子结构论文的期刊,只要收到描述新结构的手稿,就必须提交这些报告。
萨米尔·维兰卡是EBI的团队领导者,负责欧洲蛋白质数据库(PDBe)资源的内容和集成。1997年,他在印度班加罗尔的印度科学研究所获得结构生物学博士学位,从事胸苷酸合成酶和磷酸三糖异构酶的蛋白质晶体研究。随后,他加入了位于牛津的Dale Wigley团队,进行了关于DNA解旋酶机制的博士后研究。他曾与PDBe团队合作并为其运营的所有部分做出贡献,从新存放结构的注释到高级PDBe服务的开发。 (隐藏| 全部隐藏)
四、 走向更好的科学
15:45数据质量和结构数据库的价值-C.新郎摘要 |演示文稿
剑桥有机和金属-有机结构结构数据库是几十年来至关重要的晶体和化学资源结构数据档案的一个例子。许多基于此类数据库中所持数据的结构分析依赖于单个结构的质量和可靠性。从历史上看,CCDC的科学编辑们一直在努力验证个人证词,CIF作为社区标准格式的采用极大地帮助了这项任务。CCDC现在应用概率计算工具来确定CIF和专家人体分析代表的“化学”。
科林·格鲁姆是剑桥晶体数据中心的执行主任。在英国和新西兰从事学术工作后,格鲁姆博士加入辉瑞,在英国成立了蛋白质晶体学小组。随后,他在英国和美国担任各种计算和信息学职务。在此之后,他加入了Celltech/UCB,领导研究化学和计算机辅助药物设计小组。 (隐藏| 全部隐藏)
16:10走向科学的语义网P.穆雷-鲁斯特摘要 |演示文稿
CIF的发展使IUCr期刊能够在很大程度上捕获研究文章的结构化语义内容。学术文章组件(文本、结构数据模型、实验数据)之间的超链接为借助大容量机器人工具挖掘、验证和重用科学数据提供了坚实的技术基础。 彼得·默里-鲁斯特直到2012年,他还是剑桥大学联合利华分子信息学中心的分子信息学读者。他是化学标记语言(CML)的Henry Rzepa的联合开发人员,也是COMCIFS的顾问。 (隐藏| 全部隐藏)
16:35以到岸价展望未来N.斯巴达克尼摘要 |演示
1991年,当CIF被IUCr采用为信息交换标准时,如果说有什么不同的话,那就是它领先于当时的技术水平。自由格式、可扩展、低开销-它为科学软件的实现提供了一条简单的途径,许多软件仍然是用Fortran编写的。通过将其标签的语义外部化到外部词典中,它使本体开发与格式脱钩,从而在纯晶体学应用程序与更广泛的结构生物学、化学信息学和实验室数据管理领域之间的互操作性中发挥了重要作用,如本次研讨会其他地方所示。CIF的最新增强功能,引入了更强大的字典定义语言,支持方法定义和多数据模型,为将计算机本体引入全新领域提供了无与伦比的潜力。
尼克·斯帕达奇尼是STAR文件格式、STAR方法字典开发语言(DDLm)和字典方法评估软件dREL的主要作者之一。 (隐藏| 全部隐藏)
|