结晶数据

2020年国际公平融合研讨会

CODATA/GoFair 2020

此次会议由CODATA和Go-FAIR联合组织,重点讨论跨领域数据集成主题,以帮助应对联合国可持续发展目标所述的跨学科全球挑战。会议的网络链接是https://codata.org/events/conferences/international-fair-convergence-symposium-convened-by-codata-and-go-fair-22-23-october-2020-paris-france(法语)/.日期从10月改为11月底/12月初;该网络链接可能已经注册,因此仍显示原始日期。由于世界卫生组织于2020年3月宣布的新冠肺炎疫情,该格式是虚拟的。有四个主要主题:i、。减少危机和应对(学习新冠肺炎);ii、。公平规范;(三)。公平社会;(四)。数据管理(培训和职业机会)。

90分钟的开幕式全体会议题为“2020年的国际开放科学”。Shamila Nair-Bedouelle(教科文组织自然科学助理总干事)、Peter Gluckman(国际科学理事会当选主席,常驻新西兰)和Jean-Claude Burgelman(布鲁塞尔自由大学开放科学政策与实践教授)作了三次15分钟的演讲。这些共同点是,开放科学应适用于出版物、数据/元数据和研究工作流程。随后的讨论包括另外两名小组成员:CODATA前任主席杰弗里·博尔顿和教科文组织科学政策和伙伴关系代理主管阿娜·佩西奇;还有195名与会者参加了会议。观众的辩论包括三个重点:公平数据不包括数据质量的利弊;全球南北分界线;许多职业早期的研究人员似乎希望保持数据封闭。作为IUCr在CODATA的代表,我通过“聊天”提到了两点:i、。我提交了IUCr对大数据世界中开放数据的回应的网络链接(https://www.iucr.org/news/press-releases/open-data),在2016年丹佛国际数据周上,我们重点关注了数据质量在结晶学中的重要性;ii、。我向与会者指出,中央同步加速器/激光X射线和中子设施虽然越来越多地具有原始数据访问政策,但允许为期三年的禁运期,以保护提案团队,尤其是他们的博士生。我没有提出第三点,因为我发现过去十年中的科学决策者根本不接受这一点,即资助研究通常最多涉及所有研究提案的20%,80%或更多的人未能获得资金。因此,这种没有资金支持的研究,当它最终完成并发表时,依赖于期刊订户,即使它必须躺在付费墙后面。[我在我的书的第33章和第34章中深入解释了这个问题,包括为无资金资助的研究设立开放获取出版物基金的拟议解决方案科学生活技能(2017)CRC出版社。]

海报会议包括大约40张海报。这些主要涉及数据管理和互操作性等技术主题。有一张关于爱丁堡大学支持学术和研究人员编制数据管理计划及其研究数据档案的特别有趣的海报。我与海报主持人的讨论使我学习了爱丁堡大学的数据培训课程网址:https://mantra.edina.ac.uk.

第二天,在欧洲、中国(全球)、非洲和澳大利亚举行了关于开放科学云的全体会议。这些是正在进行的工作。有趣的是,NIST代表Bob Hanisch明确表示希望美国开放科学云。随后举行了另一次关于跨域集成的全体会议,其中包括单元数字表示(DRUM)CODATA工作。这导致共享了几个主题的网络链接,例如:涉及同意规则的访问:公平不等于开放。请参见例如 https://www.mitpressjournals.org/doi/full/10.1162/dint_a_00027

本文件给出了FAIR银行环境的观点:《Annodata框架:将公平数据付诸实践》(德意志联邦银行2019-03年技术报告)。

Bob Hanisch作为DRUM CODATA工作组主席,公开呼吁科学联盟提出(困难的)用例;IUCr在DRUM工作组的代表是IUCr命名和单位委员会主席(Carol Brock教授)。澳大利亚CSIRO的西蒙·考克斯(Simon Cox)展示了国际地球物理联合会(International Geophysical Union)以pdf格式将万古宙斯转换为数字表示的例子。

第二天,有一场关于公平工作流程的会议,非常精彩。所有演示文稿的完整幻灯片包是在这里.

不幸的是,这次关于FAIR工作流的会议与FAIR实施概要(FIP)会议发生冲突。但我在上个月参加了筹备研讨会。这些数据库相当复杂,可能有利于社区开始其数据存档,但与结晶学及其成熟数据库(CSD、PDB、ICDD、COD、ICSD最近在Bruno,I.、Graíulis,S.、Helliwell,J.R.、Kabekkodu,S.N.、McMahon,B.和Westbrook,J.(2017),《晶体学和数据库》。数据科学杂志,16,第38页). 然而,我认为公平执行的主题与我们的IUCr委员会执行IUCr DDDWG最终报告建议以及原始数据归档机会有关;IUCr执行委员会可以使用公平执行概况术语询问IUCr委员会各自原始数据FIP的进展情况。

第4天的最后一次会议是关于减少灾害风险的全体会议,特别关注应对新冠肺炎的数据共享。接下来的第三天是关于患者数据跨域实现的会议。我对后者的意见是,必须从概述中进行下降,以便进入单个患者记录卡的实际内容,这是全面了解特定化合物的药物化学数据所必需的药物。这些记录卡还需要明确每个患者的新冠肺炎疫苗接种记录细节。跨域集成还必须涉及各国数据和记录的集成。这可能很复杂,正如美国国家科学院数据科学未来研讨会,从美国的角度来看,关注的是欧盟的GDPR(通用数据保护条例)立法。此外,中国的防火墙屏障不仅延伸到了受限制的互联网覆盖范围,而且显然还延伸到了数据。

整个活动做得很好,也很有趣,正如上文所述,我们可以在IUCr中采用一些可能有用的新东西(尤其是FAIR工作流程)。视频演示已发布在CODATA Vimeo通道.

名誉教授John R Helliwell DSc
CODATA的IUCr代表