“新闻”类别存档

网络研讨会3:化学数据:挑战与机遇。观看录音

我们将探索正在进行和计划中的举措,开发标准和工具、研究基础设施和文化,以支持FAIR化学数据及其准备、发布和重用。

网络研讨会3:挑战和机遇

2023年12月7日举行。可按需录制。立即注册以观看录制  

扬声器

Sonja Herres Pawlis公司
“如何向数字化学发起文化变革”幻灯片
Sonja Herres-Pawlis公司
亚琛RWTH生物无机化学主席

萨曼莎·坎扎
“我们如何应对数字化学中的异构、不公平和不同数据?”幻灯片
萨曼莎·坎扎
南安普顿大学高级企业研究员
物理科学数据基础设施(PSDI)Pathfinder领导

盖·琼斯
“数据日志如何支持(化学)数据共享和发现”幻灯片
盖·琼斯
总编辑科学数据斯普林格自然


由Revvity赞助

Revvity Signals Software的前身是PerkinElmer Informatics,拥有三十多年的科学工作流支持经验。

Revvity Signals标志

我们强大的信息学解决方案用于从药物发现到材料开发的跨学科研发。现在,在我们的Signals Research Suite下,我们的端到端SaaS解决方案集成了工作流,以加快创新并帮助科学家协作。此外,我们由TIBCO®Spotfire®提供支持的解决方案可以改变临床试验。

从我们的旗舰ChemDraw®和E-Notebook应用程序,到我们的Signals Research Suite,再到我们在数据分析方面的TIBCO®Spotfire®合作伙伴关系,Revivity Signals提供了一套强大的科学解决方案。

支持单位:



 

 

关于ChemSpider

在ChemSpider数据库上探索超过1.28亿个结构。ChemSpider包含200多个数据源,是处理数据的化学科学家的宝贵信息来源。

这一基于结构的化学信息丰富的来源可以自由访问,而且内容全面,是化学科学家处理世界各地数据的基本资源。

了解有关ChemSpider的更多信息

网络研讨会2:未来会怎样?观看录音

我们将探索正在进行和计划中的举措,开发标准和工具、研究基础设施和文化,以支持FAIR化学数据及其准备、发布和重用。

网络研讨会2:未来会怎样?

2023年11月17日举行–可按需录制。 立即注册以观看录制  

扬声器

林恩·卡默林
“化学中的数据爆炸:我们将如何处理所有数据,它将对我们产生什么影响?”幻灯片
林恩·卡梅林
乔治亚理工大学分子设计教授兼乔治亚研究联盟Vasser Woolley主席


“人工智能会赢得诺贝尔化学奖并取代我们吗?”幻灯片
西蒙·科尔斯
南安普顿大学结构化学教授

安娜·鲁尔卡
“RSC的数据共享”幻灯片
梅·科普西
RSC化学科学执行编辑
安娜·鲁尔卡
RSC数字探索执行主编


由Revvity赞助

Revvity Signals Software的前身是PerkinElmer Informatics,拥有三十多年的科学工作流支持经验。

Revvity Signals标志

我们强大的信息学解决方案用于从药物发现到材料开发的跨学科研发。现在,在我们的Signals Research Suite下,我们的端到端SaaS解决方案集成了工作流,以加快创新并帮助科学家协作。此外,我们由TIBCO®Spotfire®提供支持的解决方案可以改变临床试验。

从我们的旗舰ChemDraw®和E-Notebook应用程序,到Signals Research Suite,再到TIBCO®Spotfire®数据分析合作伙伴关系,Revvity Signals.提供了一套强大的科学解决方案。

支持单位:



 

 

关于ChemSpider

在ChemSpider数据库上探索超过1.28亿个结构。ChemSpider包括200多个数据源,是从事数据工作的化学科学家的宝贵信息来源。

这一基于结构的化学信息丰富的来源可以自由访问,而且内容全面,是化学科学家处理世界各地数据的基本资源。

了解有关ChemSpider的更多信息

网络研讨会1:数字化学数据在哪里?观看录音

 

 

这些网络研讨会将探讨数字化学数据如何促进研究——现有模型、当前挑战和范例,以及使用化学数据朝着更好的未来发展需要什么。

我们将关注数据如何支持研究——现有模型、当前挑战和范例,以及使用化学数据发展更好未来所需的内容。

网络研讨会1:数字化学数据在哪里?

按需观看:瑞吉斯现在看录音

2023年10月17日记录的网络研讨会

扬声器

利亚·麦克尤恩
“需要:可重复使用的化学数据的标准表示法”幻灯片
利亚·麦克尤恩
康奈尔大学化学图书馆员

凯文·贾布隆卡
凯文·贾布隆卡
耶拿大学研究小组组长

皮埃尔·莫里奥

皮埃尔·莫里奥
Revvity Signals化学产品营销经理

 


由Revvity赞助

Revvity Signals Software的前身是PerkinElmer Informatics,拥有三十多年的科学工作流支持经验。

Revvity Signals标志

我们强大的信息学解决方案用于从药物发现到材料开发的跨学科研发。现在,在我们的Signals Research Suite下,我们的端到端SaaS解决方案集成了工作流,以加快创新并帮助科学家协作。此外,我们由TIBCO®Spotfire®提供支持的解决方案可以改变临床试验。

从我们的旗舰ChemDraw®和E-Notebook应用程序,到我们的Signals Research Suite,再到我们在数据分析方面的TIBCO®Spotfire®合作伙伴关系,Revivity Signals提供了一套强大的科学解决方案。

支持单位:


 

关于ChemSpider

在ChemSpider数据库上探索超过1.28亿个结构。ChemSpider包含200多个数据源,是处理数据的化学科学家的宝贵信息来源。

这一基于结构的化学信息丰富的来源可以自由访问,而且内容全面,是化学科学家处理世界各地数据的基本资源。

了解有关ChemSpider的更多信息

ChemSpider网络研讨会–通过专家见解帮助您拥抱数字化学数据

你如何了解目前正在发生的化学数据趋势和最佳实践?在我们的三部分网络研讨会系列中,与领先的专家一起提升您的知识,以获得未来的成功。

网络研讨会系列将关注数据如何促进研究——当前的挑战和示例,以及如何利用化学数据创造更好的未来。它将展示当前和计划的举措,以开发标准和工具、研究基础设施和发展文化,支持可查找可访问可互操作可重用(FAIR)化学数据的准备、发布和重用。

提升您的数据实践  

作为一个免费的、由三部分组成的系列文章,为从事数据工作的化学科学家们提供了一个学习更多关于当今化学数据、未来以及数字化学数据当前面临的挑战和机遇的机会的机会。充分利用这一机会,从该领域的专家那里发现见解——注册所有三个网络研讨会。

网络研讨会3:挑战和机遇

2023年12月7日立即注册以观看录制  

扬声器

Sonja Herres Pawlis公司
“如何向数字化学发起文化变革”幻灯片
Sonja Herres-Pawlis公司
亚琛RWTH生物无机化学主席

萨曼莎·坎扎
“我们如何应对数字化学中的异构、不公平和不同数据?”幻灯片
萨曼莎·坎扎
南安普顿大学高级企业研究员
物理科学数据基础设施(PSDI)Pathfinder领导

盖·琼斯

“数据日志如何支持(化学)数据共享和发现”幻灯片
盖·琼斯
总编辑科学数据斯普林格自然


网络研讨会1:数字化学数据在哪里?

2023年10月17日举行–可按需录制。 里吉斯现在看录音

扬声器

利亚·麦克尤恩
“通缉——可重复使用化学数据的标准符号”幻灯片
利亚·麦克尤恩
康奈尔大学化学图书馆员

凯文·贾布隆卡
凯文·贾布隆卡
耶拿大学研究小组组长

皮埃尔·莫里奥

皮埃尔·莫里奥
Revivity Signals化学产品营销经理


网络研讨会2:未来会怎样?

2023年11月17日举行–可按需录制。 立即注册以观看录制  

扬声器

林恩·卡梅林
“化学中的数据爆炸:我们将如何处理所有数据,它将对我们产生什么影响?”幻灯片
林恩·卡梅林
乔治亚理工大学分子设计教授兼乔治亚研究联盟Vasser Woolley主席


“人工智能会赢得诺贝尔化学奖并取代我们吗?”幻灯片
西蒙·科尔斯
南安普顿大学结构化学教授

安娜·鲁尔卡
“RSC的数据共享”幻灯片
梅·科普西
RSC化学科学执行编辑
安娜·鲁尔卡
RSC数字发现执行编辑


由Revvity赞助

Revvity Signals Software的前身是PerkinElmer Informatics,拥有三十多年的科学工作流支持经验。

Revvity Signals标志

我们强大的信息学解决方案用于从药物发现到材料开发的跨学科研发。现在,在我们的Signals Research Suite下,我们的端到端SaaS解决方案集成了工作流,以加快创新并帮助科学家协作。此外,我们由TIBCO®Spotfire®提供支持的解决方案可以改变临床试验。

从我们的旗舰ChemDraw®和E-Notebook应用程序,到Signals Research Suite,再到TIBCO®Spotfire®数据分析合作伙伴关系,Revvity Signals.提供了一套强大的科学解决方案。

支持单位:



 

关于ChemSpider

在ChemSpider数据库中探索超过1.28亿个结构。ChemSpider包含200多个数据源,是处理数据的化学科学家的宝贵信息来源。

这一基于结构的化学信息丰富的来源可以自由访问,而且内容全面,是化学科学家处理世界各地数据的基本资源。

了解有关ChemSpider的更多信息

ChemSpider移动应用程序

ChemSpider手机是由Molecular Materials Informatics Inc开发的应用程序1代表皇家化学学会,允许用户探索移动设备上ChemSpider的好处。自推出以来,我们对ChemSpider.com进行了改进,包括响应性设计元素,使其能够更好地用于智能手机和平板电脑2以及ChemSpider网络服务的升级正是由于这些发展,我们认为及时审查社区对该应用程序的需求,并决定从31开始停止对为该应用程序提供支持的服务的支持标准10月。我们要感谢所有使用该应用程序并提供反馈以帮助其开发的人,并鼓励您在未来的移动应用中使用ChemSpider.com。

1网址:http://molmatinf.com/

2http://blogs.rsc.org/chemspider/2015/05/21/introduction-to-the-new-chemspider网站/

三。https://developer.rsc.org/

化学验证和标准化平台(CVSP)

化学验证和标准化平台(CVSP)1是在Open PHACTS IMI项目期间开发的2通过测试验证和标准化协议处理化学结构文件。其目的是为社区提供对其化学结构文件的严格分析,以确保通过在线数据库发布到公共领域的数据得到预先验证。在线CVSP网站为测试规则集提供了一种有用的方法,并允许用户验证其结构文件,但独立网站于2018年11月离线。作为一种传统,代码库和规则集已经发展并应用于deposit.ChemSpider.com上的ChemSpider沉积系统围绕化学结构文件适当标准化的社区讨论仍在继续。GitHub也提供了原始代码。4

  1. 化学验证和标准化平台(CVSP):化学结构数据集的大规模自动化验证,化学杂志。, 2015,7:30,https://doi.org/10.1186/s13321-015-0072-8
  2. https://www.openphacts.org
  3. https://deposit.chemspider.com/
  4. https://github.com/openphacts/ops-crs/tree/master/CVSP

皇家化学学会与ACD/实验室重新建立合作关系,继续向全球研究界提供行业领先的数据

在十年的里程碑之后,ACD/Labs算法将继续为ChemSpider配备物理化学特性值和化学命名法。

加拿大多伦多(2018年7月26日)ACD/实验室,一家信息公司,开发并商业化支持研发的解决方案,今天宣布继续与化学蜘蛛皇家化学学会拥有的领先化学数据库,继续为不断扩展的平台提供预测的物理化学性质和化学命名。 十多年来,科学家们利用这一公开可用的免费资源来收集有关化合物的信息,为研究或实验做准备。

作为物理化学预测软件的行业标准,选择ACD/Labs生成属性信息,包括日志,日志D类(在各种pH下)、Lipinski五分规则值和沸点,并提供结构名称(反之亦然)功能。伙伴关系的更新进一步反映了该平台的成功及其作为科学界最强大的在线化学结构数据库之一的持续重要性。随着平台的发展,ChemSpider将继续使用ACD/Labs算法为研究人员提供高质量的见解。

皇家化学学会出版商理查德·基德(Richard Kidd)表示:“我们的使命是让研究人员能够全面了解化学数据,为研发计划提供信息。”。“通过与ACD/Labs合作并利用其属性信息,我们能够满足用户的知识需求,这反映在我们自十年前皇家化学学会收购ChemSpider以来的快速增长中。迄今为止,由ACD/Lab算法填充的属性信息是ChemSpid上访问最多的信息之一r、 并且仍然是我们服务的关键驱动因素。”

虽然ChemSpider将其数据库的规模扩大了一倍,但它仍致力于维护来自选择性来源的高质量数据。随着平台的不断发展,ChemSpider将以批处理方式使用ACD/Percepta预测算法和ACD/Name工具来填充数据库并增强公开可用的化学情报。

ACD/Labs欧洲高级销售总监Gabriela Cimpan表示:“促进化学知识的传播并提供加快研发的解决方案是我们ACD/Lab的首要任务。”。“ChemSpider正在为整个化学界的知识注入活力,我们很荣幸能够支持全球的学习。”

有关ACD/Percepta的更多信息,请访问https://www.cdlabs.com/percenta网站

有关ACD/Labs化学命名工具的更多信息,请访问https://www.acdlabs.com/name

有关ChemSpider的更多信息,请访问http://www.chemspider.com(化学蜘蛛网)

关于Advanced Chemistry Development,Inc。

ACD/Labs是一家领先的科学信息技术提供商,为依赖分析数据和分子信息进行决策、解决问题和产品生命周期控制的研发组织提供科学信息技术。我们的软件自动化并加速分子表征、产品开发和知识管理。我们与现有的信息系统集成,并承担包括企业级自动化在内的定制项目。

ACD/Labs解决方案在全球范围内广泛应用于各种行业,包括制药/生物技术、化学品、消费品、农用化学品、石化以及学术/政府机构。我们提供全球销售和支持,以及20多年的经验和成功经验,帮助组织加快研发和利用企业智能。有关更多信息,请访问网址:www.acdlabs.com。在推特上关注我们@ACD制动.

关于英国皇家化学学会

英国皇家化学学会是世界领先的化学团体,致力于推动化学科学的卓越发展。我们拥有超过50000名成员,知识业务遍及全球,是英国化学科学家的专业机构;一个拥有175年历史和国际视野的非营利组织。我们提倡、支持和庆祝化学。为了科学和人类的利益,我们致力于塑造化学科学的未来。

将RSC CIFS添加到ChemSpider

艾琳·戴著。

我们很高兴地宣布,我们刚刚向ChemSpider导入了1047个CIF,这些CIF的晶体结构是之前在RSC论文中报告的(可作为ESI获得),用于ChemSpier的相关化合物,并将这些CIF链接回原始文章和CCDC的webCSD,例如。带有RSC商品CIF的示例化合物(请参阅CIF信息框)。由于上传到ChemSpider中的每个CIF都必须与ChemSpier化合物相关联,因此这项任务的难点在于计算出2D分子结构(在.mol文件格式)对于每个3D晶体结构(in.cif文件格式)–这尤其困难,因为CIF只包含关于每个原子位置的信息,而不包含原子在晶体中如何相互键合或是否带电的信息。
最终,我们希望这个CIF到mol的转换(以及整个上传)能够以编程方式执行,而无需人工干预。然而,目前还没有可靠的方法来做到这一点,尽管有一些程序,如OpenBabel公司可用于从每个CIF中提取mols,此转换的可靠性不是100%。
因此,作为今年夏天南安普顿大学的一个学生实习项目(与南安普顿大学的另一个学生实习项目,在ChemSpider中共享论文数据)我们使用OpenBabel(2.3.2版,从命令行运行,选项为-i cif inputfilename.txt-o mol-m–unique-d–AddPolarH)为RSC存档中的所有cif提取mol(截至2013年6月,超过43000个文件),并招募了Julija Kezina(如下所示)审查这些转化的结果,以确保只有良好的结构和CIF对才能沉积到ChemSpider,并更好地理解转化过程中的问题,以期解决这些问题。一个立即显而易见的问题是,因为获得的2D结构只是3D结构沿细胞轴的投影,而细胞轴并不总是最清楚地显示分子的方向,即使它们在原子之间有写化学连接,所以所有的分子结构都是贯穿的OpenEye的清洗算法之前进行审查。

Julija Kezina-南安普顿大学实习生,检查了CIF到Mol的转换

Julija Kezina——南安普顿大学实习生,检查了CIF到Mol的转换

Julija将输出mol文件中的每个结构与原始CIF文件中的结构进行比较,以判断转换是否准确。此外,作为额外检查,所有输出mol结构都提交给ChemSpider验证和标准化平台过滤出有结构问题的分子(例如立体化学、价态或拥塞问题)。
总的来说,Julija检查的大约30%的CIF到mol的转换是良好的,原子和离子的连接正确(尽管其中大约30%需要重新定位原子位置以手动或使用ChemDraw的清洁功能清洁或整理结构)。其中1047个分子只含有一个分子(不含溶剂分子或共晶体等),是那些与相应的CIF一起沉积到ChemSpider中的分子。
成功转化率最高的期刊为分子生物系统(57%),医学化学通讯(51%),有机和生物分子化学(44%)和绿色化学(44%)–通常是关于有机小分子的期刊。
朱莉娅当时在国家晶体学服务局办公室在西蒙·科尔斯教授的共同指导下,我们非常感谢他们对CIF文件格式更精细方面的帮助和建议。

CIF到摩尔的转换不成功

在如此庞大而多样的一组结构上运行和评估OpenBabel给了我们一个有用的机会来识别和分类遇到的最常见问题。在这里,我们将分享这些并给出一些示例,这些示例将帮助识别管道中的一些简单修复,这些修复可能有利于整个社区,并在这样做时用作测试用例。我们将向OpenBabel论坛由于OpenBabel是开源的,希望在未来通过与其他开发人员的合作来解决其中的至少一些问题。

以下OpenBabel错误看起来可能最容易修复:

细节 例子
  • 类别:BAD_NITRO
  • 频率:233
  • 描述:在结构抽屉中有不同的硝基表示方法——OpenBabel目前通过用五价氮生成摩尔来表示硝基。在ChemSpider中,我们选择使用电荷分离的硝基来避免这种情况。
  • 解决方案:允许OpenBabel为硝基提供不同的输出选项,以输出更正后的mol文件中所示的硝基。

  • 类别:BAD_MULT
  • 频率:434
  • 描述:尽管使用–unique选项运行OpenBabel(应该根据分子英寸筛选出重复的分子),但结果mol文件中仍然存在重复的分子(完全相同,包括立体化学)
  • 解决方案:在使用–unique选项运行时修复OpenBabel,使其正常工作。

  • 类别:BAD_MISSINGPARTOFMOLECULE
  • 频率:724
  • 说明:部分分子缺失
  • 原因:OpenBabel不理解晶体对称性——只有CIF中明确列出位置的原子包含在生成的mol文件中,而那些通过对称性推断的原子则不包含在内。
  • 解决方案:让OpenBabel从CIF文件中的对称性生成完整的分子,或者建议在OpenBabel之前运行一个脚本/程序,该脚本/程序可以处理CIF以生成另一个包含所有原子的CIF。

  • 类别:BAD_PARTIALOCCUPANCY
  • 频率:432
  • 描述:CIF文件中特定原子的多个站点的部分占用
  • 原因:在CIF文件中,有时指定了多个站点的位置,但占用率小于1–OpenBabel无法识别这一点,并假设所有站点的占用率都是1,因此mol文件中存在一些原子或碎片的副本。
  • 解决方案:如果_atom_site_occupancy小于1,则将原子分组为相互替代的原子(按类型、接近度以及总占用率为1的原子)并且只选择其中一个包含在最终mol文件中(站点占用率最高的文件,或者如果两个占用率相等,例如0.5,则随机选择一个)。请注意,需要保持一致性,例如,如果丢弃一个C,那么所有具有部分占用的相邻H也将被丢弃,但与包含的C相连的H也将包括在内(如所附示例中所示)。

许多问题都是由输入CIF中的不同步或错误引起的,但OpenBabel总体上并没有很好地处理这些问题(例如,通过编写错误消息和终止程序),而是在大多数情况下进入了无限循环,程序挂起。由于这一点,并且由于OpenBabel转换是较长脚本的一部分,所有OpenBabel作业都必须在任意超时的情况下运行,这样,如果在此超时后仍在运行,它们就会被终止,这可能会丢弃一些有效但长时间运行的OpenBabell作业。我们将调查是否有可以在CIF上自动执行的验证程序,以筛选出存在这些问题的验证程序(类似于CCDC的EnCIFer但是当OpenBabel遇到这些问题时,它能够很好地退出,从而使其更加可靠,因此不需要预先验证。下表列出了这些问题:

细节 例子
  • 类别:CIF_NOCOORDINATES
  • 频率:378
  • 描述:cif不包含任何坐标
  • 原因:一些CIF包含粉末衍射细化数据,但不包含坐标。
  • 解决方案:OpenBabel已经发出了一个错误:“CIF错误:找不到原子!(在数据块XXX中)”——如果发现了,只需终止程序即可(而不是尝试继续)。
  • 类别:CIF_MISSINGLOOP
  • 频率:85
  • 说明:cif缺少“loop_”行
  • 解决方案:在尝试进行转换之前,首先检查预期位置是否至少有一个loop_行。

  • 类别:CIF_COMMENTEDFIELD
  • 频率:36
  • 描述:如果在CIF的注释部分中有一个CIF字段名,OpenBabel不会忽略它并进入infinte循环
  • 解决方案:确保OpenBabel忽略注释掉的CIF字段名(在一对分号之间)是很容易的。

以下OpenBabel错误是最常见的,但很难修复。它们产生于这样一个问题,即CIF格式没有记录原子/离子上的电荷或原子/离子之间的邦格类型,因此OpenBabel需要计算出它们,这很难正确执行。

细节 例子
  • 类别:BAD_CHARGEMISSING
  • 频率:830
  • 描述:分子中的一个或多个离子在生成的mol文件中带有错误的电荷

  • 类别:BAD_WRONGCOORDINATION
  • 频率:747
  • 描述:分子中的一个或多个原子或离子配位错误-在金属离子、S、P、Se和B中观察到问题

  • 类别:BAD_BONDMISSING
  • 频率:587
  • 描述:分子中的一个或多个键的顺序错误,例如单键而不是双键。

  • 类别:BAD_WRONGBOND
  • 频率:452
  • 说明:单键/双键顺序错误。

  • 类别:BAD_NOCOORDL
  • 频率:52
  • 说明:与配体无配位。

  • 类别:BAD_MISSINGH
  • 频率:18
  • 说明:缺氢。

此外,生成的mol文件也存在一些问题,OpenBabel无法修复这些问题(因为这些问题是由于输入CIF文件的错误或限制导致的,这些错误或限制无法追溯修复),或者太难修复和/或出现的次数太少,不值得付出努力:

    • 共有237例CIF中存在溶剂分子(其中许多含有缺失的氢、分子或部分分子的部分占据等),从而在生成的mol文件中产生虚假的氧、分子碎片和自由基(参见CIF:CCDC 213787号和ChemSpider记录:68005706). 其中148种情况只是水溶剂分子,其中氢原子缺失或分离。溶剂分子的定义较差是衍射的CIF文件的限制,因此OpenBabel不可能在它们的输出摩尔中更好地定义它们。然而,使用-r选项运行OpenBabel以去除除最大连续片段外的所有片段,非常成功地去除了这些有问题的溶剂分子,因此不需要采取进一步的行动来处理这个问题,我们将来将使用这个选项。
    • 有81个案例中,原始CIF中至少有一个氢元素缺失(或有3个案例中所有氢元素缺失)-参见CCDC 259871号.
    • 一些CIF包含对应于连续网络的晶体结构,而不是小分子(例如聚合物、MOF、沸石、POM),这些小分子无法以摩尔格式捕获-请参阅川庆钻探206593.
    • 在少数(24)种情况下,获得的摩尔文件中的立体化学定义不正确。然而,由于OpenBabel对立体化学进行了很好的解释,并且这些案例相对较少,因此可能不值得打扰苹果车来进一步调查这些–请参阅加拿大中央银行238611以及ChemSpider化学蜘蛛9419187.

南安普顿大学实习,将论文数据传输到LabTrove和ChemSpider

艾琳·戴著。

今年夏天,南安普顿大学(University of Southampton)的一些学生参加了该校与皇家化学学会(Royal Society of Chemistry and ChemSpider)联合项目的实习。其中三名学生一直在筛选来自理查德·惠特比的研究小组为了提取其中的化合物、光谱和反应数据(以及链接的实验室笔记和存档光谱文件),并在LabTrove、ChemSpider和CSSP中共享这些数据。学生们——亚历克斯·哈特克、耶特·韦·李和乔什·惠塔姆(均为二年级本科生)——以及他们数字化的论文数据、实验室笔记本和光谱打印输出文件如下图所示。

南安普顿大学实习生

南安普顿大学实习生

他们将由A.Henderson、L.Sayer、D.Owen、D.Macfarlane、F.Giustiniano、G.Saluste和J.Stec撰写的7篇论文数字化,最终将1035个LabTrove页面发布到惠特比集团的LabTrove博客.

这些论文是化合物信息的丰富来源,包括化合物的结构、名称、性质和光谱,所有这些信息都存储在ChemSpider中,从而导致208页新复合页、和关于600光谱.

在这个项目中,学生们手动将化合物信息存入LabTrove,然后将化合物和光谱存入ChemSpider。然而,我们目前正在开发一系列ChemSpider jquery小部件,这些小部件可以集成到基于网络的ELN中,如LabTrove,这将使将ChemSpider的化合物信息输入实验变得更容易,并将ELN中的化合物和反应数据发布到ChemSpider、CSSP和ChemSpider Reactions。这将从最初的概念证明检索ChemSpider信息并将其输入LabTrove页面。

考虑到这一长期目标,实习生存储化合物和反应数据的LabTrove页面是使用LabTrive模板构建的,这种结构将使发布小部件更容易理解数据并以正确的方式处理数据。通过这种方式,该项目在一定程度上是一项测试,以确保模板适合在LabTrove中存储复合数据。以及ChemSpider化合物和相关数据模板(具有相应的帮助页,模板也以格式化的方式存储反应数据,因为论文主要关注化合物的合成。最简单的是,基本反应数据可以使用ChemSpider反应模板(和相应帮助页最终,以这种格式撰写的帖子将很容易发布到ChemSpider Reactions。可以使用ChemSpider SyntheticPages风格的反应模板(和相应帮助页。最初的目的是将所有反应数据存入ChemSpider合成页但很明显,除了进行反应的研究人员或他们的主管之外,任何人都很难为CSSP提交提供必要的详细程度,尤其是通过回顾性摘要无法轻易达到。因此,只有少数反应提交给了CSSP,大多数(超过500个)储存在LabTrove中,以便将来提交给ChemSpider reactions。

如果反应可以很容易地从ELN发布到ChemSpider反应,并且在执行新反应时,其他研究人员及其应用程序很容易查询,那么这将是实现拨号分子(EPSRC Grand Challenge网络)。需要捕获的反应数据的一个重要部分是反应中使用和产生的物质的化学计量表。然而,这些化学计量表太复杂,无法合并到LabTrove模板中,因此LabTrove反应模板将与一个新的ChemSpider jquery小部件结合使用,该小部件目前正在与LabTrove集成(更多细节将在本博客中很快发布!),该小部件将构建它们。该小部件执行ChemSpider查找以检索化合物信息,并将计算当量,从而节省研究人员计算所需反应物数量或获得产品产量的时间。最初使用ChemSpider反应模板然后使用ChemSpider编辑化学计量表窗口小部件向其添加化学计量表在这里.

如果您是LabTrove用户并希望使用ChemSpider模板,可以通过上面的链接获得其源代码,并记录了在LabTrove中使用模板的说明在这里.