提高研究图像数据可靠性的软件：Wiley、Lumina和哈佛医学院的研究人员合作解决方案

提高研究可靠性的软件-图像数据-文件-灯具和研究人员-哈佛医学-学校合作-解决方案

克里斯·格拉芙，威利开放研究团队前科研诚信总监。

2022年3月9日

本博客由哈佛医学院学术与研究诚信办公室首席科学研究员玛丽·沃尔什博士和威利研究诚信与出版伦理主任克里斯·格拉夫撰写

Wiley和Lumina正在共同努力，支持哈佛医学院的研究人员开发和测试新的机器学习工具和人工智能（AI）软件，以识别研究图像数据中的差异。我们正在寻找一种我们都需要的解决方案，以提高研究质量，减少研究浪费。

Wiley的一个研究图像处理的例子来说明。已克隆、旋转和复制原始图像中的标记区域。

据报道，4%的生物医学研究文章可能包含至少一个重复图像（Bik、Casadevall和Fang，2016). 检测、识别和纠正这些错误图像的能力有可能减少无意错误和/或故意歪曲的图像在已发表文献中的包含，从而使研究结果更加可靠和有用。Lumina将从Wiley发表的经更正和撤回的研究文章中整理多达10000幅图像，并将其发送给哈佛医学院的研究人员。哈佛医学院（Harvard Medical School）的研究人员将使用这些图像来训练和测试AI软件，该软件可以识别可能被滥用和/或更改的图像。项目工作产生的代码现在是，将来也将是，开源该研究的目标包括帮助识别世界研究文献中不可靠的研究数据，帮助实验室领导识别错误，进而支持世界各地研究实验室的良好数据管理实践。

这个问题

在这个大数据时代，研究项目每天可以生成TB级的数字图像数据。管理这些大量数据非常复杂。准确跟踪实验数据源的错误可能会导致图像被歪曲——当它真的来自另一个实验时，它会作为一个实验的结果发布。这些错误混淆了研究结果的可靠性。此外，对原始数据的更改和操作，无论是否出于善意，都可能进一步导致不可靠的研究报告。

发表后，包含这些潜在问题图像的研究文章可能需要更正或收回。首席科学研究员玛丽·沃尔什博士说：“对生物医学文献中图像使用的评估在很大程度上仍然是手动的，并且依赖于视觉检查来识别差异，例如操作和重复使用有或无操作的图像数据。”，哈佛医学院学术和研究诚信办公室，哈佛研究研究首席研究员。“我们的研究工作将利用Wiley和Lumina提供的图像数据，帮助我们开发检测这些挑战的平台，最好是在出版之前，并建立基准资源（如图像库）继续支持社区努力创建工具，以提高研究数据的准确性和质量保证。”

解决方案

哈佛大学的研究人员计划开发的软件，使用鲁米娜提供的威利的图像，将有助于识别和分类像比克和其他人描述的图像处理迹象（Byrne&Christopher，2020），并将使出版前后识别和处理有问题图像的工作更加常规和可靠。

“正如从流行病到气候变化等众多社会问题所表明的那样，研究人员、公司和国家领导人必须掌握准确的信息，以推动他们的关键决策。我们很高兴与威利和哈佛大学一道，努力维护和提高全世界的学术和学术诚信。”Lumina Datamatics副主席Vidur Bhogilal表示。

Bik，E.M.、Casadevall，A.和Fang，F.C.（2016年）。生物医学研究出版物中不适当图像复制的流行。MBio公司。https://doi.org/10.1128/mBio.00809-16

Byrne，J.A.和Christopher J.（2020年）。数字魔法，或21世纪的黑暗艺术——期刊和审稿人如何检测造纸厂的手稿和出版物？FEBS信函。https://doi.org/10.1002/1873-3468.13747

本文是系列文章的一部分威利研究的真实世界影响.

提高研究图像数据可靠性的软件：Wiley、Lumina和哈佛医学院的研究人员合作解决方案

提高研究可靠性的软件-图像数据-文件-灯具和研究人员-哈佛医学-学校合作-解决方案

研究内容如何支持学术诚信

作为一名医学生找时间发表文章：成功的6个秘诀

推动研究成果：威利与CiteAb合作

ISBN、ISSN、DOI：它们是什么以及如何找到它们

TDS Health医生的图像采集

您如何发现内容？

为护士撰写出版物（中文版）

发布-如何在线研讨会

作为一名医学生，找时间发表论文：成功的6个秘诀

相关文章