没有足够证据表明AI乳腺癌筛查足够准确，可以取代人类的审查

专家表示，在考虑将人工智能纳入乳腺癌筛查计划之前，需要更好的证据

年在线发布的一篇评论指出，在筛查过程中发现可能的乳腺癌病例的准确性方面，人类似乎仍比技术更好英国医学杂志今天。

研究人员表示，目前缺乏高质量的证据支持在筛查乳腺癌时用人工智能（AI）技术取代人类放射科医生的政策。

乳腺癌是全世界妇女死亡的主要原因，许多国家已推出乳房X光检查方案，以尽早发现并治疗乳腺癌。但是，对放射科医生来说，检查乳房X光片以发现癌症的早期征兆是一项工作量很大的重复性工作，有些癌症被遗漏了。

此前的研究表明，人工智能系统的性能优于人类，可能很快就会取代经验丰富的放射科医生。然而，最近对23项研究的审查强调了证据差距和对所用方法的担忧。

为了解决这种不确定性，英国国家筛查委员会委托沃里克大学的一组研究人员对人工智能在乳腺癌筛查实践中检测乳腺癌的准确性进行了研究。

研究人员回顾了自2010年以来进行的12项研究，涉及瑞典、美国、德国、荷兰和西班牙131822名筛查女性的数据。

总的来说，这12项研究中使用的方法质量很差，它们在欧洲或英国乳腺癌筛查项目中的适用性很低。

三项涉及79910名女性的大型研究将人工智能系统与原始放射科医生的临床决策进行了比较。其中，1878人在筛查后12个月内筛查出癌症或间期癌症（在常规筛查预约期间诊断出癌症）。

这三项研究中评估的大多数人工智能系统（36个中的34个或94%）的准确性低于一名放射科医生，所有系统的准确性都低于两名或两名以上放射科医生的共识，这是欧洲的标准做法。

相比之下，五项涉及1086名女性的小型研究报告称，所有评估的人工智能系统都比单个放射科医生更准确。但研究人员注意到，这些研究存在很高的偏差风险，其有希望的结果没有在更大的研究中重复。

在三项研究中，人工智能作为一种预先筛选，用于区分哪些乳房X光照片需要由放射科医生检查，哪些没有筛选出53%、45%和50%的低风险女性，还有10%、4%和0%的放射科医师检测到的癌症。

作者指出了一些研究的局限性，例如排除了可能包含相关证据的非英语研究，他们承认人工智能算法的寿命很短，并且在不断改进，因此在研究发表时，人工智能系统的报告评估可能已经过时。

然而，使用严格的研究纳入标准以及严格和系统的研究质量评估表明，他们的结论是可靠的。

因此，他们说：“目前关于人工智能系统在乳腺癌筛查中的应用的证据表明，要达到临床应用所需的质量和数量，还有很长的路要走。”

他们补充道：“需要在大规模筛查人群中进行精心设计的对比试验准确性研究、随机对照试验和队列研究，以评估商用人工智能系统与放射科医生在临床实践中的结合。”

[结束]

01/09/21

编辑注意事项
脚注：在英国，不同类型的工作人员阅读乳腺筛查乳房X光片，不仅是放射科医生，还有放射科高级从业者和乳腺临床医生

资金来源：英国国家筛选委员会

同行评审？是的
证据类型：系统审查
主题：乳腺癌筛查

如果你是一名需要与专家对话的记者，请单击此处。

浏览我们的专家媒体面板

国家和国际媒体对BMJ的最新报道

在新闻中看到BMJ

如果您是一名记者，希望收到我们的新闻稿，请提供您的详细信息。

获取最新新闻稿

向英国媒体关系团队发送电子邮件以获取更多信息。

立即联系我们