ChatGPT-4生成骨科出院文件的速度快于人类,保持了可比的质量:对6例患者的初步研究

作者

  • 吉列尔莫·桑切兹·罗森博格 瑞士巴塞尔大学医院骨科和创伤外科
  • 马丁·马格内利 斯德哥尔摩Danderyd医院临床科学部卡罗林斯卡研究所;瑞典
  • 尼古拉斯·巴勒 斯德哥尔摩Danderyd医院临床科学部卡罗林斯卡研究所;瑞典
  • 迈克尔·孔塔基斯 瑞典乌普萨拉大学医院骨科外科
  • 安德烈亚斯·马克·米勒 瑞士巴塞尔大学医院骨科和创伤外科
  • 马蒂亚斯·维托尔 瑞士巴塞尔大学医院骨科和创伤外科
  • 麦克斯·高登 斯德哥尔摩Danderyd医院临床科学部卡罗林斯卡研究所;瑞典 https://orcid.org/0000-0002-8080-5815
  • 赛勒斯·布罗德 瑞典乌普萨拉大学医院骨科外科

内政部:

https://doi.org/10.2340/17453674.2024.40182

关键词:

行政任务、骨科人工智能、人工智能、ChatGPT、出院文件、大型语言模型、骨科手术、医生倦怠

摘要

背景和目的:像ChatGPT-4这样的大型语言模型已经出现。他们有潜力通过生成日常临床文档来减轻管理负担,从而允许医生花更多时间与患者在一起。我们旨在评估ChatGPT-4生成的出院文件的质量和效率,并与医生生成的出院文档进行比较。
患者和方法:为了模拟真实情况,创建了6个虚构骨科病例的健康记录。每个病例的出院文件均由初级主治骨科医生和高级骨科住院医师生成。然后,ChatGPT-4被提示使用相同的健康记录信息生成出院文件。质量评估由一个不知道文件来源的专家小组(n=15)进行。作为次要结果,比较生成文档所需的时间,记录医生和ChatGPT-4创建出院文档的持续时间。
结果:总的来说,ChatGPT-4和物理学家生成的笔记在质量上具有可比性。值得注意的是,ChatGPT-4生成出院文件的速度是传统方法的10倍。在ChatGPT-4生成的内容中发现4起幻觉事件,而在人类/医生生成的笔记中发现6起幻觉。
结论:ChatGPT-4创建骨科出院记录的速度比医生快,质量相当。这表明它有很大的潜力使这些文件在骨科护理中更有效。ChatGPT-4有可能显著减轻医疗专业人员的行政负担。

 

下载

下载数据尚不可用。

工具书类

Patel R S、Bachu R、Adikey A、Malik M、Shah M。医生职业倦怠相关因素及其后果:综述。2018年瑞士巴塞尔Behav Sci; 8(11): 98.doi:10.3390/bs8110098。 内政部:https://doi.org/10.3390/bs8110098

Wright A A,Katz I T。《超越倦怠:重新设计护理以恢复医生的意义和理智》。2018年《新英格兰医学杂志》; 378(4): 309-11.doi:10.1056/NEJMp1716845。 内政部:https://doi.org/10.1056/NEJMp1716845

Woolhandler S、Campbell T、Himmelstein D U。美国和加拿大的医疗保健管理成本。《新英格兰医学杂志》2003; 349(8): 768-75.doi:10.1056/NEJMsa022033。 内政部:https://doi.org/10.1056/NEJMsa022033

Nadeau S、Cusick J、Shepherd M。过高的行政成本给美国医疗体系带来了负担。[于2021年11月2日在线发布。]网址:https://www.americanaprogress.org/article/excess-administrative-costs-bunder-u-s-health-care-system.

Kung T H、Cheatham M、Medenilla A、Sillos C、De Leon L、Elepaño C等。ChatGPT在USMLE上的表现:使用大型语言模型进行AI辅助医学教育的潜力。PLOS数字健康2023;2(2):e0000198。doi:10.1371/journal.pdig.000198。 内政部:https://doi.org/10.1371/journal.pdig.000198

Gilson A、Safranek C W、Huang T、Socrates V、Chi L、Taylor R A等。ChatGPT在美国医疗执照考试中的表现如何?大型语言模型对医学教育和知识评估的影响。JMIR医学教育2023;9:e45312。doi:10.2196/45312。 内政部:https://doi.org/10.2196/45312

Giannos P、Delardas O。ChatGPT在英国标准化入学考试中的表现:来自BMAT、TMUA、LNAT和TSA考试的见解。JMIR医学教育2023;9:e47737。数字对象标识代码:10.2196/47737内政部:https://doi.org/10.2196/47737

Massey P A、Montgomery C、Zhang A S。ChatGPT-3.5、ChatGPT-4和矫形住院医师在矫形评估检查中的表现比较。美国医学院整形外科杂志2023; 31(23): 1173-79.doi:10.5435/JAAOS-D-23-00396。 内政部:https://doi.org/10.5435/JAAOS-D-23-00396

Hurley E T,Crook B S,Lorentz S G,Danilkowicz R M,Lau B C,Taylor D C,等。基于ChatGPT(人工智能大语言模型)人工智能的肩部稳定手术信息质量评估。关节镜2023:S0749-8063(23)00642-4。doi:10.1016/j.arthro.2023.07.048。 内政部:https://doi.org/10.1016/j.arthro.2023.07.048

Mika A P、Martin J R、Engstrom S M、Polkowski G G、Wilson J M。评估ChatGPT对全髋关节置换术常见患者问题的反应。美国骨关节外科杂志2023; 105(19): 1519-26.doi:10.2106/JBJS.23.00209。 内政部:https://doi.org/10.2106/JBJS.23.000209

Ayers J W、Poliak A、Dredze M、Leas E C、Zhu Z、Kelley J B等。比较医生和人工智能聊天机器人对发布在公共社交媒体论坛上的患者问题的回应。JAMA内科实习医师2023; 183(6): 589-96.doi:10.1001/jamaintermed.2023.1838。 内政部:https://doi.org/10.1001/jamaintermed.2023.1838

O’Connor S.护理教育中的开放人工智能平台:学术进步还是滥用的工具?2023年护士教育实践; 66:103537.doi:10.1016/j.nepr.2022.103537。 内政部:https://doi.org/10.1016/j.nepr.2022.103537

Ollivier M、Pareek A、Dahmen J、Kayaalp M E、Winkler P W、Hirschmann M T等。深入探讨ChatGPT:骨科研究的历史、使用和未来前景。膝关节外科运动创伤关节2023; 31(4): 1190-2.doi:10.1007/s00167-023-07372-5。 内政部:https://doi.org/10.1007/s00167-023-07372-5

Liu X、Rivera S C、Moher D、Calvert M J、Denniston A K、SPIRIT-AI和CONSORT-AI工作组。人工智能干预的临床试验报告报告指南:CONSORT-AI扩展。BMJ 2020;370:立方米164。doi:10.1136/bmj.m3164。 内政部:https://doi.org/10.1136/bmj.m3164

Singhal K、Azizi S、Tu T、Mahdavi S S、Wei J、Chung H W等。大型语言模型编码临床知识。自然2023; 620(7972): 172-180.doi:10.1038/s41586-023-06291-2。 内政部:https://doi.org/10.1038/s41586-023-06291-2

Ali S R、Dobbs T D、Hutchings H A、Whitaker I S。使用ChatGPT撰写患者诊所信件。柳叶刀数字健康2023;5(4):e179-e181。doi:10.1016/S2589-7500(23)00048-1。 内政部:https://doi.org/10.1016/S2589-7500(23)00048-1

Wimsett J,Harper A,Jones P.评论文章:高质量出院总结的组成部分:系统回顾。澳大利亚急诊医学会2014; 26(5): 430-8.doi:10.1111/1742-6723.12285。 内政部:https://doi.org/10.1111/1742-6723.12285

Greer R C、Liu Y、Crews D C、Jaar B G、Rabb H、Boulware L E。急性肾损伤患者护理过渡期间的医院出院沟通:一项横断面研究。BMC Health Serv Res 2016; 16(1): 449.doi:10.1186/s12913-016-1697-7。 内政部:https://doi.org/10.1186/s12913-016-1697-7

Kripalani S、LeFevre F、Phillips C O、Williams M V、Basaviah P、Baker D W。医院医生和初级保健医生之间沟通和信息传输的缺陷:对患者安全和护理连续性的影响。JAMA 2007; 297(8): 831-41.doi:10.1001/jama.297.8831。 内政部:https://doi.org/10.1001/jama.297.8.831

Brameier D T、Alnasser AA、Carnino J M、Bhashyam A R、von Keudell A G、Weaver M J。矫形外科中的人工智能:大型语言模型能“写”出可信的矫形外科杂志文章吗?美国骨关节外科杂志2023; 105(17): 1388-92.doi:10.2106/JBJS.23.00473。 内政部:https://doi.org/10.2106/JBJS.23.00473

West C P,Dyrbye L N,Shanafelt T D。医生职业倦怠:影响因素、后果和解决方案。《内科实习生杂志》2018; 283(6): 516-29.doi:10.1111/joim.12752。 内政部:https://doi.org/10.1111/joim.12752

Rotenstein L S,Torre M,Ramos M A,Rosales R C,Guille C.Sen S等。医生职业倦怠的患病率:一项系统综述。JAMA 2018; 320(11): 1131-1150.doi:10.1001/jama.2018.12777。 内政部:https://doi.org/10.1001/jama.20.118.12777

Panagioti M、Panagopoulou E、Bower P、Lewith G、Kontopantelis E、Chew-Graham C等。降低医生职业倦怠的控制性干预:系统综述和荟萃分析。2017年JAMA医学实习生; 177(2): 195-205.doi:10.1001/jamaintermed.2016.7674。 内政部:https://doi.org/10.1001/jamaintermed.2016.7674

Patel S B,Lam K.ChatGPT:出院总结的未来?柳叶刀数字健康2023;5(3):e107-e108。doi:10.1016/S2589-7500(23)00021-3。 内政部:https://doi.org/10.1016/S2589-7500(23)00021-3

Kanter G P,Packel E A.人工智能聊天机器人的医疗隐私风险。JAMA 2023; 330(4): 311-12.doi:10.1001/jama.2023.9618。 内政部:https://doi.org/10.1001/jama.2023.9618

出版

2024-03-21

如何引用

Sánchez-Rosenberg,G.,Magnéli,M.,Barle,N.,Kontakis,M.G.,Müller,A.M.,Wittauer,M.…BrodéN,C.(2024)。ChatGPT-4生成骨科出院文件的速度快于人类,保持了可比的质量:一项针对6例患者的初步研究。骨科学报,95, 152–156. https://doi.org/10.2340/17453674.2024.40182

问题

章节

文章

类别