微软AI诊断复杂病例能力远超人类医生,准确率高达85%!
微软AI宣布,其AI诊断编排器(MAI-DxO)能够准确诊断《新英格兰医学杂志》(NEJM)病例报告中85%的复杂病例。更令人印象深刻的是,NEJM中公布的病例诊断难度极高,对智力要求严苛。这些病例通常需要多位专家和多项诊断测试才能得出确切诊断,因此AI能在大多数情况下给出正确诊断,实属不易。
MAI-DxO将语言模型转化为虚拟的临床医生小组,能够提出后续问题、安排测试或给出诊断。MAI-DxO提升了微软测试的每一个模型的诊断性能,尤其是与OpenAI的o3模型搭配使用时,效果最佳。
当MAI-DxO使用o3模型时,能够正确解决85.5%的NEJM基准病例。微软将其与人类进行了对比邀请了21位来自美国和英国、拥有5-20年临床经验的执业医师,在相同的任务中,他们完成的病例平均准确率仅为20%。
微软认为,这些工具能够通过赋予患者自我管理日常护理的能力,并为临床医生提供复杂病例的高级决策支持,从而显著改变医疗保健行业。
为了了解AI在NEJM病例上的表现,微软创建了顺序诊断基准(SD Bench),将304个近期的NEJM病例转化为逐步诊断过程。模型随后可以迭代地提出问题并安排测试。随着新信息的出现,模型将更新其推理过程,并逐渐接近最终诊断,该诊断可与NEJM中公布的结果进行比较。
如前所述,MAI-DxO系统模拟了一个虚拟的医生小组,能够提出后续问题、安排测试或给出诊断。除此之外,它还能在既定的成本限制内运作,以防止过度测试。
尽管微软的实验结果显示出了巨大的潜力,但这项研究仅是第一步。在生成式AI能够安全地应用于医疗保健场景之前,需要从真实的临床环境中收集更多证据。同时,还需要建立适当的治理和监管框架,以确保模型的可靠性和安全性。为了实现这一切,微软正与卫生组织合作,在更广泛的推广之前测试和验证其方法。
本网通过AI自动登载内容,本文转载自MSN,【提供者:十轮网科技资讯 | 作者:佚名】,仅代表原作者个人观点。本站旨在传播优质文章,无商业用途。如不想在本站展示可联系删除。