微软AI诊断复杂病例能力远超人类医生，准确率高达85%！

微软AI宣布，其AI诊断编排器（MAI-DxO）能够准确诊断《新英格兰医学杂志》（NEJM）病例报告中85%的复杂病例。更令人印象深刻的是，NEJM中公布的病例诊断难度极高，对智力要求严苛。这些病例通常需要多位专家和多项诊断测试才能得出确切诊断，因此AI能在大多数情况下给出正确诊断，实属不易。

MAI-DxO将语言模型转化为虚拟的临床医生小组，能够提出后续问题、安排测试或给出诊断。MAI-DxO提升了微软测试的每一个模型的诊断性能，尤其是与OpenAI的o3模型搭配使用时，效果最佳。

当MAI-DxO使用o3模型时，能够正确解决85.5%的NEJM基准病例。微软将其与人类进行了对比邀请了21位来自美国和英国、拥有5-20年临床经验的执业医师，在相同的任务中，他们完成的病例平均准确率仅为20%。

微软认为，这些工具能够通过赋予患者自我管理日常护理的能力，并为临床医生提供复杂病例的高级决策支持，从而显著改变医疗保健行业。

为了了解AI在NEJM病例上的表现，微软创建了顺序诊断基准（SD Bench），将304个近期的NEJM病例转化为逐步诊断过程。模型随后可以迭代地提出问题并安排测试。随着新信息的出现，模型将更新其推理过程，并逐渐接近最终诊断，该诊断可与NEJM中公布的结果进行比较。

如前所述，MAI-DxO系统模拟了一个虚拟的医生小组，能够提出后续问题、安排测试或给出诊断。除此之外，它还能在既定的成本限制内运作，以防止过度测试。

尽管微软的实验结果显示出了巨大的潜力，但这项研究仅是第一步。在生成式AI能够安全地应用于医疗保健场景之前，需要从真实的临床环境中收集更多证据。同时，还需要建立适当的治理和监管框架，以确保模型的可靠性和安全性。为了实现这一切，微软正与卫生组织合作，在更广泛的推广之前测试和验证其方法。

本网通过AI自动登载内容，本文转载自MSN，【提供者：十轮网科技资讯 | 作者：佚名】，仅代表原作者个人观点。本站旨在传播优质文章，无商业用途。如不想在本站展示可联系删除。

推荐阅读