人工智能 + 牙科:临床应用中的几个问题

牙科领域的 AI 产品已经为数不少。《自然》杂志旗下的《英国牙科杂志》近期刊登了一篇文章[1],文章中列举了多家企业的牙科 AI 产品:

Pearl 公司
出现在以上列表中的 Pearl 公司,是一家美国的 AI 公司[2],其 AI 产品能够从牙科的 X 光片中识别出多种牙科病症。

上图出自于 Pearl 公司的产品宣传资料[3]。
根据 Pearl 公司的宣传资料:
该公司拥有世界上规模最大的牙科 X 光片标注数据集,数据标注团队由牙医和放射科医生组成;
该公司的 AI 产品基于机器学习和计算机视觉算法,能够在牙科 X 光片中快速发现牙齿错位、牙齿裂纹、牙结石、牙齿变色等病症,有助于将更多的标准化、客观性、一致性、准确性、高效性、以及透明性引入到诊断过程中,有助于简化诊断的复杂性,增强患者的信任,鼓励患者参与必要的治疗;
通过直观的视觉界面,该公司的 AI 产品有助于医生与患者之间进行更有效的沟通。
Fryback 和 Thornbury 的分析方法
牙科 AI 产品的有效性,存在比较客观的评估吗?
Dennis G. Fryback 和 John R. Thornbury 曾于 1991 年针对医学诊断影像的有效性发表过一篇文章[4],文章中将评估医学诊断影像有效性的专业文献划分为六个层次,第一(最低)层次的文献涉及技术性能,第六(最高)层次的文献涉及社会影响;通过收集、分析已有的评估文献,可以有依据地分析出医学诊断影像的有效性。
这个分析方法后续经过他人的调整,被用于分析放射医学中 100 款 AI 软件的有效性[5]。调整后的划分文献的各个层次从低到高分别为:
第一层次(Technical Efficacy),文献涉及 AI 软件技术的可行性和可复制性、与其它软件的衔接程度、AI 软件的差错率、临床应用的可行性——包括与其它临床方法的相关程度、预测方面的价值等;
第二层次(Diagnostic Accuracy Efficacy),文献涉及 AI 软件独立运行时的性能,包括敏感性、特异性、接受者操作特征(ROC)曲线下面积、Dice 分数(Dice Score)等;
第三层次(Diagnostic Thinking Efficacy),文献涉及采用 AI 软件与否,对诊断是否有提升作用,是否会改变对影像的判断;
第四层次(Therapeutic Efficacy),文献涉及 AI 软件对患者管理决策的影响、以及对治疗或复查的影响;
第五层次(Patient Outcome Efficacy),文献涉及 AI 软件对治疗效果的影响,包括对患者的生活质量、发病率、生存的影响;
第六层次(Societal Efficacy),文献从经济方面分析 AI 软件对社会的影响,包括 AI 软件对于成本、按质量调整后的患者寿命、增量成本的影响。
牙科 AI 产品的有效性
Fryback 和 Thornbury 的层次分析方法在上述《英国牙科杂志》刊登的文章中被再次运用,通过收集、分析牙科 AI 产品的评估文献,来发现牙科 AI 产品有效性的依据。分析的主要结果包括:
大多数牙科 AI 产品的评估文献达到了层次分析中的第一层次和第二层次,意味着大多数对于牙科 AI 产品的评估属于验证性质,较少涉及真实医疗场景中的复杂情况,从而使得相关 AI 产品的实际作用难以确定;
少量评估文献达到了层次分析中的较高层次,也就是评估了有关 AI 产品在真实场景中对临床决策、疗效、社会效益所产生的影响;
部分牙科 AI 产品没有任何评估文献;对于这些 AI 产品,严谨的科学评估是不可或缺的。

其它问题
上述《英国牙科杂志》刊登的文章还从牙医的角度出发,进一步描述了 AI 在牙科应用中存在的一些问题,主要包括:
采用精确率—召回率(Precision-Recall)曲线下面积、接受者操作特征(ROC)曲线下面积、敏感性、特异性等指标来评估 AI 产品固然重要,然而仅仅依靠这些指标,还不足以评估 AI 产品的临床效果,如何将 AI 产品融入临床流程之中、以及 AI 产品如何影响治疗成效,都是这些指标所难以评估的;
AI 误诊的可能性——以蛀牙识别这一任务为例,就是 AI 根据牙科 X 光片所识别出的蛀牙,经过进一步的医疗检查、以及对患者病史的分析,有可能发现并不是蛀牙;仅仅依靠 AI,可能会导致不必要的医疗干预;此外,AI 的误判需要转化成清晰详细的信息,以便于牙医做出临床决策;
一款 AI 产品获得 FDA(美国食品药品监督管理局)的许可,仅仅是评估有关技术的安全性、有效性和可靠性的一个重要步骤,不代表其临床应用会取得成功;
部分医疗人员对于在临床中采用 AI 持保留态度,原因包括对 AI 产品可靠性的担心、AI 产品在部署和评估时缺乏透明性等。
封面图来自美国 Pearl 公司的宣传资料[3]。
参考资料
[1] Concerns Regarding Deployment of AI-based Applications in Dentistry – a Review.
https://www.nature.com/articles/s41405-025-00319-7
[2] https://www.hellopearl.com
[3] https://zeroheight.com/6a5b46ab5/p/270b05-pearl-brand-guidelines
[4] The Efficacy of Diagnostic Imaging.
https://doi.org/10.1177/0272989x9101100203
[5] Artificial Intelligence in Radiology: 100 Commercially Available Products and Their Scientific Evidence.
https://link.springer.com/article/10.1007/s00330-021-07892-z
版权声明: 本文为 InfoQ 作者【算AI】的原创文章。
原文链接:【http://xie.infoq.cn/article/a274fa467fa8daf49a27d4269】。文章转载请联系作者。
评论