从人工测量转向计算机视觉,基于 PaddleSeg 实现自动测量心胸比
早上八点,在广州市第一人民医院南沙分院的放射科里,身穿白大褂的冯嘉骏开始了一天的忙碌工作。这位 90 后的年轻小伙,从 2012 年在广州医科大学毕业后,就进入了这所医院工作,一干就是十年,目前已经是医院放射科的主管技师。
据医学界统计,2023 年,全国医院放射从业人员大约 158072 人。放射科的医务人员大致可以分为放射技术和放射诊断两类,医院的患者到放射科做检查,首先接触的就是放射技师。近年来,随着医院面临检查量上升、医疗设备更新缓慢等挑战,利用 AI 技术提升医疗诊断的准确性和效率性,从而解放医生劳动力,成为了医疗行业的迫切需求。现实医疗临床中需要写代码的情况并不多见,但有人已经开始探索将 AI 技术落地到医疗场景中,冯嘉骏便是这个群体里的代表之一。
冯嘉骏在放射科工作
与飞桨结缘纯属偶然
提起与 AI 结缘,冯嘉骏显得有点腼腆,他用一口纯正的广东普通话,向我们回忆了自己最初的“技术求医”经历。他说,自己高中就对医学产生了浓厚的兴趣,填报高考志愿时考虑到自己性格更像一个“IT 技术宅男”,因此最终在医学影像诊断和医学影像技术两个不同方向中选择了医学影像技术专业。
2009 年,冯嘉骏考入广州医科大学,自学了网页设计,后来又自学了 C 语言、Python 等计算机编程语言。2019 年正值 AI 比较火爆,他无意中看到了飞桨举办的“深度学习 7 天打卡营”公开课,接触到 AI 技术,从此对 AI 的学习热情一发不可收拾。
2020 年初,冯嘉骏正式加入飞桨 AI Studio-人工智能学习与实训社区的公开课进行学习,他惊讶地发现原来国内竟然还有这样的自主的、完善的深度学习框架! 之后一年,冯嘉骏跟着公开课学习,包括图像分割、目标检测、医疗数据标注等知识,随着对深度学习的认知不断加深,他了解到飞桨能为开发者提供端到端套件,帮助开发者 0 代码开发项目,他于是尝试将所学应用到医疗影像领域中。2021 年 9 月至 2022 年 9 月,冯嘉骏发布了 13 篇与医疗相关的精选项目。2022 年,冯嘉骏加入 PPDE 计划,成为飞桨社区的指导老师。
PPDE(PaddlePaddle Developer Experts)全称飞桨开发者技术专家,是飞桨开发者的荣誉认证体系,由来自国内外顶尖高校和行业 Top 企业的技术骨干组成,他们为飞桨 AI Studio 人工智能学习与实训社区开发者提供专业指导,帮助开发者探索 AI 在各领域的前沿应用,创造更多的开源项目成果。自 2020 年 5 月 20 日发布计划以来,已有 290 多位开发者获得了飞桨开发者技术专家认证。
测心胸比从人工测量转向计算机视觉
加入飞桨社区后,冯嘉骏结合医学专业相关知识,利用飞桨模型和开发套件,开发了腰椎辅助诊断系统、肺部疾病分类、椎间盘自动重建等多个项目,目前骨龄预测项目已经应用到他所在的医院科室中,腰椎重建和快速测心胸比项目也形成了重要的学术科研成果。
他重点介绍了“快速测心胸比”项目。放射科医生在下诊断之前,会花费不少时间看医学影像图像,测量各种数据指标,从而更好地判断患者的病情。测心胸比是影像诊断中判断心脏是否增大的常用手段,心胸比是指在 X 线片上心脏横径与胸廓横径之比,一般成年人正常心胸比不大于 0.5,如果心胸比大于 0.5,说明心脏有增大的倾向,患者需要去做进一步的 CT 检查,确定导致心脏增大的原因。
医师手动计算心胸比需要先测量心脏最大横径
与肺部最大横径,再计算两者比率通常,医院的放射医师手动测心胸比,一天可能要测四五百张,非常耗费时间。此外,由于人的肺部是一个不规则的生理结构,不是简单找到点到点的直径距离就能测出来。因而,人工测心胸比主观性强,容易有误差,可能不同的医生检测出来的结果也并不一样。
冯嘉骏选择使用 PaddleSeg 2.0 开发工具,实现自动准确测量心胸比,最终使得肺部和心脏的医疗图像分割精度结果分别达到了 0.978 和 0.955 的准确率。
作为计算机视觉领域重要的技术之一,图像分割将图像分成若干具有相似性质的区域,是图像语义理解的关键环节。冯嘉骏采取区域分割方法,基于飞桨图像分割套件 PaddleSeg,借助其高精度和轻量级优势,将心脏和肺部两个器官的横径准确测量出来,目前该技术已经应用到农田分割、工业机器目标检测、医疗影像分割等领域。
AI 在医疗行业落地遇到难题
冯嘉骏认为计算机视觉技术、PaddleSeg 在医学场景中具有广泛的应用场景。因为医学图像大多都与图像分割分不开,除了测心胸比,其他像涉及测量脑出血量、肺部结节、肿瘤等患病器官的体积和位置时,计算机视觉同样能发挥它的独特作用。
例如,在诊断检查肿瘤的影像中,医生通常要手动把肿瘤的目标数据勾画出来,再进一步提取特征或者建模,现实中对肿瘤目标进行勾画很耗时。如果用一个新 AI 模型可以自动分割肿瘤,那么,当有新的患者需要预测,就能直接输入患者数据,实现快速分割目标,进行自动勾画,这就大大节省了医生的时间。
要知道现实工作中,医生的时间是非常宝贵的。比如,医疗有一种常见的检测项目是骨龄检测,是指各年龄时的骨成熟度,主要用于诊断儿童身高发育等方面疾病。在骨龄检测中,医生计算一个骨龄需要 10 多分钟,但这个时间医生可以写好多份报告了,因而骨龄预测往往是让医生头疼的事情。
察觉到这一痛点后,冯嘉骏根据骨龄图谱做了一个自动预测的 AI 工具,借助飞桨目标检测套件 PaddleDetection,将其安装到阅片器电脑上,医生可以从影像系统里获取图像直接进行预测,这样医生只需要三四分钟就可完成一个结构化的骨龄报告。 虽然自己在医疗领域进行了不少探索,但放眼整个医疗行业,冯嘉骏坦言,AI 在医疗行业中的落地仍面临不少难题。具体而言:
一方面是训练数据与现实数据差别很大。人的疾病多种多样,但训练数据大多来自于健康类或常见疾病的数据,实际落地后需要针对医院数据对模型进一步优化。如,一些专科肿瘤医院,肿瘤性患者比较多,而一些大的三甲医院可能外伤类患者比较多,当模型落地到具体医院时,首先需要针对不同医院数据重新对模型进行优化,才能让模型更加准确和贴合实际。
另一方面,不同的医疗机构有着不同的影像系统,各个系统之间十分封闭,存在较严重的“数据孤岛”和安全信息保护问题,从而增加了 AI 医疗设备推广的难度。
冯嘉骏在飞桨 AI Studio 人工智能学习与实训社区里写下的自我介绍是:想使用深度学习工具在专业上有点作为。相信随着 AI 技术的发展,未来会有越来越多像冯嘉骏一样的技术专家、程序员、工程师,利用自己的专业技术和对行业的洞察,投身于 AI 的落地中,而飞桨也将持续陪伴开发者前行,为千行百业的智能化升级注入生生不息的动力。
评论