写点什么

跟着 Datathon 做医疗大数据临床科研,2 天搞定一篇 SCI!

作者:ModelWhale
  • 2024-12-17
    上海
  • 本文字数:3733 字

    阅读完需:约 12 分钟

跟着 Datathon 做医疗大数据临床科研,2天搞定一篇 SCI!

你是否想过,临床医生能在短短 2 天内迅速掌握科研方法的设计精髓,并高效实现代码编写,从而加速科研进程呢?

2024 年 11 月 14 日至 17 日,由中国人民解放军总医院主办的“第五届医疗大数据学术交流及 Datathon 活动”(以下简称 Datathon 活动)在北京成功举办。本次活动旨在通过引进国际先进理念与模式,促进医疗大数据与人工智能领域的跨学科合作,特别是 “理 - 工 - 医 - 信” 四大学科的深度融合,同时加强国际间的学术交流与合作。

Datathon 活动是一项以短期高强度、跨学科小组竞赛为形式的实践活动,它专注于利用临床数据开展创新研究。不同领域的专业人才汇聚在一起,通过紧密协作,碰撞出思维的火花,为医疗领域的发展挖掘更多可能。今年的活动设置了临床洞察挑战多模态融合创新两个赛道,吸引了 236 名选手组成的 23 支队伍积极参与。这些队伍中,既有来自医院及医学院的 128 名临床医生,也有来自其他单位的 108 名算法工程师及医疗大数据工程师,以赛代训、以赛促创,共同追求卓越。

在为期 2 天的激烈竞赛中,来自全国各大医院的临床医生与数据工程师、算法工程师等紧密协作,基于临床数据库及研究变量进行数据提取、分析及模型应用,并由专家评委进行了详尽的评审与反馈。和鲸凭借 ModelWhale 数据科学协同平台为本次活动提供全程支持

在以往几届 Datathon 活动中,多个团队在有限时间内迅速完成了各自的临床课题研究,并成功产出论文成果。这些论文在各大知名期刊上发表,取得了令人瞩目的成绩:2017 年发表了 22 篇论文,累计影响因子达 83.195;2018 年则发表了 34 篇,累计影响因子更是攀升至 176.748。此外,这些研究成果还成功应用于医院的临床决策支持系统、疾病预测预警等方面,显著提升了医疗服务的质量和效率。

Datathon 活动基于丰富的临床数据,如 MIMIC 数据集,进行创新研究。MIMIC 数据库因涵盖病例广泛、数据全面,在重症医学领域备受青睐,其发文数量逐年攀升,据统计,仅在 2024 年,就已基于此数据库发表了近 900 篇学术论文。

在 Datathon,让临床研究离 SCI 更进一步

临床医生虽然拥有丰富的临床资源,却往往因日常工作繁重、科研经验相对匮乏、跨学科知识背景的缺失,以及面对海量数据缺乏有效的处理与分析手段等诸多难题,而难以将手中的临床资源转化为科研进展的推动力。而通过 Datathon 活动,为临床医生快速将临床设计转化为科研提供了新的思路。

01 临床选题:从问题到课题

识别临床问题并确立研究课题是基础,这要求临床医生清晰地界定研究目标、范围及方法。在这一阶段,如何发现临床问题,如何明确研究的目的、范围和方法,是制定研究课题的关键。而在 Datathon 活动中,临床医生得以与跨学科团队携手,从不同角度审视问题,从而更容易发现新的研究方向:

  • 研究人群:具体指出研究的主体,比如患有特定疾病的人群、特定年龄层或性别的人群等。

  • 暴露变量:指可能影响研究结果的因素,例如特定的治疗方案、生活习惯或环境因素等。

  • 结局变量:研究旨在观察的最终结果,比如疾病的缓解情况、患者的生存时间或生活质量。

  • 混杂变量:这些变量可能对暴露变量与结局变量之间的关系产生干扰,因此需要在研究设计中加以控制,以确保结果的准确性。


02 方法设计:快速验证临床想法

以往,当医生面临一个想要解决的临床问题时,他们往往难以判断自己的思路是否正确,更别提去验证这个想法了。因为验证过程往往复杂且耗时,需要协调多方资源。而 Datathon 活动则巧妙地汇聚了临床医生、生物统计师和算法工程师这三类关键角色,形成了一个高效的协作体系

临床医生得以专注于问题的提出与解决方案的临床验证,确保研究成果的实际应用;生物统计师则科学设计研究方案,选择合适分析方法,确保研究严谨;算法工程师则负责数据处理、模型构建与算法实现,为团队提供技术支持,提升研究效率与质量。

尤为重要的是,Datathon 不仅注重技术层面的合作,还深刻认识到临床研究中的数据获取与隐私保护难题,以及分析结果的临床相关性。因此,在数据收集阶段,团队会严格遵守伦理规范,确保患者同意与数据合规性;在数据分析阶段,则强调临床导向,仅分析对临床实践具有指导意义的数据。此外,针对临床医生在方法学上的困惑,Datathon 活动还致力于降低方法学门槛,通过提供专业培训与技术支持,使临床医生能够更自信地参与研究设计与验证过程。



03 代码实现:即开即用的协同平台

为了强化多角色团队间的协作效能,缩短科研项目的周期,并显著提升科研效率,构建一个高效的协同平台显得尤为关键。在本次 Datathon 活动中,ModelWhale 凭借其出色的性能,减轻了参赛选手在数据处理、模型构建和算力分配等方面的负担,从而极大地推动了科研进程。ModelWhale 支持对临床研究方法设计进行封装和沉淀,帮助多个团队在短短 2 天内迅速完成从项目构思、初步方案设计、可行性验证,到初步科研成果产出的整个科研流程

得益于 ModelWhale 的云端环境,参赛团队无需花费时间装包,只需打开电脑,即可随时随地运行项目,开始分析研究。ModelWhale 以全新的协作范式支持将科研项目推进的工作流进行系统梳理,涵盖多元角色人员构成、精细的任务分工规划以及各阶段所取得的成果等关键要素,确保流程清晰有序且可复制,促进医工融合高效开展。

ModelWhale 特别为本次 Datathon 活动的团队提供了丰富的镜像资源,这些资源涵盖了医学及相关学科中广泛使用的工具包。管理员可以预先为团队成员筛选并推荐内部镜像环境,从而简化了新成员加入团队后同步计算与分析环境的流程。选手只需简单点击添加按钮,随时随地即开即用,若需变更算力,运行项目时点选对应资源,完成数据分析环境的个性化配置。



本次 Datathon 活动在 ModelWhale 的支持下,打通了临床模型应用落地的“最后 1 公里”,推进临床问题向科研创新成果转化:

  • 实现代码、算法、报告、数据等多维度的结构化沉淀,构建了丰富的医疗科研资源库;

  • 团队可基于活动成果进一步开展二次探索研究,在学术领域积极发表文章、申请专利,推动医疗科研成果的转化与应用;

  • 与和鲸旗下的人工智能实践社区——和鲸社区紧密连接,开放交流平台,积极鼓励并吸纳更多内外部人才参与到对开放数据集及优秀成果的解读、拓展与创新应用,形成了良好的科研生态循环。

数据赋能医疗,和鲸助力“医学+AI”人才培养


当前,国内缺乏具备医学背景和工程技术实践能力的高素质复合型人才,尽管部分临床医学生在培养过程中会接触统计分析等课程,但这些课程更多侧重于理论原理,与实际操作之间存在一定的鸿沟。Datathon 课题紧密围绕临床实践,对于解决实际问题和促进青年人才成长具有深远意义。通过亲身参与,选手们不仅探索了数据应用于临床实践的切实路径,还直面了最真实的临床需求,这一经历对个人能力的提升及未来职业生涯的专业深化将产生显著的积极影响。和鲸希望借此次 Datathon 活动为契机,挖掘更多交叉/复合型临床人才,并设计了一系列完整的人才培养路径和标准,力争为我国医疗卫生事业的健康快速发展提供坚实助力。

01 上千医学数据分析项目,探索优质临床研究分析活动

随着医学研究的不断深入,对数据库资源的需求也将不断增加。作为辐射超百万数据科学家的人工智能实践社区和鲸社区集成了丰富的越来越多的高质量医学数据。同时,随着医学研究的深入和数据共享理念的推广,在遵守相关规定和确保数据安全的前提下,和鲸社区鼓励用户上传自己的数据集,实现数据的共享与再利用,进一步丰富社区的数据资源生态。

02 免费、系统、可复现,帮助医学师生教好学好

聚焦于和鲸社区内丰富的资源,和鲸平台精心整合了一套全面的医学数据科学学习路径,旨在助力医学领域人才实现技能跃升。该学习路径全面覆盖 Python 与 R 两种主流编程语言,精心设计了一系列课程,从编程语言基础、数据可视化技巧、统计分析方法,到机器学习与深度学习技术,乃至临床预测模型的构建与应用,每一环节都紧密相连,形成了一条完整的知识链条,帮助更多数据爱好者成长。此外,和鲸也通过不断更新的训练营、Workshop 等方式向潜在科室和潜在人才进行价值传递。

03 共拓“医学+AI”学科建设与人才培养

和鲸科技在人工智能与数据科学领域深耕多年,参与了数百所高校交叉学科的建设,并于 2024 年 5 月全新发起“101 数智领航计划”,全面助力高校“医学+AI”建设与人才培养。“101 数智领航计划”为加入的高校提供了 AI 创新虚拟实验室的平台一学年使用权与 2000h 教学用算力资源,支持“1+x+y” 3 门课程开课与 1 次课程赛组织。目前已有北京中医药大学、南京医科大学、上海交通大学医学院、安徽医科大学等多所院校加入和鲸“101 数智领航计划”。

优秀的临床问题是科研创新的灵感源泉,而医工交叉的产教融合模式,为推进基础研究至转化研究、临床治疗至卫生保健等多元领域的发展,开辟了前所未有的新机遇。未来,和鲸也将基于 Datathon 模式,提供更加便捷、可靠的数据分析和计算服务,与更多研究型医疗机构展开交流,持续探索“医研产融”高质量发展路径,为健康中国贡献自己的力量。

关于第五届 Datathon 活动,我们整理了部分专家完整版实录及大会总结,更多材料也正在整理中,若您对上述内容中的技术细节、应用成效或 Datathon 感兴趣,您可关注微信公众号“ModelWhale”,在菜单栏选择联系我们,进入人工服务通道,获取资料。


用户头像

ModelWhale

关注

个人数据分析工具,组织数据科学协同平台 2022-07-29 加入

ModelWhale 将数据管理、建模分析、模型训练管理、算力资源管理等功能深度整合,通过逐级开放的数据基础设施、 Jupyter Notebook 和 Canvas 两种分析界面、即开即用的云端分析环境,使数据驱动的研究更便捷高效。

评论

发布
暂无评论
跟着 Datathon 做医疗大数据临床科研,2天搞定一篇 SCI!_人工智能_ModelWhale_InfoQ写作社区