写点什么

和鲸科技受邀出席全球开发者先锋大会,共话数智驱动下的医疗健康语料

作者:ModelWhale
  • 2025-02-27
    上海
  • 本文字数:1185 字

    阅读完需:约 4 分钟

和鲸科技受邀出席全球开发者先锋大会,共话数智驱动下的医疗健康语料

2025 年 2 月 21 日至 23 日,蛇年首个技术盛会——2025 全球开发者先锋大会(GDC)于沪盛大开幕。本次大会聚焦前沿,深度探讨大模型、语料、算力、具身智能、科学智能以及其他“5+6”产业及领域的未来发展走向,为行业精英、开发者们提供一个思想碰撞与经验交流的绝佳平台。和鲸科技执行总裁兼首席产品官殷自强受邀出席,并于“语料新势力:驱动多域变革的无限可能”专场,同与会专家学者共话数智驱动下的医疗健康语料。



未来 AI 技术想要取得更大突破,语料工作就必须朝着精细化与多元化方向发展,医疗语料的精细化治理与多元化开发已成为行业共识。高质量的医疗健康语料是提升医疗大模型在疾病诊断、药物研发、健康管理等场景创新的必要条件。针对大模型落地医疗健康场景的实践路径,殷自强基于和鲸科技多年实践经验作了进一步分享


大模型重构临床研究范式


“当前大模型对临床研究的赋能主要体现在两大维度”。殷自强提及道。在文本处理层面,大模型正全面改变研究流程。从方案设计阶段的智能辅助论证,到报告生成时的合规性校验,AI 持续提供迭代式的“同行评审”支持,从而显著提高研究设计的科学性和规范性。


在数据分析维度,大模型展现出较强的代码、数学与逻辑能力,能够帮助分析专病库数据的适用性、做研究数据的提取以及在研究中自动生成统计分析的模块化代码。这一特性在临床医生设计研究方案而统计分析人员负责数据分析的合作场景中尤为适用。大模型可以简化数据提取、选择统计分析模块的过程,提高协作效率,减少语境交换产生的误差。


复兴医药全球研发中心系统管理与工具开发总监马君一也表示,通过利用文本大模型的强大能力进行打标识别、总结等任务,可以初步标注海量数据,再结合少量人工辅助和模型蒸馏,将大模型的知识压缩到较小的模型中,以便在海量数据上应用。


构建医疗数据治理新生态


圆桌讨论中,数据标准化与隐私安全的矛盾成为焦点。上海交通大学人工智能副院长王钰表示,“对于医疗行业来说,数据问题确实非常复杂。它不仅与模型和任务紧密相关,还涉及到多个子单位,如监管单位、科技医疗单位以及标准制定机构等”。


殷自强以和鲸科技参与的上海申康医学发展中心项目为例,双方在过去几年间致力于推动医疗数据的标准化及有效利用,在确保合规性的基础上实现了数据价值的最大化,为业界树立了标杆。与此同时,随着大型模型技术的持续演进,构建新的规范共识成为了可能。以往,数据交互是个性化的,难以实施统一标准化。然而,当交互对象转变为大型模型时,数据通过知识库构建或微调语料使用存在标准化的可行性。借助 AI 的力量进行数据检索与分析,有望推动形成更为统一规范的数据接口标准,为医疗数据的开放和利用创造更好的条件。



“用更好的 AI,守护人们的健康”。当大模型遇见专业化的数据基础设施,医疗创新将突破传统范式。和鲸期待以 AI 的力量,为更多医疗领域组织服务,一同共建安全、开放、可持续的智能医疗新图景。

用户头像

ModelWhale

关注

个人数据分析工具,组织数据科学协同平台 2022-07-29 加入

ModelWhale 将数据管理、建模分析、模型训练管理、算力资源管理等功能深度整合,通过逐级开放的数据基础设施、 Jupyter Notebook 和 Canvas 两种分析界面、即开即用的云端分析环境,使数据驱动的研究更便捷高效。

评论

发布
暂无评论
和鲸科技受邀出席全球开发者先锋大会,共话数智驱动下的医疗健康语料_人工智能_ModelWhale_InfoQ写作社区