写点什么

大模型训练平台标准第三次研讨会即将召开

  • 2024-09-20
    北京
  • 本文字数:825 字

    阅读完需:约 3 分钟

CAICT人工智能

 2024 年 07 月 19 日 17:25 北京


随着大模型技术的快速发展,大模型应用已经拓展到企业的研发应用、生产制造、经营管理等诸多环节,金融、制造、教育、交通等行业纷纷在探索大模型的落地场景。头部企业通过海量数据预训练构建超大参数规模的基座模型,大部分企业正在积极探索微调训练技术,使大模型更加适用于特定领域的业务应用。大模型训练平台作为支撑大模型应用落地的工程底座,已经成为产业积极探索和布局的重要阵地。在大模型训练过程中,如何构建微调语料库、选择微调方法、衡量训练效果,提升训练效果;如何通过计算优化、分布式优化、收敛性优化,提升训练效率;如何通过低代码能力、可视化能力、快速对接能力,提升训练易用性,都是大模型在训练开发过程中的难点。


目前,业界缺乏统一的标准来规范大模型开发训练的技术要求。为帮助企业提升大模型训练效果,降低大模型训练成本,推动大模型技术更广泛的应用落地,中国信通院依托人工智能产业发展联盟 AI Infra 工作组,正在联合众多企业开展《面向大模型开发训练的软件平台技术要求》的标准研制工作。本标准围绕大模型平台训练过程的功能、性能要求,结合训练效率、稳定性和易用性等产业需求规范标准。


前期,经过框架研讨、草案编制、意见征集等环节,工作组目前已形成了标准的征求意见稿。为了进一步完善草案内容,确保标准的广泛适用性和可操作性,工作组计划于 7 月 26 日(下周五)召开“面向大模型开发训练的软件平台技术要求第三次标准研讨会”,围绕草案情况、征求意见情况等展开研讨与交流,诚挚邀请各相关单位及专家参会。


会议时间

2024 年 7 月 26 日(周五)10:00-11:30


接入方式

本次会议采用线上会议形式,使用“腾讯会议”客户端,填写信息报名后即可参会。 

会议链接:

https://meeting.tencent.com/dm/Or0XBjWJ0B1c

会议号:495-742-147


联系人

刘老师 18610124860(微信同号)

liuxingchen@caict.ac.cn


- END -


中国信通院 AI 所联系人


黄老师 

huangxinxuan@caict.ac.cn


顾老师

 gutianyao@caict.ac.cn


用户头像

还未添加个人签名 2023-03-01 加入

还未添加个人简介

评论

发布
暂无评论
大模型训练平台标准第三次研讨会即将召开_中国信通院AI Infra工作组_InfoQ写作社区