大模型训练平台标准第三次研讨会即将召开
2024 年 07 月 19 日 17:25 北京
随着大模型技术的快速发展,大模型应用已经拓展到企业的研发应用、生产制造、经营管理等诸多环节,金融、制造、教育、交通等行业纷纷在探索大模型的落地场景。头部企业通过海量数据预训练构建超大参数规模的基座模型,大部分企业正在积极探索微调训练技术,使大模型更加适用于特定领域的业务应用。大模型训练平台作为支撑大模型应用落地的工程底座,已经成为产业积极探索和布局的重要阵地。在大模型训练过程中,如何构建微调语料库、选择微调方法、衡量训练效果,提升训练效果;如何通过计算优化、分布式优化、收敛性优化,提升训练效率;如何通过低代码能力、可视化能力、快速对接能力,提升训练易用性,都是大模型在训练开发过程中的难点。
目前,业界缺乏统一的标准来规范大模型开发训练的技术要求。为帮助企业提升大模型训练效果,降低大模型训练成本,推动大模型技术更广泛的应用落地,中国信通院依托人工智能产业发展联盟 AI Infra 工作组,正在联合众多企业开展《面向大模型开发训练的软件平台技术要求》的标准研制工作。本标准围绕大模型平台训练过程的功能、性能要求,结合训练效率、稳定性和易用性等产业需求规范标准。
前期,经过框架研讨、草案编制、意见征集等环节,工作组目前已形成了标准的征求意见稿。为了进一步完善草案内容,确保标准的广泛适用性和可操作性,工作组计划于 7 月 26 日(下周五)召开“面向大模型开发训练的软件平台技术要求第三次标准研讨会”,围绕草案情况、征求意见情况等展开研讨与交流,诚挚邀请各相关单位及专家参会。
一
会议时间
2024 年 7 月 26 日(周五)10:00-11:30
二
接入方式
本次会议采用线上会议形式,使用“腾讯会议”客户端,填写信息报名后即可参会。
会议链接:
https://meeting.tencent.com/dm/Or0XBjWJ0B1c
会议号:495-742-147
三
联系人
刘老师 18610124860(微信同号)
liuxingchen@caict.ac.cn
- END -
中国信通院 AI 所联系人
黄老师
huangxinxuan@caict.ac.cn
顾老师
gutianyao@caict.ac.cn
评论