瑞士开源大语言模型今夏发布
开源瑞士大语言模型今夏发布
由瑞士联邦理工学院与苏黎世联邦理工学院联合开发的大语言模型(LLM)即将在今夏公开发布。该模型在瑞士国家超算中心的"阿尔卑斯"超级计算机上完成训练,标志着开源 AI 与多语言处理技术的重大进展。
开放生态建设
近期在日内瓦举办的国际开源 LLM 构建者峰会上,50 余家全球领先机构共同探讨了开源基础模型的协作生态。该模型作为峰会焦点,由瑞士多所高校与超算中心工程师联合开发,具有以下核心特性:
完全开源:模型源代码、权重及训练数据全部公开
多语言支持:覆盖 1500 多种语言(60%英语+40%非英语)
合规设计:严格遵循瑞士数据保护法及欧盟 AI 法案
技术架构
模型提供两个版本:
80 亿参数版:满足常规需求
700 亿参数版:全球性能最强的完全开源模型之一
训练使用超过 15 万亿高质量 token,采用 100%碳中和电力在配备 10,000 块 NVIDIA Grace Hopper 超级芯片的"阿尔卑斯"超算上完成。
社会影响
项目负责人表示:"完全开放的模型不仅能推动 AI 风险研究,更有利于监管合规。"该模型采用 Apache 2.0 许可证发布,配套文档将详细说明架构、训练方法及应用指南,支持全球科研机构二次开发。
背景延伸
瑞士 AI 计划由 10 余所学术机构参与,每年可使用超 2000 万 GPU 小时,是目前全球最大的 AI 基础模型开源科学计划。超算中心作为 LUMI 联盟成员,通过跨国合作确保基础设施的持续领先。更多精彩内容 请关注我的个人公众号 公众号(办公 AI 智能小助手)公众号二维码

办公AI智能小助手
评论