【洞见】智算操作系统,推进算力迈入普惠智算新时代
WAIC 2024 世界人工智能大会暨人工智能全球治理高级别会议正式拉开帷幕,面向世界徐徐展示人工智能技术最前沿的理念和成果。九章云极 DataCanvas 公司董事长方磊受邀参加大会开幕式,并在“迈向 AGI:大模型焕新与产业赋能”论坛发表主题演讲,分享最新智算产业洞见。
“迈向 AGI:大模型焕新与产业赋能”论坛作为 WAIC 2024 的重要主题论坛,由中国信通院承办,论坛定位为“AI 大模型顶尖盛会”,邀请人工智能领域国内外知名院士、科技圈网红大咖,和阿里云、九章云极 DataCanvas 公司等业内领军企业领袖,以及顶尖高校与科研机构专家,与来自行业主管部门、国家实验室、国际组织等各界重磅嘉宾齐聚一堂,共探大模型驱动新质生产力发展的新潜能。
九章云极 DataCanvas 公司董事长方磊发表演讲
方磊受邀发表《智算操作系统——迎接软件定义算力的新世界》主题演讲,布道“智算操作系统”这一智算中心刚需的 AI 软件,展现人工智能基础软件在算力经济时代的突破创新和无限可能。
智算操作系统——构建上下游算力消纳生态,普惠算力时代“新解”
智算中心作为我国 AI 基础设施建设新版图,正在 AI 生态链前所有未的凝聚力下加速建设进程。随着大模型的全民体验普及、行业大模型的爆发,如何为算力使用者高效输出更好的算力资源的同时释放智算经济价值,成为当下智算中心面临的多样挑战。
算力用户的灵活需求逐步增加,GPU 使用效率急需提升,智算中心无法仅通过裸金属做到 “可度量、可切分、可转换”的算力来精准匹配消费需求。在硬件同质化趋势下,作用在硬件之上的 AI 软件就成为了智算“新解”。智算操作系统,作为智算时代创新升级的 AI 软件产物,不只是传统意义上硬件和软件的桥接,更是构建上下游算力消纳生态、助力 AI 行业发展的关键一环。
那么,高性能的智算操作系统面临哪些挑战,又应当具备何种性能?
方磊介绍,新一轮的底层计算变革由大模型的崛起而引发,高速灵活算法的需求和底层相对固定硬件的匹配成为智算操作系统的核心挑战。新时代的智算操作系统面临异构算例资源纳管困难,大规模集群算力调度能力不足、利用率低,AI 加速优化能力不足,以及 AI 大模型训练微调门槛高等复合挑战。因此,这一高度工程化的操作系统研发仍有较高门槛,需要成熟、标准化的 AI 产品直击痛点。
九章云极 DataCanvas 公司董事长方磊发表演讲
此外,随着 AI 行业的迅猛发展,行业信息差的加速消除,区别于通过购租“裸金属”获得算力的单一方式,未来算力将作为社会普遍的“资源”,以“好用,用好”的普惠形态服务算力消费者。构建可持续发展的上下游算力消纳生态,需要 AI 基础硬件、AI 基础软件和大模型应用的共同发展促成,其中作为 AI 基础软件的智算操作系统在中间层将发挥至关重要的变革作用。
Alaya NeW 智算操作系统——全栈 AI 创新,推动 AI 技术繁荣
凭借九章云极 DataCanvas 公司十余年在人工智能平台、“通识+产业”大模型矩阵以及前沿 Agent 智能体的 AI 软件产品实力积淀和行业理解,内置算力管理内核、人工智能服务、大模型和智能体的 Alaya NeW 智算操作系统,通过自上而下的一体化创新,直击痛点,加速赋能智算中心发展。
NeW Architecture 面向 AI 的新软硬一体架构
Alaya NeW 凭借先进的异构纳管技术实现全面支持各厂家 GPU 算力,通过高性能的 IB、RoCE 网络架构配置优化的网络集合通讯算法,专为大模型设计的高性能存储设施,以及 Serverless 弹性高性能计算架构,全透明的资源调度管理,让用户得以从硬件资源管理中抽身、只专注 AI 核心训练和推理任务。
NeW Kernel 先进的 AIDC OS 系统内核
Alaya NeW 实现了跨中心算力智能调度,设置全功能 Kernel 和轻量 Kernel 来全面纳管不同类型算力中心和集群;面向大模型任务,Alaya NeW 提供专用调度算法和策略,并通过故障感知、拓扑感知调度、GANG 调度、动态公平调度等能力实现更进一步的调度优化,全面提升算力可用性。
NeW Storage 专为大模型设计的存储设施
Alaya NeW 为大模型需求匹配强大的跨越多智算中心的数据平台 NeW Dingo,通过多中心存储、语料专用压缩算法、文件系统物化视图、文件系统与向量数据库融合、原生安全策略等存储技术,不仅实现 70%-90%的空间节省,50%的网络 IO 节省,其语料处理速度同时提升高达 10 倍。
LM Infra 大模型基础设施
Alaya NeW 通过开箱即用的高性能模型训练及推理服务(通过算法加速、编译优化、内存优化、通信加速实现训练效率提升 100%、GPU 利用率提升 50%、推理速度提升 4 倍),安全的高性能私有化模型仓库,以及动态模型推理服务和资源共享,成为高性能、高可用的大模型软件基础设施。
NeW Agent Team Up on Demand
Alaya NeW 内置强大的 Foundation Agent 基座,全面支持知识管理、数据分析、多模态智能体开发;完整的 Agent 开发工具链,面向开源社区高度兼容和开放;支持一键部署 Agent,以及弹性、灵活的运行时环境支持,为多样化 Agent 在各行业业务场景应用按下加速键。
方磊指出,Alaya NeW 可谓是划时代的前沿人工智能技术融合创新之作。Alaya NeW 提供前所未有的交互模式,从 Infra 到 Agent 的各层 AI 能力,Alaya NeW 都能够以便捷交互的操作系统形式呈现。Alaya NeW 不再是简单的 AI 软件,不单能够操作算力的纳管、调度、调优,它更是一个或一组 Agent,用户通过简单的交互指令即可实现复杂的大模型训练等 AI 任务,可以说是用户专属的“数字化人工智能专家团队”。Alaya NeW 正在通过全新的交互变革,打破大模型和 Agent 应用壁垒。
国务院总理李强在大会开幕式致辞中指出,中国始终积极拥抱智能变革,大力推进人工智能创新发展。九章云极 DataCanvas 公司的智算操作系统产品,正是公司十余年创新人工智能基础软件研发和服务的又一力证,未来,公司将以 Alaya NeW 智算操作系统为抓手,与人工智能生态伙伴加速构建稳健可持续的智算产业生态,为我国智算经济发展输出自主创新的 AI 动力!
评论