应用落地 智创未来 | 2021 新一代人工智能院士高峰论坛昇腾人工智能应用专场成功举办
12 月 19—20 日,由鹏城实验室和新一代人工智能产业技术创新战略联盟主办的“2021 新一代人工智能院士高峰论坛暨启智开发者大会”在深圳举办,期间,华为技术有限公司承办的新一代人工智能院士高峰论坛昇腾人工智能应用专场于 20 日成功举行。
深耕基础,厚植技术。近年来,华为昇腾以“硬件开放、软件开源、使能伙伴、发展人才”16 字方针不断发展产业,携手各行各业的开发者们进行赋能升级,助推人工智能的应用落地。本次昇腾人工智能应用专场,华为更是邀请了多位昇腾技术专家,从一线的 AI 应用挑战出发,与开发者们研讨交流,共创机遇。
与开发者共成长,共筑 AI 技术生态
会上,华为昇腾生态首席专家张存燕以行业的人才培养为切入点,向大家分享了昇腾面向开发者们的 offering 发展战略,以及面向行业、高校、初创、个人不同类型开发者的权益和计划。张存燕介绍到,华为深耕根技术,一直致力于打破算力消耗的鸿沟。在昇腾基础软硬件平台上,昇腾一共打造了技术和商业两个生态。技术生态为科研机构、高校、企业、合作伙伴的研发人员提供技术支撑,加速科研创新;商业生态则注重与合作伙伴一起打造面向各行各业的解决方案,真正让 AI 走入到千行百业,赋能各个产业的智能化改造和智能化升级。
在这两个生态的带动下,昇腾希望打造一个人工智能的“黑土地”,合力为每位 AI 开发者及每个行业的应用开发者提供强大引擎,共同繁荣国内人工智能产业新生态。
构筑澎湃 AI 算力,CANN5.0 性能再提升
在汹涌的 AI 时代浪潮中,人工智能技术领域无疑面临着重重困难和挑战。AI 算力设施昂贵、专业人才稀缺,整个行业对计算效率和编程易用性的诉求愈发强烈。昇腾 CANN 运营总监田晓亮便从新计算范式出现、异构计算兴起和大集群等行业新挑战引导发问,介绍了 CANN 的基础架构及其适配场景。自 2018 年 CANN1.0 发布面世,经过三年发展,CANN 在技术和生态上都已经有了长足的进步。在性能方面,CANN5.0 通过软硬件结合优化,充分发挥了昇腾芯片的算力性能。这主要源自于多项关键技术的突破,如自动流水、算子深度融合、自适应梯度切分、智能计算调优带来的更高效的任务角度和切分策略。
在发展过程中,CANN 还非常注重生态发展,通过社区运作,CANN 不断创新优化,迭代出了新的产业、新的软件。回应开发者诉求、助力解决行业困境,CANN 未来将持续在基础和关键技术上进行突破,“只有基础打得牢、根扎得深,才会有人工智能的繁荣发展”,田晓亮这样强调。
全场景 AI 计算框架,MindSpore 超大模型训练落地实践
近段时间,中文大规模预训练语言模型层出不穷,已经成长到仅加载就需要 TB 级内存或显存的生态。昇思 MindSpore 架构师 ZOMI 酱就针对 MindSpore 超大模型训练的一些关键技术,进行了一些稍为“硬核”的内容分享。MindSpore 在 2020 年 3 月份开始开源,到现在的 1.5 版本,总下载量已经接近 100 万。快速部署、灵活调试,现在的 MindSpore 已经能够支撑像鹏城盘古 NLP、鹏城神农氨基酸序列生成、华为云 NLP 模型、紫东太初多模态模型这样的千亿大模型。对于大模型面临的“内存、性能、效率、调优”挑战,MindSpore 则分别对应给出了图算融合、Scale out、集群调优等解决方案。
讲起核心技术,ZOMI 酱表示,除了通过图的编译把多维度并行融合到框架,“多维度混合自动并行”是 MindSpore 做得比较好的地方。现今,MindSpore 自动并行已经实现 5 维的并行方式,实现对超大规模的分布式训练及超大规模中文预训练模型的探索。
MxIndex: 更快、更便捷、更友好的数据检索 SDK
将物理世界中的非结构化数据,如图片、视频、音频通过 AI 模型转换为特征,是众多 AI 业务的核心逻辑。昇腾 MindX 技术专家李明举在给大家介绍数据检索的 SDK 时,就用简单的语言阐释了普通开发者如何用 AI 来解决生活中的问题。让 AI 从学术成果到产业落地,昇腾 MindX 总结了三座问题大山——算法开发难、应用开发难和业务部署难,而 MindX 的四个组件“ MindX DL”“ MindX Edge”“MindX Zoo”和“MindX SDK”则对应这三座大山给出了解决方案。
“大数据”“区块链”“元宇宙”,各行各业的概念正潜移默化地改变着我们的生活,昇腾 MindX SDK mxIndex 更是将目光聚焦在了非结构化数据上。李明举提到,非结构化数据有着非常多潜在的发展空间,在推荐系统、数据挖掘等领域都有良好的发展前景。但同时,机遇与挑战并存,算法问题常常会演化成更大的工程问题,如何在如此多的技术之下去搭建业务,mxIndex 在这里给出了答卷。“更快”——带来更高的 QPS,更大的吞吐量和更大的底库数据规模;“更便捷”——昇腾拥有开源中最受欢迎的框架之一,而 mxIndex 在用户迁移上更是兼具了轻体量与便捷性两项优点;“更友好”——清晰操作、在线交流,在用户体验上,mxIndex 拥有简明的接口定义,丰富详实的手册和活跃的社区支持。对于大规模特征检索或聚类的应用场景需求,mxIndex 能够提供极简易用、高性能的 API,助力昇腾 AI 处理器赋能各类应用。
Sedna,分布式协同 AI 框架
边缘 AI 在如今的工业互联网、智慧园区等场景已有着越来越多的应用,但同时还存在着诸多挑战,包括软硬件异构、边缘资源受损、边缘数据异构、边缘小样本和隐私安全等常见问题。会上,华为云边缘云创新 Lab 高级工程师普杰从应用的角度,向开发者们介绍了华为云在边缘计算尤其是边云协同 AI 领域的相关探索。
2018 年,华为云开源了边缘计算平台项目 KubeEdge。作为业界首个云原生的边缘计算平台,KubeEdge 通过开放的社区治理连接云原生和边缘计算生态,旨在提供应用协同、资源协同以及数据协同和设备协同的统一标准。
在边缘计算场景中,AI 应用需要面对个性化的边缘场景,资源碎片化、数据异构、小样本、数据隐私等问题急需解决。2020 年底,KubeEdge 社区成立了特别兴趣小组 SIG AI,聚焦边缘 AI 相关的技术讨论、API 定义、参考架构、开源实现等,使能 AI 应用在边缘更好的运行。
2021 年初,华为云进一步开源了边云协同 AI 框架 Sedna,基于 KubeEdge,实现边与云的协同推理、增量学习、终身学习、联邦学习等核心边缘 AI 能力,能有效提升模型准确度,降低边缘资源的消耗,保护数据隐私和安全。
普杰提到,Sedna 不是想做一个 TensorFlow 这样的框架,而是基于 KubeEdge 提供的边云协同的能力,支持现有的 AI 应用无缝地下沉到边缘,降低边云协同 AI 应用的构建和部署成本、提升模型的性能并保护数据隐私。
现场实操,在线体验昇腾全栈 AI 魔力
当天下午,昇腾人工智能应用专场进行了丰富有趣的案例分享和在线实验。现场由昇腾 CANN 资深技术专家毛红朝、昇腾 MindX 研发专家陈航、昇思 MindSpore 资深技术专家 xavier 和昇腾 CANN 资深技术专家郑佳带领,为开发者们带来了“基于昇腾 CANN 的 AI 应用开发”、“使用 MindX SDK 开发智能质检应用”、“昇思 MindSpore YOLO 案例开发到部署介绍”和“基于昇腾 CANN 的模型迁移”四场实操课程。
共筑 AI 新高地,共赢智能新未来。伴随着惊喜有趣的现场抽奖环节,开发者们于实践中全方位感受华为面向“端、边、云”的全场景 AI 基础设施方案,在线体验来自昇腾的全栈 AI 魔力。
评论