写点什么

AIGC 繁花,绽放在精耕的算力土壤之上

作者:脑极体
  • 2023-06-13
    广东
  • 本文字数:3878 字

    阅读完需:约 13 分钟

2023 年的春天,称得上一句 AI 之春。大模型成为技术力量新的爆发点,生成式 AI(AIGC)应用风起云涌。

产业界争先恐后训大模型之际,广大用户最大的困惑是——发布了,但就是玩不到啊!

OpenAI 有地域限制且不去说它,各种国产大模型也很少有大大方方让大家随便用的,排队等邀请码、群里求测试账号、不开放 API、只定向邀请企业客户、上线没几天停止访问……

过去几个月,想用 AIGC 的人,没少受这些折磨。

当然,这种局面也不能怪大模型的开发运营团队,实在是“心有余而力不足”——AI 算力太紧缺了。


想开发大模型的高校和研究机构,抢不到、买不起 GPU 卡;已经发布的大模型,用户暴涨,导致算力需求的指数级增长和巨大的成本压力,撑不住访问。

就像保尔·芒图在《十八世纪产业革命》中说的那样:“经济演变是比较混乱的,好像撒在大地上的种子那样慢慢生长。无数模糊不明的事实,在细节上几乎是微不足道的,但彼此无限地相互改变着”。

新型 AI 算力基础设施,就是那个至关重要的细节,直接影响到这次智能产业革命的进程。

在诸多解决方案中,新华三的破题思路,别具特色,一言以蔽之——精耕务实。

首先让我们先从算力本身出发,去看看大模型时代的 AI 奋锄者,究竟需要什么?又能得到什么?

晨兴理荒秽:算力土壤,为何贫瘠?

AIGC 的价值潜力已经十分明晰,让大模型成了各大科技企业争相抢夺的那颗“好苗子”。

陶渊明描写古人耕种要“晨兴理荒秽,带月荷锄归”,先摘除阻碍作物生长的杂草,才能保障后续的收成。

所以,首先要搞清楚一个问题,为什么 AI 算力显得如此贫瘠?

第一,供给不足。受摩尔定律达到天花板的影响,计算硬件的性能提升越来越有限,AI 算力短缺问题长期存在,大模型又进一步加剧了算力焦渴。以 176B 参数规模的大模型为例,FP16 精度下,训练过程内存峰值会达到 2800G+,需要 35 张以上 80G 显存的 GPU 才能容纳。很多国内高校,有 AI 人才、技术积累,想要探索大模型,却买不到、买不起 GPU 卡,止步于昂贵的 AI 算力门槛,是非常可惜的。

第二,需求溢出。大模型和生成式 AI(AIGC)的出现,微软、谷歌、百度等科技巨头,都在用 AI 重新构想所有的核心产品。技术的快速溢出,算力基础设施没有来得及跟上,造成了 AI 算力供需的不匹配。随着 AIGC 扩展到每个领域,越来越多的智力劳动逐步被 AI 化、自动化,算力供需的“剪刀差”,还会继续拉大。

第三,效率低下。企业/科研机构对模型开发和 AI 全域应用的不了解、不高效,会直接导致准备不充足,比如训练数据质量低、AI 应用开发经验不足、资源损耗大;研发周期长,比如大模型研发慢、推理效果差,不得不反复迭代试错,也就消耗了更多的时间成本、算力成本。


第四,安全隐患。数据是模型核心的原材料,企业私域数据更是企业的核心资产。企业的大模型如果使用不当,会存在企业私域数据泄露的风险,造成企业即便拥有大量算力也不敢放心使用。

第五,可持续顾虑。“焚薮而田,岂不获得,而明年无兽”,这个道理同样适用于大模型时代。大模型的数据处理量巨大,带动数据中心耗电量快速增加。GPT-3 大模型每次训练,碳排放量高达 552 吨。中国大模型和 AIGC 的发展,必须建立在绿色节能的算力基础设施上,“东数西算”工程就为各地新建数据中心 PUE,提出了严格的要求。

面对 AI 算力贫瘠的局面,干着急是没有用的,唯有靠劳作者挥锄挖地,为行业理清荒秽,释放算力这一新生产力。

迎着大模型和 AIGC 的晨光,新华三已经开始培育 AI 的土壤。

精耕细作:新华三蕴育全栈 AI

“算力不足,那就增加供给,堆 GPU 卡,上服务器,建数据中心集群”——这是常规思路。

新华三的 AI 蕴育之路没这么简单,在刚刚落幕的 2023 NAVIGATE 领航者峰会上,新华三正式发布了“百业灵犀 LinSeer”私域大模型和支持 AIGC 大算力调度的“傲飞算力平台”,可与业务深度结合提升工作效率,持续优化算法和积累公域数据,为客户提供最新知识能力。同时推出了“AIGC 开放战略”,既支持“百业灵犀+新华三 ICT 基础架构”的模式保障数据安全,实现最优配合,同时也支持“客户自选大模型+新华三 ICT 基础架构”的模式满足多种需求。


新华三如此用心耕耘,这么多的复合能力,究竟能为这一波 AI 浪潮带来什么?

第一步,培土,让大模型“用有其算”。

解决算力瓶颈,提供充足、普惠且安全的 AI 算力,支持高校、科研机构和广大企业的充分探索,大模型和 AIGC 才有茁壮生长的可能性,靠的就是新华三智算解决方案的“算力基础设施”,有三个显著特点:

充足。新华三对基础设施进行优化,让硬件发挥出极致性能。打造了超高性能 AI 服务器,强势推出 H3C UniServer R5500 G6,可以提供 8 卡 H800 OAM 训练能力,内部互联 400Gb/s 极速网络,支撑大模型的高效训练。CX8000 高性能分布式并行文件存储,专为 AI 训练研发,单节点 IOPS 可达 20 万+,可以满足 AI 超大规模数据对存力的需求。Seerfabric 软硬一体方案,通过跟 AI 深度融合,实现流量零丢包,发挥 RoCE 网络最大性能,大模型训练时间缩短 10%,配合主动安全全面防护,为上层平台和应用提供安全、高效的算力支撑。

普惠。模型开发部署的过程中,通过傲飞算力平台共享 AI 算力,降低算力空闲时间,可以将算力利用率提高至 70%以上,智算中心成本大幅下降,提供普惠 AI 算力。

安全。避免大模型服务使用时造成的数据外泄是企业放心使用大模型的重要前提。新华三智算解决方案通过 4 大安全体系:传输安全+数据安全+访问安全+安全审计,保障用户使用私域大模型的同时,全方位保障私域数据安全,避免企业私域数据出域。

绿色。新华三的零碳数据中心,将各绿色单元组合起来,降低高算力带来的碳排放问题;新一代液冷解决方案,可以将数据中心的 PUE 降到 1.1 及以下,满足国家对数据中心的低碳要求,带来绿色算力。


第二步,护苗,让大模型“算有其法”。

从来没有下过地的新手,很容易就糟蹋了种苗,浪费了土地,更重要的是,错过了农时。

大模型作为新技术,很多参与者都是刚开始接触,要抓住宝贵的产业机会,必须有章法。新华三不仅提供“土壤”,还精心“护苗”,为大模型的成长、应用,带来了全链路的平台和服务。

平台层面,统一的数据平台“绿洲”,可有效进行数据全生命周期管理;支持 AIGC 的大算力调度平台“傲飞”,提供包含智能标注、智能训练、智能调优、智能部署、智能推理的全流程算力智能调度,支持 8000 节点的算力调度,并发训练时间缩短至 50%,断点自动接续无感知训练更稳定,全方面提升大模型训练性能。

服务层面,针对大模型预训练/微调、强化学习、提示学习等特点,新华三根据自身大模型实践经验,封装了推理、微调、训练这三种大模型服务能力,降低大模型使用门槛。

比如基座大模型推理,对推理架构/执行/过程进行优化,并提供配套基础设施,可以为科研工作者构建 AI 科研环境,满足数据挖掘分析、模式识别等需求。新华三的“传输安全+数据安全+访问安全+安全审计”4 大安全体系,可以在私域大模型的训练推理过程中,保障企业数据资产的安全不外流。

私域大模型微调,新华三的 10+种基座大模型,结合微调优化,可以助力企业快速打造垂直领域私域大模型,实现小时级生成。

自主大模型训练,提供 100 多个评估维度与评估指标,如 BLEU、ROUGE、METEOR 等,有效缩短模型的研发周期。

接下来,孕蕾,让大模型“算有所值”。

大模型和 AIGC 要通过产业落地,来完成技术的价值转换。要结出更多的应用果实,前提是与百行百业开始连接、探索落地业务场景、孕育应用的花蕾。

这个“传花授粉”的过程,仅靠单一的产业角色是无法完成的。新华三构建了一个开放的产业生态,吸引合作伙伴参与到大模型建设中,共同蕴育全栈 AI 的无限潜力。

全栈 AI 的生态繁荣,才有大模型的硕果累累,技术红利的价值落地。

可以看到,正是新华三的精耕细作、用心栽培,大大降低了大模型和 AIGC 的发育难度。

借助新华三的智算解决方案,越来越多的研究者/企业,可以从算力焦灼中解放出来,抓住宝贵的增长窗口期,培育属于自己的大模型。

由此,可以引出下一个话题:与时代同步,培育大模型“土壤”,为什么是新华三?

实地立身:新华三的根深,大模型的叶茂

大模型和新型智能基础设施,是第四次产业革命的关键,也是数字经济的大势所趋,坦率地说,这个产业趋势是显而易见的。

但是,看到趋势,并不一定能抓住趋势。

大模型和 AIGC 等新技术的发展与应用,相当于在一片晨雾和产业荒原中摸索。算力基础设施服务商,不可能“以其昏昏,使人昭昭”,自己都没搞懂大模型和 AIGC,自然没法赋能研究者和高科技企业。

能构建一套清晰可行的智算解决方案,新华三的优势就是“脚踏实地”。

首先,新华三的技术根深,可以构筑新价值。

深耕 ICT 领域,承担 AI 领域科研课题的新华三,技术能力与产品积累非常深厚,布局广泛,能够为全栈 AI 技术、软硬件和服务,提供持续创新的动能。

此外,新华三的创新务实,可以解决真问题。

大模型时代的技术变化和产业应用日新月异,各行业的落地条件和能力禀赋也有所不同,这就要求基础设施服务商对变化有深刻且快速的洞察,才能确保每个行业/产学研各类用户的需求都得到满足。

作为数字化解决方案领导者,新华三有丰富的服务实体产业经验,可以及时洞察产业客户的需求,进行技术和产品的更新迭代,让每一个创新都能切实解决用户在意的真问题。

智算解决方案中,普惠算力,高效易用的平台,软硬拉通的服务等,都来自产业用户在业务场景中成本敏感、效率优化等实际痛点。


回头对比一下几年前的生活,会发现 AI 技术已经在切实影响、改变我们的社会经济。大模型的到来,让智能变革继续加速,最终每个人、每个行业乃至每一个国家,都会是人工智能的参与者和受益人。

产业智能革命的土壤,从未像今天一样肥沃。在新华三的基础设施底座上,大模型这颗种子,正在茁壮生长。接下来,就看百行百业如何释放大模型的无限想象,将 AIGC 的硕果垂满中华。

发布于: 刚刚阅读数: 7
用户头像

脑极体

关注

还未添加个人签名 2020-06-12 加入

还未添加个人简介

评论

发布
暂无评论
AIGC繁花,绽放在精耕的算力土壤之上_AI_脑极体_InfoQ写作社区