【重磅干货】大模型时代,开发者云上成长指南
本文分享自华为云社区《【重磅干货】大模型时代,开发者云上成长指南》,作者:华为云社区精选。
2024 年最热的技术关键词,非大模型莫属。面对这样一个超级“技术网红”,在一切皆可大模型的时代,开发者能否紧跟它的发展步伐,立于技术的潮头显得至关重要。
如何充分利用云上的基础设施,让大模型开箱即用?如何借助辅助开发工具,让代码编写过程更加高效,事半功倍?当行业应用遇上大模型,会碰撞出怎样的创意火花?……
综合权威机构发布的大模型相关的技术趋势洞察,我们精选了四大热门技术方向,并辅之以华为云相关技术服务作为典型案例,帮助开发者厘清大模型时代需要掌握的关键技术, 通过这份大模型开发者成长指南,助力大家在这波技术热潮中先人一步。
AI 增强开发——CodeArts Snap 写代码事半功倍
当大模型技术应用到软件开发领域,它正在颠覆传统的软件工程,在 Gartner 的 2024 技术趋势报告中,提到了 AI 增强开发,它指的是用生成式 AI、机器学习等 AI 技术协助软件开发人员精选应用设计、编码和测试。
CSDN 发布的《AI 开发者生态报告》中提到,近 90%的开发者已经使用代码生成工具; 其中,35%的开发者每天都使用代码生成工具。
毋庸置疑,大模型正在开启软件开发的新范式,尤其是在自动化方面,基本上超越了传统工具,为软件研发效率的提升带来质的变化。编程和应用开发的门槛逐渐降低,应用开发能力便捷逐渐扩展,全民开发者的时代正在来临。
但与此同时,由于生成的内容难以限制,一些“不安全”或者“不应该”出现在生成结果中的代码会出现在生成结果中,导致市场上各 AI 辅助编程工具质量不一。
源于华为自身的研发实践,华为云基于大模型技术,学习了 1300 多万篇经典的技术文档、760 亿行精选代码,打造了智能开发助手 CodeArts Snap。
它基于智能生成和智能问答两大核心场景提供了支持多种主流 IDE 的插件,覆盖代码生成、研发知识问答、单元测试用例生成、代码解释、代码注释、代码翻译、代码调试、代码检查等八大研发场景。
CodeArts Snap 的代码生成,就像一位聪明的机器人,开发者在编写重复性代码、快速原型开发等多个场景中只需输入自然语言,就能生成完整代码逻辑,并准确率最佳。它的代码解释专治开发者的“阅读困难症”,无论是学习新编程语言、分析他人代码,还是优化代码、故障排除,即可将代码复制黏贴到工具中,实现快速分析代码并自动生成详细的解释文档。
灵感到代码只需“弹指间”即可实现。
华为云 CodeArts Snap 的“全场景代码智能生成”能力,其核心技术沉淀于华为云 PaaS 技术创新 Lab 与华为诺亚方舟实验室联合打造的 PanGu-Coder 代码大模型中。比如,针对函数级的代码生成与补全任务,CodeArts Snap 分别发布了参数量为 3 亿和 26 亿两个规模可用的生成功能。当给定函数名并用自然语言描述需要实现的功能后,模型即可生成完整的函数功能代码。
同时,CodeArts Snap 在各阶段均采取了针对性措施,有效规避了业界产品普遍带来的编程安全隐患。例如为避免开源代码带来的系统性风险,在数据预处理阶段,预训练数据对可能产生问题的 licence 涉及的代码进行了精细的过滤,从根本上杜绝开源 licence 风险。
Codearts Snap 现在已经开启了公测,已经有一些开发者在华为云开发者社区分享了他们的👉 体验心得,也欢迎开发者👉 前来体验。
行业大模型——盘古大模型让企业开发者更高效
垂直领域应用是大模型的主战场。随着生成式 AI 技术的飞速发展,各行各业都将迅速整合大模型的能力创造全新的应用,催生出全新的商业价值。
华为云盘古大模型正式对外发布以来,也一直颇受关注,盘古大模型提供 5 个基础大模型(自然语言、视觉、多模态、预测、科学计算)+N 个行业大模型+X 个场景模型的三层解耦架构, 天然具备良好的生态开放性,通过分层的 AI 能力及工具,成就不同行业开发者百模千态的需求。
其中,华为云 L0 盘古基础大模型提供 100 多个能力集,各项能力集互相解耦,可以通过 API 直接调用。企业开发者可以根据业务场景需要,选择所需的能力集,使用盘古大模型工作流,快速开发行业场景应用。也可以在 L0 或 L1 盘古大模型的基础上,通过对自有数据的二次训练快速训练出自己专属的行业大模型。
为了加速和简化行业大模型从开发到落地,华为云还提供了盘古大模型工程套件,包括数据工程、模型开发和应用开发三大套件, 基于此,完成一个千亿行业模型端到端开发,从过去需要 5 个月缩短到现在 1 个月,整体速度提升 5 倍。
在气象领域,华为云盘古气象大模型已正式上线欧洲中期天气预报中心和香港天文台地球官网,并携手深圳市气象局、泰国国家气象局等打造高精度区域气象预报大模型,利用人工智能技术提升气象灾害预警能力。在 2023 年汛期,盘古气象大模型成功预测了玛娃、泰利、杜苏芮、苏拉等强台风路径。
除此之外,盘古大模型在医疗行业的落地,让医生为患者提供更高效的健康管理服务;在电商行业智能化生成产品文案、广告创意,让跨境电商的生意更好做……
开发者可以👉 点击链接前往申请体验试用盘古大模型。
向量数据库——GaussDB 向量数据库是大模型的超级“外脑”
大模型时代,为了支持模型的高效运行,开发者需要掌握云原生基础设施技术。这波汹涌而来的大模型浪潮,也必然会催生基础设施的革新,其中最具有代表性的就是数据库的升级。
基于海量数据训练而来的大模型,往往会遇到一些令人啼笑皆非的问题,比如对不知道的知识一本正经的胡说八道,或因为训练的时间的滞后导致无法获取到最新实时的知识,从而给出过时的答案。
面对大模型在训练过程中出现的准确性和实时性难题,向量数据库是最佳的选择。它是一种专门用来处理向量嵌入(Vector Embedding)的数据库,通过比较向量值并找到彼此相似的值来索引和检索数据,适用于处理如文档、图像、视频和网页等非结构化数据。
如果把大模型比作人的大脑,那么向量数据库就如同大模型的“外脑”。
在实时性方面,向量数据库可满足秒级甚至毫秒级数据更新的需求,解决大模型预训练或微调都需要天甚至月级以上时间,导致知识库新鲜度相对滞后的问题,减少大模型的“幻觉”。
在隐私性方面,通过向量数据库本身的权限控制,能真正实现隐私数据自主可控不出端。只需使用通用大模型外挂向量数据库,即可解决私有数据注入大模型带来的安全和隐私问题。
在上下文限制方面,向量数据库具备历史数据持久化的能力,同时持久化的数据可以通过内置的 ANN 算法做相似性查询,返回最相关内容,从而突破大模型上下文限制,实现长期记忆。
华为云在向量数据库和 DB4AI 领域积累颇深,从 2018 年开始就启动以图搜图项目,储备了相关技术,并于 2023 年正式对外发布华为云 GaussDB 向量数据库。
GaussDB 向量数据库结合语义 Embedding 技术,能基于客户实际的文档和规范回答问题,结果更准确。并且可以将已推理过的问题进行缓存,当相同问题再出现时,不需要经过大模型推理即刻返回结果,大幅减少算力成本。
与业界主流向量数据库相比,GaussDB 向量数据库具备千亿级大规模向量数据快速查询更新的能力,检索规模提升 10 倍;内置 ANN-Benchmark 榜单性能排名第一的华为 ANN 索引算法,查询时延<10ms,响应速度提升 2 倍;且具有千维查询能力,查询结果更精准。
当前,已使用 GaussDB 数据库的开发者可以通过升级体验 GaussDB 向量数据库的所有功能,实现无感知式扩容和一站式部署,降低学习和部署成本。同时,GaussDB 数据库生态成熟、社区活跃,相关的工具和扩展十分成熟可靠,👉 点击链接前往让向量数据库的使用无后顾之忧。
AI 算力——昇腾 AI 云服务助力开发者落地大模型应用
根据 CSDN 发布的《AI 开发者生态报告》调查,除了大模型技术,生成式 AI、算力也是开发者最关注的技术突破方向之一。
算力是训练大模型的基础,大模型的涌现,使得 AI 算力的需求出现指数级的增长。研究表明,大参数量、大数据量、大计算量已经成为大模型表现好的主要因素。
在 infoq 发布的《中国软件技术发展洞察和趋势预测研究报告》中,提到了云 forAI 新阶段:在 AI 模型训练和应用生成的过程中,更要充分利用云的资源弹性,对异构算力的便捷管理能力等技术手段,提供工程高效率、成本可观测、弹性可预测、结果可复制的 AI 模型生成流水线。
为支持百模千态稳健发展,华为云在贵安、乌兰察布、芜湖 3 大 AI 算力中心上线了昇腾 AI 云服务,让 AI 算力即开即用。
华为云昇腾 AI 云服务支持万卡超大规模集群,万亿级参数大模型分布式并行训练,大幅提升训练效率;提供更长稳的 AI 算力服务,千卡训练 30 天不中断,长稳率达到 90%,断点恢复时长不超过 10 分钟;提供盘古大模型 100+能力集、100+内化后的开源大模型,让大模型开箱即用。
为了释放昇腾硬件算力,昇腾 AI 异构计算架构 CANN 发布更开放、更易用的 CANN 7.0 版本, 全面兼容业界的 AI 框架、加速库和主流大模型,同时通过大颗粒算子深度融合、Kernel 调度策略优化、通信并发流水等技术手段,解决大模型训练核心问题,使能大模型性能深度优化。
同时升级昇腾 Ascend C 编程语言,提供大模型融合算子开发能力,可支撑周级完成大模型典型融合算子开发,性能同比单算子提升 5 倍以上。Ascend C 遵循 C/C++标准规范,并通过编译器编译和运行时调度,直接运行在昇腾系列硬件,可高效实现自定义创新算法。
为了让开发者能够更加便捷地将 AI 算力应用实践到各种创新场景,华为联合香橙派发布了基于昇腾的 Orange Pi AIpro, 提供 8/20TOPS 算力,能覆盖生态开发板者的主流应用场景。满足大多数 AI 算法原型验证、推理应用开发的需求,可适用于 AI 边缘计算、深度视觉学习及视频流 AI 分析、视频图像分析、自然语言处理、智能小车、智能家居等领域,👉 点击链接前往快速上手 Orange Pi AIpro。
当前,华为云的 AI Gallery 社区已经聚合数据集、模型、实践 3 大类等 10 万+AI 资产,其中的昇腾 AI 云服务“百模千态”专区,提供基于异腾 AI 云服务适配的业界主流开源大模型, 易用开发工具和超强算力,丰富的应用开发工具链已经全部实现了云化,免去繁琐的配置流程,实现一键接入,即开即用助力开发者快速创建模型应用,👉 点击链接前往
最后
大模型的涌现,我们得以窥见技术的无限潜能。它不仅在实际应用中显著提升了开发者的工作效率,也预示着通用人工智能时代的迫近。“工欲善其事,必先利其器”,在技术奇点即将来临的时刻,开发者们更应深入理解与其相关的前沿技术,华为云将持续助力企业和开发者创建自己的大模型应用,在大模型时代先人一步。
版权声明: 本文为 InfoQ 作者【华为云开发者联盟】的原创文章。
原文链接:【http://xie.infoq.cn/article/77a87abfd3d8dd72dda5baa00】。文章转载请联系作者。
评论