GAIDC 2023 盛会迎来大模型论坛“主场”,百度飞桨护航大模型产业发展
2 月 25 日-26 日,2023 全球人工智能开发者先锋大会(GAIDC)在上海临港举行,大会以“向光而行的 AI 开发者”为主题,汇聚了当前科技和产业革命中的开发者先锋力量。百度深度参与本次大会,飞桨联合上海市人工智能行业协会主办“智领未来:大模型技术与应用”论坛,百度 AI 技术生态总经理马艳军在“新程序员:人工智能新十年论坛”发表主题演讲,多位百度工程师在分论坛中演讲,大会还设置了文心一格展区和飞桨 AI Studio 集市,携手广大开发者,共逐 AI 产业前沿。
大模型是近几年人工智能发展的重要方向,具有效果好、泛化性强等特点,近期火爆的大语言模型为 AI 发展带来新机遇。26 日下午,“智领未来:大模型技术与应用”论坛座无虚席,开发者热情满满,多位大咖分享预训练大模型最新技术进展。
论坛主席、百度飞桨总架构师于佃海发表致辞,“AI 预训练大模型,是深度学习崛起以来最重要的一次技术变革,极大降低了 AI 开发和落地的门槛。叠加情景学习、指令微调等机制,使大模型实现超出想象的能力涌现以及价值观对齐,让我们看到了通用人工智能实现的曙光。”他强调,大模型的技术发展要抓住其通用性的特质,价值的体现需要通过产业应用落地来实现,同时,深度学习平台为大模型发展保驾护航,将会发挥更关键作用。
会上,复旦大学计算机学院教授邱锡鹏从学术角度入手,围绕时下大火的语言大模型为与会者进行深度拆解,认为百亿规模是小模型到大模型的分水岭,为开发者带来全新的 AI 开发模式,“要让大语言模型和现实世界打通、交互,才能学到更多文本无法表达的知识。”
大模型也在朝着多模态和跨模态演进,北京智源人工智能研究院研究员伍昱表示,语言、视觉模态的融合对齐,使得大模型呈现多元发展的态势,带来 AIGC 在研究和应用层面的爆发,希望通过开源共建的方式,以高质量数据推动多模态大模型发展。
百度计算机视觉首席科学家王井东介绍了文心大模型家族中的视觉大模型。针对 CV 大模型,文心在表征预训练算法、自监督算法、图文模型引导技术等领域进行了行业探索,基于领先的视觉技术,利用海量的图像、视频等数据,为企业和开发者提供强大的视觉基础模型,以及一整套视觉任务定制与应用能力,已广泛应用于 OCR、工业视觉、度目、自动驾驶数据挖掘等百度内部产品,为应用研发和体验优化带来深度价值。
现场,百度深圳自然语言处理部技术总监何径舟介绍了 AIGC 另一重要路径“跨模态文图生成”,阐述其研发背景与发展脉络,并带来文心大模型 ERNIE-ViLG 2.0 的技术解读。该模型是全球首个知识增强的 AI 绘画大模型,也是目前全球参数规模最大的 AI 绘画大模型,在语义可控性、图像清晰度、中国文化理解等方面表现突出,并打造了 AI 艺术与创意辅助平台“文心一格”,是当前最先进、最受欢迎的“AI 作画”产品之一。
针对大模型产业面临的开发落地难、生态基础薄弱等问题,NVIDIA 和昆仑芯则在现场分享了大模型实现软硬协同、加速优化的经验方法,推动构建底层硬件生态,加速大语言模型的研究和应用落地。现场还演示了基于飞桨的大模型训练、压缩、推理全流程操作,飞桨分布式训练和压缩推理的优势凸显。
百度产业级知识增强文心大模型,结合技术发展趋势与产业实践,目前已发布 36 个大模型,包括 NLP(自然语言处理)、CV(计算机视觉)、跨模态等基础大模型,生物计算等领域的任务大模型,以及 11 个行业大模型,已在能源、金融、航天、制造等领域落地。同时打造大模型开发套件、面向大模型的 AI 开发平台、大模型 API 和场景化产品等。近日,IDC 发布《2022 中国大模型发展白皮书》中,百度文心大模型在产品能力、应用能力、生态能力中全面领先。
实际上,深度学习平台和大模型,贯通了从硬件适配、模型训练、推理部署,到场景应用的全产业链,夯实产业智能化底座。
在 26 日上午举行“新程序员:人工智能新十年论坛”上,马艳军也强调这一点,随着人工智能产业发展,深度学习平台与大模型结合越来越紧密,飞桨深度学习平台从分布式训练、大模型推理、端到端开发等维度为大模型提供支撑,大模型也牵引着深度学习平台的发展方向,两者结合有效降低人工智能开发与应用的门槛。马艳军还表示,飞桨深度学习平台长期从教学培训、生态培育、算力普惠等方向,携手开发者共建开源生态,飞桨也是目前中国最活跃的开源项目。
在展区,文心一格、飞桨 AI Studio 集市吸引了众多 AI 开发者驻足,体验领先的人工智能应用与开发、学习、实训套件。
以“飞桨+文心大模型”筑基,百度致力技术创新,打通产业化路径,加速“数实融合”,百度将持续基于自身优势,建设更繁荣的 AI 生态,推动产业智能化升级,为我国实现高水平科技自立自强、经济社会高质量增长贡献力量。
评论