写点什么

企业要想构建 AI 竞争力,就必须“私藏”大模型

作者:极狐GitLab
  • 2024-03-04
    上海
  • 本文字数:2360 字

    阅读完需:约 8 分钟

企业要想构建 AI 竞争力,就必须“私藏”大模型

3 月 3 日,由深圳市产学研合作促进会举办的海峡两岸暨港澳人工智能与机器人发展论坛在深圳市福田区会展中心开幕。极狐 GitLab CEO 柳钢受邀出席此次活动,并做了题为《创新与安全并重:大模型私藏之道》的主题分享。

极狐GitLab CEO 柳钢


人工智能之新曦


自 ChatGPT 横空出世以来,AI 的发展浪潮,一浪高过一浪。过去二十多年,CEO 柳钢一直在科技公司工作,结合自身的工作经历,CEO 柳钢对于 AI 的发展进行了简述:人工智能的发展早期可以追溯到上个世纪,比如 1956 年的达特茅斯会议。进入 2000 年以后,AI 的发展有了很大的进步。2006 年,被称为人工智能之父的 Hinton 提出的深度神经网络带来人工智能在视觉等领域的突破和巨大发展;2016 年,AlphaGo 战胜世界名将李世石和柯洁,标志着人工智能可以在某一领域战胜人类智慧;2017 年,Google 提出 transformer 架构,该架构因为其独特的自注意力机制、高效的并行处理能力,在 AI 领域产生了深远的影响,也开启了自然语言处理技术的新篇章。当然,真正让 AI 为大众所熟知的是 2022 年底 OpenAI 推出 ChatGPT 这一事件,其标志着大模型和 AIGC 正式进入大众视野,从此 AI 进入大模型时代。


绚烂绽放:大模型的“繁华”


在这一波浪潮中,国内外企业都在抢抓 AI 发展机遇,大模型、产品都层出不穷,大模型的“繁华”正在绚烂绽放。CEO 柳钢举了几个国内外的例子。比如微软这家已经伟大了几十年的公司,凭借着对于 OpenAI 的投资(据统计,微软从 2019 年开始投资 OpenAI,前后投入的资金达 130 亿美金),以及将 AI 产品快速应用到自家产品中,让其市值达到了 3 万亿美元,成为了全球市值最高的公司。

AI 大模型时代的当红炸子鸡“OpenAI”,在接连推出文字问答产品 ChatGPT、文生图产品 DALL-E、以及文生视频产品 Sora 后,估值已达到 800 亿美元,成为了顶级独角兽。

另外一家很值得讨论的企业 —— Meta,前身是 facebook,在元宇宙兴起的时候,公司 CEO 扎克伯格宣布将公司改名为 Meta,随后公司股价一路下跌,但随着大模型的兴起,公司股价又一路上升,现在也是突破万亿美元。

再比如大模型发展风口的英伟达,这家提供 AI 核心硬件——GPU 的公司,成为了过去两年 AI 发展的最大赢家,公司股价一路飙升,也让公司的市值突破两万亿美元,成为了全球第一家市值突破万亿美元的硬件公司,而作为老牌的芯片提供厂商——英特尔,其近两年的发展和英伟达相比就明显逊色许多,市值仅有 1800 多亿美元。

除了这类科技公司在乘 AI 东风快速发展的时候,一些传统赛道的企业也在积极布局发展 AI,比如全球最大的零售商沃尔玛就正在使用 OpenAI 企业版 GPT-4 推进其对话式 AI 客服机器人技术的发展;任天堂这家老牌游戏公司,开发了全新的 AR 游戏 Peridot,使用 Meta 定制版 Llama 2 来生成宠物角色,以实现游戏中的性格类型与世界的交互方式。

AI 在国外的发展如火如荼,但国内的企业也在积极努力地追赶。CEO 柳钢提到了国内 BAT 厂商在 AI 方面的发展,这三家公司都推出了对标 ChatGPT 的大模型,比如百度推出了文心一言、阿里巴巴推出了通义千问、腾讯推出了腾讯混元,其他国内公司和组织也纷纷推出大模型,形成了中国百模大战的局面。


火热之下的暗流不止


当然,AIGC 的发展也不全是坦途一片,火热之下也有暗流在涌动。针对 AIGC 发展过程中存在的一些问题,CEO 柳钢也表达了自己的一些观点,他认为 AIGC 的发展过程中需要处理好以下三个问题:

  1. 训练数据集不够专精:目前,公有大模型只从公开出版物、公开数据集上获取数据,难以深入解决企业问题。

  2. 数据隐私和安全风险:将企业敏感数据上传至公有云上的大模型服务可能存在数据泄露和安全风险。

  3. 训练和推理成本高、消耗高:随着模型规模的增长,其训练和推理过程中所需的能源消耗也急剧增加。

针对这些问题,CEO 柳钢提出了一个灵魂拷问:大部分企业还要去卷大模型(千亿级别)吗?大部分企业能够承受这些巨额的训练成本吗?


以轮为基,造车以行


CEO 柳钢提出了自己对于中国企业发展大模型应用的观点:以轮为基,造车以行。中国企业要想构建 AI 竞争力,就要有企业大模型应用的新范式——创新与安全并重的大模型私藏之道

CEO 柳钢以跑车为例说明:企业要以现有的大模型为基础,比如开源的大模型,来打造跑车的轮子,然后让跑车快速跑起来。这一类大模型不需要太大(几十亿参数级别),比如 Meta 开源的 Llama、Google 的 Gemma、零一万物的 Yi、智谱的 ChatGLM 都是“小规模”的参数模型。使用这一类模型,再搭配不断成熟的工具链,诸如 RAG、Agent 等,来真正构建出企业在大模型时代的新范式——企业私有数据 + 小规模参数模型 + RAG 等工具链=企业应用场景下的提质增效


极狐 GitLab DevOps AI 新范式


CEO 柳钢以极狐 GitLab 自身在 AI 方面的发展和布局进一步解释了这一新范式。这也是极狐 GitLab AI 产品的首次披露。

极狐 GitLab 作为 GitLab 在中国的发行版,专门为中国企业及程序员提供企业级的一体化 DevOps 平台,在 AI 大模型时代也在积极探索并研发相关产品。而极狐 GitLab AI DevSecOps 软件研发的新范式和上面提到的一样:先用开源“小规模”参数模型 + 不断成熟的工具链 + GitLab 这一全球成熟安全的 DevSecOps 平台构建出 AI 赋能的 DevSecOps 平台,然后再结合企业的私有数据来最终构建出企业研发效能提升的 AI 利器。这个过程中极狐 GitLab AI DevSecOps 平台提供的诸多 AI 功能将是这一范式落地的关键。

这种新范式和 GitLab 浑然一体,为企业带来的价值也是显而易见的:私有化部署、低算力成本、构建企业自有知识库等。极狐 GitLab AI DevSecOps 平台是新范式下企业大模型应用的真实案例,也是“以轮为基,造车以行”的具体阐述。

目前,极狐 GitLab AI DevSecOps 功能还在紧张的研发中,相信在春暖花开之际,这样的产品就能直接跟大家见面了。


更多关于极狐 GitLab 的最佳实践,请搜索【极狐 GitLab】

用户头像

极狐GitLab

关注

开源开放,人人贡献 2021-05-19 加入

开放式一体化DevOps平台,助力行业高速协同增长!

评论

发布
暂无评论
企业要想构建 AI 竞争力,就必须“私藏”大模型_极狐GitLab_InfoQ写作社区