写点什么

5 如何优雅的告诉老板复制 ChatGPT 几乎是“impossible”的?

  • 2023-02-14
    广东
  • 本文字数:2270 字

    阅读完需:约 7 分钟

5 如何优雅的告诉老板复制 ChatGPT几乎是“impossible”的?

成为业务架构师意味着你不再是一个 IT 战略的执行者,而是要参与到 IT 战略甚至业务战略的设计中。你不但要思考 knowhow 的问题,还要思考 knowwhat 问题。

在 ChatGPT 成为现象级产品后,不少投资人和企业家也都在关注这个产品。如果有一天你的老板问你“我们能不能也干一个 ChatGPT 出来?”,身为业务架构师的你该如何回答呢?

本文将通过商业模式画布和基于能力的规划方法(CBP)对 ChatGPT 的能力进行拆解,以帮助你回答这个问题。

理解 ChatGPT 的商业模式

首先你要理解 ChatGPT 的商业模式(2 理解商业模式和业务模式)。我们可以从商业模式画布的 9 个模块对 ChatGPT 的商业模式进行拆解。



价值主张

通过提供自然流畅的交互体验、丰富的知识库和语言模型,个性化定制的服务以及高效的自动化处理能力,为用户带来更好的智能交互体验和工作效率。

客户群体和客户关系

  • 企业客户:为各类企业提供智能客服、在线客服、语音客服、智能问答等服务;

  • 教育机构:为教育机构提供智能辅导、在线答疑等服务;

  • 个人用户:为个人用户提供智能助手、智能问答等服务;

  • 政府机构:为政府机构提供智能问答、自然语言理解等服务。


渠道通路

  • API 接口: 通过 API 的形式访问训练好的模型;

  • 商业解决方案: 为企业客户提供定制的人工智能解决方案。

合作伙伴

  • 云服务提供商:提供代码和数据部署的环境,用于训练模型和运行系统;

  • 硬件提供商:为训练提供算力,如芯片厂商英伟达;

  • 数据提供商:提供原始的数据,如 wiki 百科。

关键业务

  • 语言自动生成(AIGC):以语言模板的形式自动生成人类可以理解的语言;

  • 语言表现:提升模型在常见 NLP(自然语言处理)任务上的表现效果,以生成更加符合人类期待的反馈;

  • 模型泛化:提升模型在其他非典型 NLP 任务(例如代码编写,数学运算)上的泛化能力,以支持不同的业务场景。

核心资源:

资金:

资金方面,OpenAI 成立时被定位是一家非营利机构,2015 年由阿尔特曼、特斯拉创始人马斯克、PayPal 联合创始人蒂尔等硅谷科技大佬参与创立,承诺投资 10 亿美元。到了 2019 年,OpenAI 成立了一家营利性分支机构,吸收风险资本,其中的股东就包括微软,据称已经投入了几十亿美金,占股超过 49%。


数据资源:

  • 高质量的精标数据;

  • 训练参数:1750 亿个;

  • 训练数据:45TB

  • 世界知识: 3000 亿单词的训练语料库。


技术资源:

ChatGPT 的研发团队 OpenAI 由数据科学家、算法工程师、研究人员、工程师和标注人员组成。

  • 算法工程师:算法工程师主要负责设计、实现和优化人工智能算法和模型。

    他们需要具备深厚的数学、计算机科学和机器学习等领域的专业知识,同时还需要有良好的编程技能和实践经验,能够将理论知识转化为可行的实用算法和模型。

  • 数据科学家:国外所说的数据科学家,就是国内说的数据分析师,负责从海量数据中提取有价值的信息,帮助团队做出更准确、更有针对性的决策。

  • 研究人员:国外说的研究人员更像是我们常说的科学家,他们负责开展前沿的人工智能基础研究和探索,包括计算机科学、数学、物理学、神经科学等,参与模型的设计。

  • 工程师:就是程序员,他们精通各种编程语言和框架,如 Python、TensorFlow、PyTorch 等。工程师负责开发整个人工智能系统,包括底层平台、算法实现、封装 API 接口和开发应用。

  • 标注人员(labeler):负责在训练标注数据过程中对数据进行标注,同时确保数据质量,包括符合人类的道德规范。


硬件资源:

ChatGPT 需要大量的计算资源来训练和运行深度学习模型,包括计算服务器、存储服务器。

  • CPU:28.5 万

  • GPU:1 万个


用户资源:

目前注册用户数已经超过 1 亿。

成本结构

  • 模型训练成本:训练模型的费用,主要是算力支出,其他还包括数据存储,贷款的费用,据称训练一次的成本高达 460 万美金;

  • 员工成本:指员工薪酬,2019 年微软投资了 10 亿美金。

收入来源

  • ToC:作为工具提供订阅服务获取的收入,类似 QQ 的会员服务;

  • ToB:为企业开发定制化软件,技术授权,提供数据服务获取的收入。


理解 ChatGPT 的运作模式

如果说商业模式画布描述的是企业的静态结构,那么运作模式就是企业的动态结构,也就是主流程,在业务架构中对应的就是价值流。

ChaGPT 的运作主要包括以下几个方面:

  • 研究和开发:研究人员和工程师致力于开发新的人工智能技术,并将其应用到各种实际问题中。

  • 合作伙伴关系:与企业、学术机构和政府建立紧密的合作伙伴关系,通过合作共同开发人工智能技术,并将其应用到各种实际问题中。

  • 产品和服务:开发各种人工智能产品和服务,包括语言模型 API、聊天机器人、自动驾驶技术等等。


如何复制一个 ChatGPT?

分析到这里,基本结论已经有了:复制一个 ChatGPT 是一个很困难的事情,需要大量的资金的投入,这已经远远超过了一般企业的承受能力。上述分析还没有考虑风险系数,考虑到 ChatGPT 是一个多次迭代的产物,最终的总投入可能要在初始投入上追加好几倍。

尽管如此,我们还是要有理有据的告诉老板我们的分析过程。这里我们可以用基于能力的业务规划技术(CBP)来绘制一张 OpenAI 能力拆解图(如图所示)。



有了这样一张能力拆解图。这样我们在回答文章开头的那个问题时就不用慌了。我们可以这样回答:

老板,开发 ChatGPT 这样的认知计算系统,我们需要开发一个基于神经网络和强化学习的大模型,大模型包括上亿个参数,几十 TB 的训练数据。为此我们需要配备一个强大的研发团队,包括顶尖的数据科学家、算法工程师、程序员和人工智能研究人员,我们还需要超强的算力,包括 20 多万个 CPU 和上万个 CPU。开发这样一个模型需要多轮迭代,时间可能持续 1 年甚至数年"。


如果你的老板真有雄心做这件事情,请一定不要忘了联系本人,本人愿意无薪加入这样一个团队,前提是一定要有远大的目标和持续的投入。

End


欢迎关注涛哥微信公众号“架构领导力”和视频号“数智产品和架构”

发布于: 刚刚阅读数: 3
用户头像

数智讲师 2020-02-02 加入

前华为高级产品经理,数智产品和架构讲师,CDA特聘专家,TOGAF认证从业者,PMP认证从业者。

评论

发布
暂无评论
5 如何优雅的告诉老板复制 ChatGPT几乎是“impossible”的?_ChatGPT_涛哥 数智产品和架构_InfoQ写作社区