5 如何优雅的告诉老板复制 ChatGPT 几乎是“impossible”的?
成为业务架构师意味着你不再是一个 IT 战略的执行者,而是要参与到 IT 战略甚至业务战略的设计中。你不但要思考 knowhow 的问题,还要思考 knowwhat 问题。
在 ChatGPT 成为现象级产品后,不少投资人和企业家也都在关注这个产品。如果有一天你的老板问你“我们能不能也干一个 ChatGPT 出来?”,身为业务架构师的你该如何回答呢?
本文将通过商业模式画布和基于能力的规划方法(CBP)对 ChatGPT 的能力进行拆解,以帮助你回答这个问题。
理解 ChatGPT 的商业模式
首先你要理解 ChatGPT 的商业模式(2 理解商业模式和业务模式)。我们可以从商业模式画布的 9 个模块对 ChatGPT 的商业模式进行拆解。
价值主张
通过提供自然流畅的交互体验、丰富的知识库和语言模型,个性化定制的服务以及高效的自动化处理能力,为用户带来更好的智能交互体验和工作效率。
客户群体和客户关系
企业客户:为各类企业提供智能客服、在线客服、语音客服、智能问答等服务;
教育机构:为教育机构提供智能辅导、在线答疑等服务;
个人用户:为个人用户提供智能助手、智能问答等服务;
政府机构:为政府机构提供智能问答、自然语言理解等服务。
渠道通路
API 接口: 通过 API 的形式访问训练好的模型;
商业解决方案: 为企业客户提供定制的人工智能解决方案。
合作伙伴
云服务提供商:提供代码和数据部署的环境,用于训练模型和运行系统;
硬件提供商:为训练提供算力,如芯片厂商英伟达;
数据提供商:提供原始的数据,如 wiki 百科。
关键业务
语言自动生成(AIGC):以语言模板的形式自动生成人类可以理解的语言;
语言表现:提升模型在常见 NLP(自然语言处理)任务上的表现效果,以生成更加符合人类期待的反馈;
模型泛化:提升模型在其他非典型 NLP 任务(例如代码编写,数学运算)上的泛化能力,以支持不同的业务场景。
核心资源:
资金:
资金方面,OpenAI 成立时被定位是一家非营利机构,2015 年由阿尔特曼、特斯拉创始人马斯克、PayPal 联合创始人蒂尔等硅谷科技大佬参与创立,承诺投资 10 亿美元。到了 2019 年,OpenAI 成立了一家营利性分支机构,吸收风险资本,其中的股东就包括微软,据称已经投入了几十亿美金,占股超过 49%。
数据资源:
高质量的精标数据;
训练参数:1750 亿个;
训练数据:45TB
世界知识: 3000 亿单词的训练语料库。
技术资源:
ChatGPT 的研发团队 OpenAI 由数据科学家、算法工程师、研究人员、工程师和标注人员组成。
算法工程师:算法工程师主要负责设计、实现和优化人工智能算法和模型。
他们需要具备深厚的数学、计算机科学和机器学习等领域的专业知识,同时还需要有良好的编程技能和实践经验,能够将理论知识转化为可行的实用算法和模型。
数据科学家:国外所说的数据科学家,就是国内说的数据分析师,负责从海量数据中提取有价值的信息,帮助团队做出更准确、更有针对性的决策。
研究人员:国外说的研究人员更像是我们常说的科学家,他们负责开展前沿的人工智能基础研究和探索,包括计算机科学、数学、物理学、神经科学等,参与模型的设计。
工程师:就是程序员,他们精通各种编程语言和框架,如 Python、TensorFlow、PyTorch 等。工程师负责开发整个人工智能系统,包括底层平台、算法实现、封装 API 接口和开发应用。
标注人员(labeler):负责在训练标注数据过程中对数据进行标注,同时确保数据质量,包括符合人类的道德规范。
硬件资源:
ChatGPT 需要大量的计算资源来训练和运行深度学习模型,包括计算服务器、存储服务器。
CPU:28.5 万
GPU:1 万个
用户资源:
目前注册用户数已经超过 1 亿。
成本结构
模型训练成本:训练模型的费用,主要是算力支出,其他还包括数据存储,贷款的费用,据称训练一次的成本高达 460 万美金;
员工成本:指员工薪酬,2019 年微软投资了 10 亿美金。
收入来源
ToC:作为工具提供订阅服务获取的收入,类似 QQ 的会员服务;
ToB:为企业开发定制化软件,技术授权,提供数据服务获取的收入。
理解 ChatGPT 的运作模式
如果说商业模式画布描述的是企业的静态结构,那么运作模式就是企业的动态结构,也就是主流程,在业务架构中对应的就是价值流。
ChaGPT 的运作主要包括以下几个方面:
研究和开发:研究人员和工程师致力于开发新的人工智能技术,并将其应用到各种实际问题中。
合作伙伴关系:与企业、学术机构和政府建立紧密的合作伙伴关系,通过合作共同开发人工智能技术,并将其应用到各种实际问题中。
产品和服务:开发各种人工智能产品和服务,包括语言模型 API、聊天机器人、自动驾驶技术等等。
如何复制一个 ChatGPT?
分析到这里,基本结论已经有了:复制一个 ChatGPT 是一个很困难的事情,需要大量的资金的投入,这已经远远超过了一般企业的承受能力。上述分析还没有考虑风险系数,考虑到 ChatGPT 是一个多次迭代的产物,最终的总投入可能要在初始投入上追加好几倍。
尽管如此,我们还是要有理有据的告诉老板我们的分析过程。这里我们可以用基于能力的业务规划技术(CBP)来绘制一张 OpenAI 能力拆解图(如图所示)。
有了这样一张能力拆解图。这样我们在回答文章开头的那个问题时就不用慌了。我们可以这样回答:
“老板,开发 ChatGPT 这样的认知计算系统,我们需要开发一个基于神经网络和强化学习的大模型,大模型包括上亿个参数,几十 TB 的训练数据。为此我们需要配备一个强大的研发团队,包括顶尖的数据科学家、算法工程师、程序员和人工智能研究人员,我们还需要超强的算力,包括 20 多万个 CPU 和上万个 CPU。开发这样一个模型需要多轮迭代,时间可能持续 1 年甚至数年"。
如果你的老板真有雄心做这件事情,请一定不要忘了联系本人,本人愿意无薪加入这样一个团队,前提是一定要有远大的目标和持续的投入。
End
欢迎关注涛哥微信公众号“架构领导力”和视频号“数智产品和架构”
版权声明: 本文为 InfoQ 作者【涛哥 数智产品和架构】的原创文章。
原文链接:【http://xie.infoq.cn/article/d83f03867992b36d0547e3630】。文章转载请联系作者。
评论