AI 创新下的生成式人工智能——Amazon Bedrock
什么时生成式人工智能
生成式人工智能(Generative Artificial Intelligence,简称生成式 AI)是一种基于机器学习和人工智能技术的范畴,其目标是让计算机系统能够自主地生成各种类型的数据,如文本、图像、音频等,而不仅仅是对已有数据的模仿或分类。生成式 AI 的核心能力在于创造新的内容,而不仅仅是对已知模式的重复应用。其中,生成式人工智能模型是生成式 AI 的重要组成部分,而 chatGPT 就是其中的一种代表性模型。成式 AI 的原理基于深度学习,特别是神经网络技术,它可以通过分析大量的训练数据来学习数据的分布和模式,然后利用这些学习到的模式来生成新的数据。生成式 AI 不仅可以生成高质量的文本,还可以用于图像生成、音乐创作、视频生成等各种领域。
亚马逊云的生成式 AI 产品
AWS 为大型语言模型开发人员提供了多种可能性。Amazon Bedrock 是使用 LLM 构建和扩展生成式人工智能应用程序的最简单方法。Amazon Bedrock 是一项完全托管的服务,可通过 API 提供来自 Amazon 和领先 AI 初创企业的 LLM,因此您可以从各种 LLM 中进行选择,找到最适合您的应用场景的模型。
Amazon Bedrock VS Amazon SageMake
mazon Bedrock 和 Amazon Sagemaker 是两个独立的服务。
Amazon SageMaker 是端到端的机器学习平台,它的功能包括从数据标注到数据训练、再到部署、上线以后的持续监控以及基于原始数据的再迭代等端到端的能力。在生成式 AI 大模型出现之前,它就已经非常成熟的在帮助客户解决问题了。
Amazon Bedrock 的定位是要解决以下几个核心的问题:
一是能帮客户快速找到行业领先模型,并通过 API 的方式尽可能的不用客户自己去管理底层硬件和运维即可访问。
二是,用户采用 Amazon Bedrock 做模型调优和训练的时候,和使用 Amazon SageMaker 的区别是,Amazon SageMaker 首先是面向数据科学家,需要编写代码并提供数据以及添加参数去做模型和调优。从应用形式上,在 Bedrock 里面,客户只需要提供 20 个已经标注好的数据,就可以很快展开,不需要编写太多的代码。
二者基本的区分如果画一下用户画像的话,SageMaker 是针对专业人员,Bedrock 是尽可能降低门槛,让偏向于行业的场景用户能够更好的用起来。
Bedrock 作为一个新的、生成式 AI 的生产工具,依托于现有的五个已经预设的基础模型,通过 API 直接调用,生成更多的内容。 Amazon SageMaker 是全方位的、全功能化的机器学习工具,包括数据标注到训练到推理,整个能力都是具备的,同时它也有一些预设的能力。可以根据需要选择适用的场景。也就是说,Bedrock 只是在生成式 AI 领域,Amazon SageMaker 是针对所有机器学习和人工智能领域。生成式 AI 只是 AI 的一部分,而 Amazon SageMaker 是面向整个 AI/ML 的。
另外,在部署集成方面,Amazon SageMaker 和 Bedrock 还有一些结合点。事实上 SageMaker 的某些功能可以被复用到 Bedrock 训练出来的模型上面。比如客户通过 Bedrock 自己定制了一个模型出来,新的模型在应用的时候,模型管理的流程是可以互通的。客户可以将基础模型与 Amazon SageMaker 机器学习功能集成,使用 Experiments 测试不同模型和使用 Pipelines 大规模管理基础模型等等。
Amazon Bedrock 的由来
具体来说,Bedrock 主要包含两部分,一个是亚马逊云科技自己的模型 Titan,另一个是来自初创公司 AI21 Labs、Anthropic,以及 Stability AI 的基础模型。
基础模型具体包括:
Amazon 自研 Titan
Claude(Anthropic)
Jurassic-2(AI21 Labs )
Stable Diffusion(Stability.AI)
Titan 基础模型的构建是基于亚马逊云科技在机器学习领域 20 多年的经验。Titan 包含了两个大语言模型,一个是用于生成文本的 Titan text,一个是让网络搜索个性化的 Titan Embeddings。Titan text 针对的是总结、文本生成、分类、开放式问答和信息提取等任务。文本嵌入 Titan Embeddings 模型,能够将文本输入(字词、短语、大篇幅文章)翻译成包含语义的数字表达(embeddings 嵌入编码)。
用户可以通过自己的数据定制 Titan 模型。并且,亚马逊云科技非常保护用户数据隐私,不会将用户数据拿来再训练 Titan 模型。而且,不同于其他大模型时常会出现的「幻觉」,Titan 在训练时非常关注精度,就是为了保证产生的响应一定是高质量的。除了亚马逊云科技的 Titan 模型,开发者们还可以利用其他的基础模型。其中包括 AI21 Labs 开发的 Jurassic-2 多语种大语言模型系列,能够根据自然语言指令生成文本内容,目前支持西班牙语、法语、德语、葡萄牙语、意大利语和荷兰语。还有 Anthropic 开发的大语言模型 Claude,能够执行多轮对话和文本处理任务。第三个基础模型便是 Stability AI 的文本图像生成模型 Stable Diffusion。通过这些模型,开发者只用 20 个样本,就能一键定制自己的模型。
举个例子,一位营销经理想为手提包新品开发广告创意,他只需向 Bedrock 提供标注过的最佳广告,以及新品描述,Bedrock 就能自动生成媒体推文、展示广告和产品网页。同样的,所有数据都进行了加密,任何客户数据都不会被用于训练底层模型。目前,Coda AI、Deloitte、埃森哲、Infosys 等合作伙伴已经用上了 Bedrock。
Amazon Bedrock 的申请与使用
首先在使用 Bedrock 之前要首先申请模型的访问权限,目前只在 us-east-1,us-west-2,ap-southeast-1,ap-northeast-1 中可用,需要先申请模型的访问权限,对于所有模型,默认都是没有开放的,在 model access 界面首先选择请求访问,会让您这边填写一下公司名称,网址,用途,然后请求访问权限就好,这边公司网址尽量选择海外,目前中国区域不稳定,另外这个账号的付款公司也是需要选择海外的,之后选择自己所需模型。
登录 Bedrock 控制台之后,首先到 model access 界面,点击 Edit,勾选需要的模型,如不需要的模型只要勾选留空会自动删除,然后选择保存,保存之后就可以使用所提供的模型了,比如 Claude 和 Stable Diffusion XL 等。因为使用外海时默认为英文状态下的控制台。
创建完成之后,通过控制台左侧可以看到很多的功能,我们可以选择我们的 base model,在 Amazon Bedrock 控制台中,可以按各种模型对其进行分组 属性。还可以筛选模型视图、搜索模型和查看信息关于模型提供程序。
选择模型之后,在 playground 中打开,就可以使用模型的各个功能了
Amazon Bedrock 的使用案例
比如,我们制作一个属于自己的 AI 认知聊天工具,可以通过选择 Bedrock 的一些基础模型或者是我们自己微调过的模型来进行,例如:
版权声明: 本文为 InfoQ 作者【淼.】的原创文章。
原文链接:【http://xie.infoq.cn/article/7964398075341fce4da2a4ca0】。文章转载请联系作者。
评论