Azure AI Studio 使用体验——企业级 AI 工厂
在最新的 Ignite 大会上,微软不仅发布了 Copilot Studio 这个 No Code/Low code 平台(感兴趣的小伙伴可以看我的另一篇文章《Copilot Studio使用初体验》),将使用 AI 的能力降低到最低。还发布了一个给专业团队使用的一个企业级别的 AI 工作平台——Azure AI Studio。一个可以让业务人员、研发工程师、AI 专家等不同角色的人,在一起合作完成企业级需要的 AI 功能的 AI 工厂,它支持 Web 访问,在一个位置能够协作完成功能设计、尝试、调整、部署等。今天就和大家一起探索一下它吧。
AI 的汇聚地
可以看到进入 AI Studio 之后,首先看到首页的印象就是他是一个 AI Hub,给你提供了很多选择,不只是 OpenAI 这样的大语言模型,同时还有其他业界比较好的模型可以使用。第一行还可以看到提供你创建的两类项目模版:Copilot 和多模态项目。同时还提供了代码实例(github)作为参考。
首页下方还有一个明显的区域,可以看出来微软自家的几类大的 AI 技术赫然在列。虽然现在是大语言模型很热。但是大语言模型仍然是基于文字的交互为主,虽然现在增加了多模态,不过结合已有的 AI 技术组合,能够更好的提供与大语言模型的交互方式,将具体的 AI 应用延伸到企业的更多区域。
微软在这些年有很多积累。例如:语音到文字以及文字到语音等语言处理;OCR 这类视觉方面的图像和视频识别技术;多语言处理能力等。
探索不同大语言模型的能力
在 Home 页的旁边就是 Explore 页,顾名思义,可以探索各种种类的 AI 模型,可以看到这里不仅有 OpenAI 的大语言模型,还有 Meta,Nvidia 等公司的模型,同时最右侧的 Filter 中还有不同方向的分类方便你寻找需要的模型。
此外,微软贴心的提供了基线对照功能(Benchmarks)。你可以比较不同模型之间的运行效果,选择最适合你当前业务需要的模型。
Capabilities 下面可以看到微软已有的 AI 能力,语音识别、视觉、多语言能力。提供了丰富的场景和实验场地,你可以进行尝试,并考虑如何结合到自身业务应用和创新中。
AI 安全方面,微软一直都在践行有责任的 AI。用自己的技术能力,通过内容筛选来避免 AI 生成内容违规,而这次 Studio 中的内容安全部分保持了一如既往的简单操作的同时,还提供了丰富的试用场地功能,可以直接预览过滤效果。此外,还提供了除了文字内容以外的图像筛选能力。
在尝试具体过滤器的能力的同时,还可以通过微调参数来时时调整,查看输入语句的检测效果。这一点就非常让人惊喜,之前这一功能只是一个黑盒,而现在可以时时看到设定的效果。所见即所得。你不必在部署的应用中来测试,而是在这里能够时时测试系统对非法内容的过滤或阻止能力。让用户可以更大的自主权来设定符合自身实际情况的内容过滤器设置。
例如下面就是对一条内容进行测试后,View results 给出了 blocked 的结果并给出了原因。
当然小数据量调整后,还可以测试对大数据集的效果。方便上传 CSV 文档来进行测试。
除了文字的过滤设置的验证,更厉害的可以对图片内容进行类似的操作。你可以通过上传自己的图片来验证过滤参数是否起作用。当然也可以先从单图片开始进行测试验证,之后在批量上传大数据进行验证。
在探索页面中最后一个功能是提示词案例列表,可以在这里找到一些微软总结的好用的提示词用例。你可以基于你的业务需要,选择某一个提示词作为模版进行修改。加速功能落地。
例如选择 Product Description and Content Creation。进入之后你将会看到提示词命令和相关变量。同时你可以在操场(Playground)里面进行测试和微调。
通过项目方式组织 AI 应用
Azure AI studio 是希望拥有不同经验背景的人(AI 专家,Infra 专家,业务专家,研发工程师),能够一起做出来更有创新或者说更贴近业务、解决实际问题的 AI 应用。通过项目的方式组织多 AI 模型到一起,通过所见即所得的方式从小范围迭代开始,调整模型参数,直到知道效果达到要求,之后再扩大数据量,微调参数迭代,重复这一过程。
创建一个 project 之后,第一步是选择你想要用的模型。这里除了 Open AI 之外还有很多选择。例如:Meta,Hugging face,Nvidia 等。
有一些小区别的是,如果是 Azure OpenAI 的模型,你的 Azure 资源已经分配了,那么只需要选择对应的 Azure 资源组就可以了。
如果是其他模型,那么需要单独申请新的资源。
建立了 AI 模型之后,你就能在操场(Playground)里面对你选择的模型进行操作了。可以通过选择你希望模型进行的操作,例如 Chat 还是 Completion。
当然还可以使用文生图技术,例如 DALL-E
操场是一个可以快速验证和调整当前模型运行情况的场所,如果你不知道如何开始你的提示词,还提供了提示词样板可以参考。
提示流是另一个微软在 AI 模型协作方面主推的一个功能,它是对 LangChain 和语义内核(Semantic Kernel)的补充 - 它可以与他们任何一个一起使用。 提示流支持生成式 AI 解决方案的 LLMOps,提供评估、连接管理和流逻辑,以帮助调试应用程序、管理部署和进行大规模监视。
可以看到微软提供了一些 flow 的模版作为参考。这部分更多面向 AI 工程师的工作场景,类似他们平时工作的 Notebook。
同时可以对当前模型进行评估。左侧导航和右上角都有 Evaluate 功能。如下动图,可以看到它还可以进行手动评估标注。
最后,每个项目提供了私有数据的存储和使用。可以看到你可以对私有数据进行存储和索引,并在与大模型的结合中通过 RAG(RetrievalAugmentedGeneration)技术进行响应内容优化。
总结
微软一贯的做法是用最简单的操作来整合复杂的技术。大语言模型的热潮很多企业和业务人员都希望能够应用,并用 AI 来赋能业务。Azure AI Studio 正是抓住了这一需求,成为了企业级 AI 业务工厂,为行业用户快速落地业务与 AI 结合的产品提供助力。从这一点来看未来,AI 应用的工具使用会越来越简单,而核心价值仍然是领域知识。通用人工智能只有和具体业务领域结合,才能解决我们生活中的各种问题,提高我们的生活质量。
版权声明: 本文为 InfoQ 作者【Bruce Talk】的原创文章。
原文链接:【http://xie.infoq.cn/article/fee0204b4625aac8ab7977433】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论