写点什么

【论文解读】模型即服务 - 介绍 MaaS 中所涉及的关键技术

  • 2023-12-28
    上海
  • 本文字数:12825 字

    阅读完需:约 42 分钟

【论文解读】模型即服务-介绍MaaS中所涉及的关键技术

一、简要介绍


由于预训练模型中参数和数据的数量超过一定水平,基础模型(如大型语言模型)可以显著提高下游任务性能,并出现一些新颖的特殊能力(如深度学习、复杂推理和人类对齐)。基础模型是生成式人工智能(GenAI)的一种形式,而模型即服务(MaaS)已经成为一个开创性的范式,彻底改变了 GenAI 模型的部署和利用。MaaS 代表了我们如何使用人工智能技术的范式转变,并为开发人员和用户提供了一个可扩展和可访问的解决方案,以利用预先训练过的人工智能模型,而不需要广泛的基础设施或模型训练方面的专业知识。本文对 MaaS 在各个行业的意义及其意义进行了全面的概述。论文简要回顾了基于云计算的“x 即服务”的开发历史,并介绍了 MaaS 中所涉及的关键技术。GenAI 模型的发展将变得更加民主化和繁荣。论文还回顾了 MaaS 的应用研究。最后,作者强调了这一前景领域的几个挑战和未来问题。MaaS 是针对不同的基于人工智能的模型的一种新的部署和服务范式。论文希望本综述能对 MaaS 领域的研究提供启示。


二、研究背景

我们目前生活在一个在大数据、人工智能(AI)和 Web 3.0 中快速发展的时代,各个行业的组织正在越来越多地利用机器学习(ML)模型的力量来获得洞察力、自动化过程,并做出数据驱动的决策。然而,开发、训练和部署 ML 模型是具有挑战性和资源密集型的。特别是在数字时代,生成式人工智能,如大语言模型(LLM),近年来不仅成为社交媒体上公众熟悉的词,也成为学术领域的热点。生成型人工智能(GenAI)指的是机器学习模型生成与训练数据相似的新数据的能力。这与传统的人工智能方法相反,传统的方法旨在识别不同类别或数据类别之间的差异。GenAI 模型经常被用于图像生成、文本生成、音乐合成等任务。LLM 是生成式人工智能中的一个高级模型,旨在模拟人类的语言能力和智能(即生成能力)。开发人员和工程师使用大量的文本数据来训练 LLM,然后利用深度学习算法来理解尽可能多的语言。事实上,训练过程是 LLM 的核心。它涉及到在大量的数据上训练模型,以学习语言的统计模式和语义关系。在训练过程中,LLM 对下一个单词或句子进行预测,以优化其参数,提高其预测能力。通过迭代训练,LLM 逐步提高了其语言生成和理解质量。得益于生成人类语言的文本能力,LLM 已经成为各个领域的重要服务。它为人们提供了许多有用的意想不到的功能和优秀的应用程序,如数据分析、自然语言处理(NLP)、智能会话系统、机器翻译、信息检索和文本到多模态。

由于基础模型仍处于探索阶段,在学术界和工业界还没有明确的定义和共识。这就是模型即服务(MaaS)发挥作用的地方。MaaS 是一个基于云计算的服务框架,它为开发人员和企业提供人工智能和 ML 模型以及相关的基础设施作为服务。它提供了一种方便和成本效益高的方法来访问和使用大模型,而不需要广泛的知识或基础设施。MaaS 允许用户通过简单的接口、应用程序编程接口(api)或软件开发工具包(SDKs)来利用预先训练好的 ML 模型和算法。MaaS 允许用户通过调用 API 来访问大模型的功能,而不需要训练和维护复杂的模型本身。

简单地说,MaaS 是一种新的商业模式。作为人工智能时代的基础设施,MaaS 为下游应用程序提供了安全、高效和经济有效的模型使用和开发支持。纵观 MaaS 的整个行业结构,其核心思想遵循了“模型-单点工具-应用场景”的路径。用户可以直接云中调用、开发和部署模型,而不需要投资构建和维护自己模型所需的基础设施、硬件和专门知识。大模型作为 MaaS 的关键组成部分,是“高计算能力和强算法”相结合的产物,将成为未来人工智能发展的发展趋势。大模型正在迅速发展,将人工智能从“工件车间”转变为“工厂模型”,实现更大的多功能性和智能,并使人工智能能够更广泛地授权各个行业的应用。MaaS 可以跨多个域找到广泛应用程序。在智能会话系统中,MaaS 可以用于构建聊天机器人、语音助手和其他交互式系统,以便与用户进行流畅和自然的对话。在信息检索中,MaaS 可以提供智能搜索和推荐功能,帮助用户快速找到所需的信息。然而,MaaS 的发展也面临着一些挑战。首先,要考虑性能和稳定性。大模型需要大量的训练数据和计算资源来实现最佳性能,而且它们需要解决诸如长文本生成和逻辑推理等任务中的局限性。其次,由于 MaaS 可能涉及用户的个人信息和敏感数据,因此存在隐私和安全问题,需要在数据传输和隐私保护方面采取适当的安全措施。

在人工智能和 ML 的发展中,MaaS 正在成为一个开创性的范例,彻底改变了人工智能模型的部署和利用。MaaS 为组织和开发人员提供了一个可扩展和可访问的解决方案,以利用预先训练过的人工智能模型,而不需要广泛的基础设施或模型训练方面的专业知识。然而,在学术上还没有提出对 MaaS 的全面概述。本文旨在通过突出 MaaS 模型的关键组件、它们的底层技术、MaaS 的优势以及与以前基于云计算的服务模型的区别来介绍 MaaS。

贡献:为了填补这一研究空白,本文试图提供一个关于 MaaS 的全面的文献调查,其贡献如下:

这是论文第一次回顾了 MaaS 的交互和相关技术的特点,作者也回顾了云计算服务的历史。

论文分析了传统技术堆栈和基于 GenAI 模型的技术堆栈之间的差异,得出后一种技术堆栈呈现了许多新的功能和特征

论文还强调了 MaaS 中一些有前途的应用领域,这些领域目前正在开发或将在不久的将来流行。

论文更详细地分析了 MaaS 所遇到的挑战和问题,包括使用约束、模型的可解释性、技术伦理和道德。


三、XAAS 的历史


在回顾 Web 2.0 的开发历史时,“X 即服务”模型范式(XaaS)是第二波的典型模式。实际上,由于开发环境建设的复杂和资源密集型的缺点,XaaS 的核心目标是为用户提供基础设施,然后让他们专注于解决方案设计。

软件即服务(SaaS),最初出现在 20 世纪 90 年代末到 21 世纪初之间。SaaS 提供基于互联网的应用程序,然后允许用户根据在线订阅的方法使用这些应用程序。这种新型的互联网服务让用户不再需要安装本地软件,如百度云盘、dropbox 和 Gmail。一般来说,SaaS 应用程序能够容纳大量的用户,因为它们具有良好的可伸缩性。SaaS 提供商处理几乎所有的维护任务,包括更新、bug 修复、安全和数据备份,而用户只允许进行人机交互。然而,由于参与互联网世界的用户数量不断增加,针对不同用户的个性化定制(即不同领域的软件产品越来越多)的兴起导致了需求的激增,从而形成了一个紧迫的问题。

平台即服务(PaaS)出现在 SaaS 之后(大约在 2000 年代中期)。它为程序开发人员提供了一个稳定的云计算平台,用于构建、测试和部署应用程序。在 PaaS 解决方案中,提供商在其专用的基础设施上托管硬件和软件,并将该平台作为一个一体化的解决方案、软件堆栈或可通过互联网访问的服务提供给用户。开发人员可以主要专注于编码,减轻他们与维护和管理传统上与开发过程相关的基础基础设施或平台相关的问题。这为继续开发和创新铺平了道路,同时减少了广泛的基础设施设置和编码工作的必要性。谷歌的应用程序 Engine application platform 和微软的 Azure 应用程序服务是 PaaS 的两个经典例子。PaaS 提供商负责维护底层的基础设施,而用户则只关注应用程序的开发和管理。然而,由于操作成本,PaaS 可能会限制应用程序和工作负载所需的不同资源(例如,计算资源、存储资源和网络资源)。在某些情况下,特定的应用程序需求可能与 PaaS 环境不兼容,这可能会导致在部署和运行应用程序时出现问题。

为了为用户提供更大的灵活性、控制和适应性,以满足各种应用程序需求和业务场景,云计算服务的最新模型,即基础设施即服务(IaaS),在 2010 年左右出现。IaaS 通过 web 服务提供虚拟化的计算资源,它允许用户按需租用服务器、网络和存储等基础设施服务。通常,用户可以通过应用程序编程接口(api)来利用该基础设施。用户获得对基础设施(如虚拟服务器、存储和网络)的配置更大的更大控制,并接管 IaaS 模型中以前由 PaaS 提供商管理和维护的职责。IaaS 提供商只关注管理硬件模块和处理硬件问题。工程师们已经开发了许多成熟的 IaaS 平台(例如, Google Compute Engine、DigitalOcean 和 Amazon Elastic Compute Cloud)。这些平台已经深入地融入到我们的日常生活中。然而,SaaS 为用户和各种非技术部门提供了更广泛的应用程序,而 PaaS 和 IaaS 则主要面向开发团队。图 1 描述了 XaaS 的变化路径。


四、其他 XAAS 之间的关系

与之前的 XaaS 模型类似,在即将到来的 Web 3.0 时代,MaaS 是人工智能领域的一种新的服务模式,它涉及到在互联网上提供对预先训练过的机器学习模型作为一种服务的访问。它涉及到托管、管理和允许开发人员访问已经通过 api 训练过的模型。这允许开发者在自己的系统和应用程序中添加人工智能功能。MaaS 背后的目标是提供一个平台,让开发人员可以访问预先训练过的机器学习模型,这些模型已经在大型数据集上进行了训练,并针对特定的任务进行了优化。因此,MaaS 抽象化了模型训练和部署的复杂性,并使开发人员更容易利用人工智能技术。此外,MaaS 使开发人员能够专注于他们的特定用例和应用程序逻辑,而不需要深入研究模型训练、超参数调优和基础设施管理的复杂性。通过使用 MaaS,开发人员可以通过利用现有的模型来节省时间和资源,而不是从零开始构建和训练模型。此外,为了创建复杂的模型和人工智能能力,它将人工智能面向更广泛的用户基础,包括之前没有人工智能知识的开发者。

在 Web 2.0 时代,SaaS、PaaS 和 IaaS 都是基于云计算的解决方案。他们通过互联网提供服务,以减少对本地部署的需求。就成本考虑而言,这种基于订阅的灵活支付模式对客户和供应商都非常有利。 1)客户不再考虑如何投资和维护基本的基础设施,如软件和硬件。2)供应商采购的设备可以在各个客户之间有效地重用,从而大大节省了采购费用。3)这些模型的高可扩展性使客户能够根据他们的具体需求来调整资源的使用和支付义务。然而,与传统的云服务模式相比,MaaS 具有一些特点和优势。

MaaS 在服务模型中进一步考虑了对 AI 和 ML 模型的训练、部署和调用。相比之下,IaaS 提供基本的计算资源;PaaS 提供应用程序开发和部署平台;SaaS 提供完整的应用程序软件。特别是,MaaS 抽象了更高层次的服务,使用户能够直接利用 AI 和 ML 模型的功能。

MaaS 旨在为用户提供专门的服务和定制的功能,以完成不同的任务(如对话、视频制作和艺术图像创作)。它应该是一个在开发或应用领域的用户更专业的工具。因此,MaaS 的核心组件是训练、部署和调用各种人工智能模型。然而,传统的云服务模型更侧重于提供基础设施、平台或应用程序软件,并提供较低级别的模型选择和定制。

MaaS 提供了许多简化的工具,使用户更容易利用和部署 AI 模型。相比之下,传统的云服务模式往往需要用户拥有更多的技术知识和经验来充分利用相关服务,这也限制了人工智能技术的广泛采用。这些可能是非专家或大多数开发人员面临的障碍。MaaS 通过提供用户友好的操作界面和较低的进入壁垒,使人工智能的使用更加自主。

综上所述,MaaS 是指将机器学习模型作为一种基于云的服务来交付。MaaS 作为一种专门针对机器学习模型的服务模型,在抽象级别、服务对象、模型选择和定制以及可用性方面不同于传统的云服务模型(即 IaaS、PaaS、和 SaaS)。MaaS 的优点是,它为机器学习模型定制了更高级的服务和抽象。用户可以使用和部署、方便、高效地使用机器学习模型。


五、MAAS 相关技术

在整个 Web 2.0 过程中,大多数应用程序开发技术堆栈都可以概括为一个三层体系结构(图 2(a))。桌面和移动应用程序都取决于它们的执行环境(即操作系统)。作为一个流行的社交网络和通信平台,安卓系统上的微信应用和 iOS 系统之间存在一些明显的区别。例如,在安卓系统上,迷你程序可以被设置为一个浮动窗口。用户可以在微信上向右滑动快速打开它们。此外,用户还可以在主屏幕上添加迷你程序,以避免重复操作。但是,iOS 系统不支持浮动窗口功能。如果用户不小心关闭了一个迷你程序,他们必须再次打开微信,然后使用关闭的迷你程序。出现上述情况的原因是,这两个操作系统本身之间的差异导致了不同的开发环境和设计原则。从本质上说,这是因为安卓和 iOS 系统使用的芯片存在显著差异。


但是,这些应用程序将在 MaaS 平台中进行统一。新的应用程序开发技术堆栈是一个四层架构(图 2(b))。与传统的技术堆栈相比,训练框架和模型层取代了原有的操作系统层。几乎所有的大模型都是采用类似的训练框架(例如 DeepSpeed, MindSpore , Megatron,Fairscale, PaddlePaddle)进行训练,这降低了操作系统的效果。此外,基于人工智能的应用程序是基于对大模型的理解、生成和存储能力而开发的一种新型产品。事实上,MaaS 已经逐渐成为现代技术景观的一个组成部分。在本节中,我们将探讨 MaaS 的相关技术。MaaS 的实现涉及到几种技术和组件。以下是一些重要的因素:

云计算: MaaS 依赖于云计算基础设施来托管和部署机器学习模型。云服务允许访问可扩展和可靠的平台,有效地满足向众多用户提供模型的计算需求。对云计算基础设施的依赖标志着机器学习的利用方式的重大转变。传统上,为机器学习任务设置和维护必要的计算资源是一个繁琐而昂贵的过程。

模型训练和优化: MaaS 提供商在大数据集上训练机器学习模型,以实现较高的准确性和性能。这涉及到使用诸如深度学习、迁移学习和集成学习等技术来开发鲁棒模型。此外,经过训练的模型还进行了优化,以便在 MaaS 平台上进行部署。这包括模型压缩、量化和剪枝等技术,这些技术可以在不牺牲性能的情况下减少模型大小并提高其效率。

API 和开发工具: API 和开发工具是确保 MaaS 服务易于使用的关键技术。MaaS 平台为开发人员提供了一组 api,以简化模型的使用和集成。这些 api 提供了提出请求和从模型中接收预测或见解的端点。相应地,开发工具,如软件开发工具包(SDKs)、命令行接口(CLIs)、RESTfulapi 和 GraphQL,通常在 MaaS 实现中使用。

监视和分析: MaaS 提供商实现监视和分析功能,以跟踪模型性能、使用记录和用户反馈。这有助于优化模型、识别潜在的问题,并持续提高服务质量。分析工具允许 MaaS 提供商在运行模型时识别异常决策、用户首选项和上下文。所收集到的信息对于调整模型以满足用户的特定需求是无价的。例如,如果分析结果显示,用户在高峰时段主要使用聊天机器人进行客户支持查询,那么提供商可以分配额外的资源,以确保在这些时段提供无缝服务。

可伸缩性和负载平衡:MaaS 平台中的可伸缩性的本质就在于灵活性和适应性。一般来说,这些平台必须处理来自用户的大量并发请求。当对服务的需求激增时,一个可扩展的系统可以及时地管理其资源,以满足增加的负载。这意味着该系统可以快速分配更多的计算能力、存储能力和带宽,以确保用户体验保持平稳和不间断。可伸缩性和负载平衡技术确保了系统能够处理日益增长的需求,并在多个服务器或实例上有效地分配工作负载。

安全和隐私: MaaS 平台面临着降低敏感数据和模型可访问性管理所固有的安全和隐私风险的迫切任务。为了增强这些平台的完整性,部署了一个全面的安全措施库,包括数据加密、访问控制机制和使用安全通信协议。因此,这些策略共同具有保护用户数据和保护机密信息的神圣性的双重目的。


六、MAAS 的优点

由于它的优点,MaaS 对于正在制作和使用 GenAI 模型的开发人员和企业非常有用。MaaS 加快了整个模型开发和部署生命周期,有效地减少了技术障碍,并提供了一系列好处。这些好处包括鲁棒的性能、灵活的支付选项和持续的优化。MaaS 的一些显著优势如下:

降低技术壁垒: MaaS 有效地降低了与 GenAI 模型使用相关的技术壁垒。开发人员不需要成为机器学习技术的专家,也不需要掌握复杂算法来有效地使用高级模型来满足开发和应用需求。他们可以更注重创造性和实用的产品。此外,这种用户友好的方法也将鼓励不同行业的创新。

简化模型开发: MaaS 提供预先训练过的人工智能模型作为可访问的服务。尽管训练前模式允许开发人员利用人工智能能力,而不需要广泛的模型构建和训练,但传统的人工智能模型开发仍然是耗时和资源密集型的工作。无需构建和训练模型步骤,MaaS 就允许开发人员将开源模型无缝地集成到他们的工作流中。这不仅优化了时间和资源分配,而且显著减少了初始学习曲线和实现障碍。

高性能和可伸缩性:由于云计算服务是 MaaS 的基础设施,高性能计算资源的强大能力满足大量数据和复杂的计算需求。可伸缩性是 MaaS 的一个重要特征,它确保 MaaS 自动调整资源分配,以响应不断变化的计算需求。特别是,适应性在工作负载变化显著的场景中至关重要,例如在视频生产应用程序中。例如,用于实时图像识别的模型可能会在使用高峰时间经历显著的需求峰值。云基础设施支持 MaaS 无缝地分配额外的计算资源来处理这些峰值,从而确保快速和一致的响应时间。

共享知识和协作:由于 MaaS 是建立在丰富的数据和专家经验基础上,模型通常代表广泛的知识和泛化能力。开发人员可以受益于这个特性,而不考虑独立地收集或处理大量数据。支撑 MaaS 模型的集体知识和经验是一种超越个人能力范围的有价值的资源。开发人员可以利用这些共享的知识来尽快完成他们的项目。此外,MaaS 是一个共享模型和交换经验的有利平台,这将促进开发人员之间的协作和知识共享。这加速了创新和解决问题,并推动了整个机器学习社区的发展

智能决策支持: MaaS 可以通过利用机器学习模型来预测未来的业务趋势和财务状况,为企业提供智能决策支持,帮助企业做出更明智的决策。MaaS 将分析结果转化为用户友好的报告和可视化,并提供定制的业务解决方案。企业可以根据不同的特定业务需求和数据特点,选择不同的机器学习模型和数据处理算法,从而实现更智能和个性化的业务流程。

灵活的支付模式:事实上,MaaS 通常使用灵活的支付模式。基于订阅的模型只允许用户为 MaaS 服务的实际使用情况付费。这种支付模式是一种具有成本效益的解决方案,有利于中小企业和个人使用。此外,它还可以将客户转化为用户,降低了吸引新客户的成本,提高客户的忠诚度。这在吸引新客户成本昂贵且困难的竞争市场中尤其有价值。此外,订阅模式不仅确保了企业稳定的收入流,而且还使提供商能够向用户提供一致的更新、改进和支持服务。

广泛的应用范围:GenAI 模型展示了跨不同领域的兼容性(例如,自然语言处理、图像创建、推荐系统和视频制作)。大型语言模型,通过对不同数据源的广泛训练,显示了在多模态下游任务中表现良好的能力。GenAI 模型的多功能性优于特定行业的约束条件。开发人员不再需要为不同的情况找到相应的微调模型。相反,它们可以从一个适应各种应用程序场景的独特需求的统一模型服务中提取数据。


七、MAAS 应用

MaaS 在不同领域有广泛的应用,包括但不限于以下领域。首先,我们在图 3 中概述了 MaaS 中的应用程序。


A. 医疗保健中的 MaaS

MaaS 将对未来的医疗保健部门产生多方面的影响。它能够合并丰富的各种医疗保健数据来源,包括电子健康记录(EHR)、医学文献、基因组学数据和实时患者监测数据,是其变革潜力的基石。MaaS 的分析能力超越了数据集成,使其能够揭示复杂的模式、相关性和见解,以作为治疗建议和预后评估的基础。临床指南和循证医学原则的整合进一步决定了 MaaS 作为一个关键的医疗保健盟友。它的分析引擎,由广泛的医学文献和临床试验数据推动,为特定的医疗条件和患者情况提供最新和有效的治疗方式,从而为医疗保健专业人员提供了宝贵的决策资源。MaaS 的功能扩展到患者分析和风险评估,它利用机器学习算法来仔细检查一系列患者属性。通过将这些数据与广泛的患者队列和研究结果并列,MaaS 制定了个性化的风险评估,以显著的精度预测疾病进展、治疗反应和潜在的不良事件。作为一种决策支持系统,MaaS 为医生提供实时的、循证的指导。通过合并患者特定数据和临床知识,MaaS 优化治疗计划,根据患者个体特点提出量身定制的药物选择、剂量调整或替代疗法。此外,预测建模是 MaaS 的另一个优势,一个预测治疗结果和预后评估的有效工具。通过深入研究历史患者数据和治疗反应,MaaS 确定了预测因素,并建立了估计治疗成功、疾病复发或患者生存的可能性的模型。MaaS 不断吸收新的患者数据、治疗结果和临床研究结果,并更新其算法和模型,以适应新出现的数据。最后,研究结果是一个不断完善其个性化治疗推荐任务和预后评估指标的系统。这确保了医疗保健系统仍然适合用于服务。

B. 学术中的 MaaS

MaaS 是一种变革力量,通过一系列深远的影响深刻影响研究领域和社区发展。最具影响力的是学术研究的加速。MaaS 使研究人员能够访问预先训练过的模型、数据集和基础设施,从而简化了研究和开发过程。这种加速对于允许研究人员将他们的能量直接投入到他们的研究目标中至关重要,而不需要在模型创建和训练上投入大量的时间和资源。因此,研究周期变得更短,促进了无数研究领域的快速进步和突破。MaaS 在研究中也承载着民主化的火炬。通过提供现成的模型、工具和资源,它为研究人员消除了障碍,并提供了需要有限的资源或专业知识的最先进的模型、技术和工具。这种包容性为广泛的研究人员从他们的研究领域的进展中获益打开了大门。促进协作和知识共享是 MaaS 平台的另一个关键作用。这些平台是研究人员交换模型、数据集和发现的纽带,促进了透明度,并培养了一种合作文化。这种知识和专业知识的相互交流促进了思想的交叉传播,加快了研究速度,并促进了解决问题的跨学科方法。MaaS 平台在加强研究结果的可重复性方面也发挥了重要作用。通过提供对预训练的模型和标准化数据集的访问,我们可以根据已建立的标准严格地验证和基准测试结果。这种透明度提高了研究结果的可信度,并允许在各种方法之间进行公平的比较,从而鼓励健康的竞争和推动创新。也许 MaaS 最重要的影响之一是研究成果的快速部署。MaaS 使我们能够无缝地将他们的模型和解决方案转换到现实世界的应用程序中。这种能力是将研究成果转化为实际用例的一个渠道,为行业、组织和整个社会提供了利益。我们可以有效地利用 MaaS 平台来弥补学术界和产业界之间的差距。

C. 区块链中的 MaaS

MaaS 和区块链技术的交叉带来了一系列变革性的影响,深刻地影响了区块链生态系统中的数据隐私、模型共享、训练和分散的模型推理。MaaS 和区块链的融合增强了数据的隐私性和安全性。区块链的固有属性,包括去中心化、不变性和可追溯性,在保护数据完整性和隐私方面发挥着关键作用。通过在分布式节点上执行模型训练和推理,使敏感数据免受传输到集中式服务器的风险。这种集成不仅保护了用户的数据隐私,而且提高了总体系统的安全性。此外,区块链上下文下的 MaaS 可以实现模型共享和市场化。区块链分类帐记录了模型的所有权和使用权,从而为模型提供者建立了一个框架,以便将其模型授予或授权给其他用户。这种巧妙的市场化机制使模型开发人员能够增强他们的创作,同时为用户提供更广泛的选择和更大的模型选择灵活性。在模型训练方面,区块链的可验证性属性通过验证模型训练过程的可信度而得到应用。这是通过在区块链上记录整个训练过程及其结果来实现的,以确保透明度、可审核性和防止篡改。这一特性在模型训练过程的可信度和可追溯性至关重要的应用程序中至关重要,例如在金融和医疗保健领域。区块链的分散性质被进一步用于分散的模型推理。模型部署在区块链内的多个节点上,可以实现并行推理和结果的共识验证。这种分散的模型推理方法提高了模型推理的效率和可靠性。它在需要高可靠性和抗篡改弹性的应用程序中尤其重要,如数据加密、智能合同执行、身份验证和认证。

D. Web 3.0 中的 MaaS

Web 3.0 将是互联网的下一个发展方向,其特征是去中心化、用户控制、智能和数据隐私。智能是 Web 3.0 和 MaaS 的重要特性之一。因此,MaaS 可以作为一种符合 Web 3.0 理想的智能解决方案。此外,Web 3.0 还强调了用户控制中的个人数据自主化。由于个人的数据是一个摇钱树,在 MaaS 的背景下,用户将他们的数据传输到云计算平台进行处理,同时保持对其数据的利用和传播的完全控制。有选择地共享数据以交换模型预测的灵活性保护了个人隐私,为用户提供了与 Web 3.0 的原则相协调地管理和利用其数据的自主权。数据传输和存储是向数据发送云进行模型推理过程中固有的。为了维护数据的隐私性和安全性,MaaS 结合了诸如加密、身份验证和访问控制等措施(如上一小节所示)。根据 Web 3.0 的数据未经授权的隐私和安全目标,保护用户数据不受未经授权的访问和滥用。Web 3.0 还包含了智能合约技术,它确保了去中心化应用程序中的自动化业务逻辑。通过将智能合同与 MaaS 结合起来,可以实现更高层次的自动化决策和智能业务逻辑。Web 3.0 鼓励数据互操作性和跨平台交互。MaaS 通过提供标准化的接口和协议来补充这一目标,使不同的平台和应用程序能够毫不费力地调用机器学习模型。


八、挑战和问题

模型即服务(MaaS)作为一种针对不同的基于人工智能的模型的新的部署和服务范式,在未来的开发中将面临一些挑战和潜在的问题。在本节中,论文将强调与 MaaS 相关的关键挑战和问题。详情描述如下。

首先,MaaS 遇到的一个重大挑战是确保安全和隐私。在 MaaS 的体系结构中,模型和丰富的数据通常需要在不同的环境中进行传输和处理。这可能会导致敏感数据的暴露和机密模型的挪用。因此,确保模型和数据的安全性和隐私性成为 MaaS 需要解决的关键问题之一。未来的发展方向可能包括加密和安全计算技术的应用,以及建立更严格的访问控制和权限管理机制。

其次,MaaS 还在努力应对与模型管理和版本控制相关的挑战。随着模型经过不断的迭代和更新,对模型版本的有效管理和控制已经成为一个关键的问题。此外,模型的部署和服务方面必须考虑多个模型共存的场景。需要解决诸如不同模型版本的模型选择、组合、管理和调度等问题。未来的发展方向可能包括创建全面的模型存储库和版本控制系统,以及自动的模型选择和组合算法。

此外,MaaS 还需要解决与计算能力和资源分配相关的挑战。随着机器学习模型的复杂性和规模的增长,对计算资源的需求也在增加。在 MaaS 体系结构中,实现弹性可伸缩性和负载平衡,以满足模型服务的不同规模和需求,成为一个重大挑战。未来的发展方向可能包括利用容器化和集群管理技术来实现模型的灵活部署和调度,以及优化模型的计算和推理过程,以提高资源利用率。

在实践中,MaaS 未来的各种发展也集中在多平台和跨组织集成上。部署和利用模型通常涉及到多个平台和组织之间的协作。挑战包括实现不同平台之间的模型交互和通信,以及确保不同组织之间的数据共享和合作。未来的发展方向可能包括制定标准化的模型接口和通信协议,以促进不同平台之间的互操作性和协作。

MaaS 可能有几个方面的麻烦:

延迟:延迟是指请求和响应之间的时间。根据每个 GenAI 模型的复杂性和请求量,延迟问题是不可避免的。实时应用程序可能需要低延迟的响应,这可能很难实现,特别是对于基础模型。事实上,我们需要为应用程序提供低延迟的实时推理服务。

模型和结果的可解释性:“黑盒”模型的可解释性较差,用户无法准确填写决策结果。几乎所有的 GenAI 模型都表现出高度的复杂性,其可解释性表现较差。当涉及向用户阐明模型决策背后的基本原理时,这通常会造成一个重大的限制。

治理、风险和遵从性(GRC):主要的遵从性是指数据遵从性、内容遵从性、平台操作遵从性、平台管理遵从性等。组织通常必须遵守各种规则和法规,包括但不限于一般数据保护法规(GDPR)和行业特定的标准。当我们部署 MaaS 时,这些指导方针的步骤将会遇到一些重大的挑战。

数据质量和偏差:高质量的大数据是基础模型的基石。如果用于构建模型的训练数据有偏差或质量较差,那么当作为一种服务部署时,可能会导致有偏差的预测和不准确的结果。预先训练过的大模型可能会继承训练数据中存在的偏差,导致有偏差或不公平的结果。为了确保模型的道德和公平应用,有必要仔细评估和减轻偏见。

缺乏透明度:确保模型能够与不同客户端使用的各种平台和技术无缝地工作可能是一项挑战。可能会出现兼容性问题。在 MaaS 中使用的预先训练过的模型可能很复杂且难以解释。理解内部工作和基于模型输出做出决策可能具有挑战性,特别是对于需要可解释的人工智能的关键应用程序。

依赖于服务可用性:使用来自特定提供商的 MaaS 可能会导致供应商锁定,这使得切换到其他服务或引入内部模型变得困难。MaaS 依赖于服务提供商的基础设施的可用性和可靠性。如果提供商遇到停机或中断,它可能会破坏依赖于这些模型的应用程序的功能。

有限的离线能力:确保 MaaS 的可用性和可靠性可能具有挑战性。停机时间或服务中断可能会中断依赖于该模型的应用程序。MaaS 通常需要一个活跃的互联网连接来访问和利用这些模型。在互联网连接有限或不可靠的情况下,离线功能可能会受到损害。

有限的定制:这似乎违反了直觉,但事实确实如此。有时,绝大多数普通用户缺乏修改这些参数的能力。一些 MaaS 提供商可能会限制可用的定制级别,这可能会限制具有特定需求的应用程序。MaaS 提供的预先训练过的模型可能缺乏根据特定需求进行广泛定制的灵活性。用户可能对底层模型体系结构和参数的控制有限。

使用 MaaS,如何实现“one model to serve all”?这仍然是一个悬而未决的问题。解决这些挑战和限制通常需要仔细的规划、体系结构设计和持续的维护。在决定实施 MaaS 之前,组织应该评估它们的具体需求和限制,以确保它与他们的目标和资源相一致。


九、未来方向

MaaS 在机器学习和人工智能领域具有巨大的潜力。未来有几个值得注意的方向,可能需要进一步的研究。这些问题包括,但不限于,解决安全和隐私问题,探索加密和安全计算技术,以及开发访问控制机制。增强模型管理、版本控制系统和优化可伸缩性的资源分配也是 MaaS 研究的关键。此外,通过标准化接口和通信协议的跨组织集成对未来的工作很有前景。这些方向是释放 MaaS 的全部潜力的关键。论文将讨论其中的一些问题如下:

数据隐私和安全性:随着 MaaS 的越来越普及,对模型和数据的日益增长的需求将引起人们对安全和隐私的担忧。在未来,将有必要采用更先进的加密方案、访问控制机制和数据保护方法,以确保 MaaS 中数据传输和处理的安全性。

算法优化和模型效率:未来的研究可以集中于改进算法和优化模型效率,以提高 MaaS 的性能和响应性。有效利用有限的资源是 MaaS 迫切关注的问题。我们应该探索如何优化大模型的计算和推理过程,以减少资源消耗。这项优化工作对于未来 MaaS 的潜力至关重要。

模型生命周期管理:模型生命周期管理,包括开发、训练、部署、更新和退休,是研究和开发的一个关键领域。学者和工程师可以专注于建立更复杂的模型管理理论,开发相应的版本控制系统,以确保有效的模型治理和维护。

可解释的人工智能和伦理考虑:如何提高 MaaS 模型的可解释性,并解决与人工智能相关的伦理和道德问题,以确保其应用程序的公平性和透明度?在 MaaS 研究中,一个关键的挑战是模型决策过程的复杂性。我们必须设计新的范式来增强这些模型的可解释性,然后让用户理解模型决策背后的基本原理。

环境友好性和能源效率:未来的研究可以通过优化计算和通信资源的使用,减少其对环境的影响,来探索提高 MaaS 的环境友好性和能源效率的方法。

多模态学习和跨设备协作:我们可以探索多模态学习(涉及多种模式)和跨设备协作(例如,联合学习),以实现分布式环境中模型的共享和训练,在提高模型性能的同时保持数据隐私

社会影响和政策问题:我们必须仔细考虑 MaaS 的社会影响,并积极促进制定指导其利用和发展的法规和政策。这些规定必须符合道德原则和更广泛的社会利益。


十、结论

这是第一次集中于基于 GenAI 模型的 MaaS 主题的调查。论文首先讨论 XaaS 模型之间的历史,论文假设它是一个连续的转换。然后,论文回顾了云平台(即 SaaS、PaaS 和 IaaS)之间的关系,并从 Web 时代的角度找出了差异。本文详细介绍了 MaaS 平台的几项重要技术及其优点。随后,论文介绍了一些应用程序场景,因为 MaaS 在不同的领域中都有广泛的应用程序。最后,我论文出了 MaaS 将面临的几个关键问题和挑战,并指出了 MaaS 的研究方向。MaaS 已经成为人工智能时代的一种变革性范式,使组织能够无缝地利用预先训练好的模型。它的好处,包括加速采用、低成本和易于操作的优势,已经为人工智能在行业中的广泛整合铺平了道路。随着 MaaS 在未来的发展,数据隐私、定制和伦理考虑将是充分利用其潜在优势的关键问题和挑战。随着社会公益 MaaS 的发展,无处不在的人工智能技术将深入参与到我们的日常生活中。

发布于: 刚刚阅读数: 3
用户头像

上海合合信息科技股份有限公司人工智能团队 2022-08-01 加入

在上海市领军人才合合信息董事长镇立新博士带领下,于复杂场景文字识别、智能图像处理、自然语言处理等人工智能领域拥有10 余年研发创新与技术积累,具备专业的行业理解与技术成果。

评论

发布
暂无评论
【论文解读】模型即服务-介绍MaaS中所涉及的关键技术_人工智能_合合技术团队_InfoQ写作社区