写点什么

LazyLLM 教程 | 第 3 讲:大模型怎么玩:用 LazyLLM 带你理解调用逻辑与 Prompt 魔法!

  • 2025-08-06
    北京
  • 本文字数:17658 字

    阅读完需:约 58 分钟

上期,我们介绍了基础的 RAG 的基本概念,以及如何用 LazyLLM 实现一个基础的 RAG。本期我们将深入介绍 LazyLLM 的特性,以 Lazy 的方式,逻辑更加清晰地构建出一个以数据流为核心范式的 RAG 应用~


在本次教程中,您不仅可以学习到 LazyLLM 中的各种数据流的使用,还可以更加深入地学到如何使用在线和本地的大模型,并为它们设置上 Prompt,同时还可以复用同一个本地大模型来构建多个不同角色的大模型。最后本喵将带领您一步步优化上期 RAG,以 LazyLLM 中的数据流来重构基础 RAG!



LazyLLM 是一款构建多 Agent 大模型应用的开发框架,协助开发者用极低的成本构建复杂的 AI 应用,并可以持续的迭代优化效果。基于 LazyLLM 的 AI 应用构建流程是:


原型搭建 → 数据分析​ → 迭代优化


用户可以先基于 LazyLLM 快速跑通应用的原型,再结合场景任务数据进行 bad-case 分析,然后对应用中的关键环节进行算法迭代和模型微调,进而逐步提升整个应用的效果。LazyLLM 的设计目标是让算法研究员和开发者能够从繁杂的工程实现中解脱出来,从而专注算法和数据。


LazyLLM 为同一模块的不同技术选型提供了一致的使用体验 -- 统一调用、统一服务、统一部署。



对于初级开发者,LazyLLM 彻底简化了 AI 应用的构建过程。用户不必了解不同模型 API 服务的构建细节,无需在微调模型时选择框架或切分模型,也不需要掌握任何 Web 开发知识,通过预置的组件和简单的拼接操作,初级开发者便能轻松构建出具备生产价值的工具。


对于资深的专家,LazyLLM 提供了极高的灵活性,为开发者提供了无限的可能性。其模块化设计支持高度的定制与扩展,使用户能够轻松集成自有算法、行业领先的生产工具以及最新的技术成果,从而快速构建适配多样化需求的强大应用。


本教程主要介绍 LazyLLM 的基本使用方法,读完本教程,您将学会 LazyLLM 最基本的用法和核心设计思路,可以自己搭建一个简单的聊天机器人,为其指定角色并进行聊天。


更多 LazyLLM 使用教程及 API 文档请参考:LazyLLM官方文档 或 B 站一键三连:

.mp4)

环境的准备


如果您的电脑上安装了 Python,请通过下方命令安装基础的 lazyllm 及必要的依赖包。更多 LazyLLM 的安装细节,可见上期的教程的环境准备部分。


从 pip 安装

pip install lazyllm
复制代码

从源码安装

git clone https://github.com/LazyAGI/LazyLLM.gitcd LazyLLMpip3 install -r requirements.txtexport PYTHONPATH=$PWD:$PYTHONPATH
复制代码

调用大模型


LazyLLM 支持调用线上模型和本地模型,为二者提供了一致的使用体验,做到模型即黑盒,您只需关注输入输出及相关参数的具体取值,而无需研究不同模型调用上的差异。


1. 调用在线大模型

LazyLLM 通过 OnlineChatModule 统一调用线上大模型接口,不管您使用的 OpenAPI 接口还是 SenseNova 接口,或者是其他平台提供的接口,LazyLLM 均为您进行了规范的参数封装,您只需要根据自己的需求将模型名称等参数传给对应的模块即可。


❗❗❗ 注意,您需要在开始调试前,将您的 API key 设置为环境变量,如您没有指定任何环境变量程序将报错。您可以参考上期教程进行设置。例如当您需要访问 SenseNova 时,您需要设定环境变量:


export LAZYLLM_SENSENOVA_API_KEY="..."export LAZYLLM_SENSENOVA_SECRET_KEY="..."
复制代码

如果您只配置了一个平台的 API key,则无需指定平台名称,直接调用 OnlineChatModule 即可。如果配置了多个平台的 API key,在没指定平台名称的情况下,会按照 openai>sensenova>glm>kimi>qwen 的顺序进行平台查找。当您需要指定具体平台时,需要为 OnlineChatModule 传入平台名称;如果需要指定具体模型,则需要传入对应模型名称。


llm = lazyllm.OnlineChatModule(source="sensenova")
# 指定具体模型sensechat = lazyllm.OnlineChatModule("sensenova", model="SenseChat-5")
复制代码

下面我们使用 LazyLLM 调用一个线上模型(已在环境变量中设置了 SenseNova 相关的 KEY)

import lazyllm
online_model = lazyllm.OnlineChatModule()print(online_model("你好,你是谁?"))
复制代码

如果您没有开通相应的模型服务,可以通过输入 model 参数指定模型,例如

import lazyllm
online_model = lazyllm.OnlineChatModule(source="sensenova", model="DeepSeek-V3")print(online_model("你好,你是DeepSeek吗?"))
复制代码

2. 调用本地大模型


LazyLLM 中的 TrainableModule 为所有本地模型(包括 llm、Embedding、多模态模型等)提供服务,可用于本地模型的训练、微调和推理。调用本地大模型依赖于其推理服务,我们回顾一下使用本地模型进行推理的步骤:


(1)通过推理框架启动本地模型服务;

(2)在 python 脚本中进行接口调用。


LazyLLM 提供了一种非常 lazy 的实现方式,只需将模型所在的路径传入 LazyLLM 的TrainableModule然后通过start()函数启动服务即可。这里需要您传入模型文件的绝对路径,或者配置环境变量LAZYLLM_MODEL_PATH指定模型所在的目录,然后将模型名称传入TrainableModule。如果您本地没有该模型,LazyLLM 会为您下载对应模型并存入模型缓存目录,默认情况下会下载到您的家目录下的 ".lazyllm/model" 目录;您可以通过配置 “LAZYLLM_MODEL_CACHE_DIR”环境变量指定模型缓存目录。


值得一提的是 LazyLLM 支持多种推理框架,如:LightLLM 和 vLLM 等,在不指定明确框架下 LazyLLM 会根据模型大小和测试数据等信息,自动为用户选择合适的推理框架。如果要明确指定一个推理框架,我们可以这么来设定:


代码GitHub链接

import lazyllmfrom lazyllm import deploy
llm = lazyllm.TrainableModule('internlm2-chat-7b').\ deploy_method((deploy.Vllm, { 'port': 8081, 'host': '0.0.0.0', })).start()res = llm('hi')print("大模型的输出是:", res)
复制代码

上面代码中,使用deploy_method来配置推理框架:


  • deploy.Vllm 指定使用 vLLM 作为推理引擎;

  • host 和port 参数分别指定了服务部署时候的 IP 和地址;


3. Prompt 配置使用


Prompt 是指在自然语言处理(NLP)或人工智能(AI)系统中输入给模型的文本或指令,是与模型交互的主要方式。Prompt 不仅是用户输入的文本,它在很多情况下是模型理解任务的关键,通过设计合适的 Prompt,我们可以引导模型以特定的方式生成所需的响应。


Prompt 的主要作用是给模型提供任务的上下文信息,比如在对话中,模型会根据预定义的系统说明和用户输入进行回复。不同的提示会引导模型生成不同的答案。因此,Prompt 的设计直接影响到生成内容的质量、准确性和相关性。利用大模型进行问答系统时,我们可以通过 Prompt 指定大模型扮演的角色以及回答问题的风格等。

基础的 Prompt

使用 LazyLLM 提供的 Prompt 模板,您只需要在初始化大模型时通过如下语法进行定义,在调用时直接传入用户输入即可。下面定义了两个大模型 llm1 和 llm2,llm1 是一个默认的在线大模型,llm2 是一个自定义了 prompt 的在线大模型:


代码GitHub链接

import lazyllm
llm1 = lazyllm.OnlineChatModule()llm2 = lazyllm.OnlineChatModule().prompt("你是一只小猫,在每次回答问题之后都要加上喵喵喵")
print('普通情况下模型的输出: ', llm1('你好'))print('自定义Prompt后模型的输出: ', llm2('你好'))
复制代码

让我们看看上述代码的输出:

普通情况下模型的输出:    你好!有什么我可以帮助你的吗?自定义Prompt后模型的输出:  你好,有什么我可以帮助你的吗?喵喵喵
复制代码


看可以看到在自定义 prompt 模板后,大模型按照我们的要求在回答后加上了“喵喵喵”。

动态的 Prompt

后面我们会遇到 prompt 中需要植入额外的内容,此时我们就可以在 prompt 中插入了一个变量作为占位符,然后在推理的过程中该变量可以替换为我们希望的内容。为了实现这样一种动态的 Prompt,具体让我们来看一下这个例子:

代码GitHub链接

import lazyllm
llm2 = lazyllm.OnlineChatModule().prompt("根据给出的文段回答问题,文段:{content}")
passage = ('孙悟空,是在小说《西游记》当中唐僧的四个徒弟之一,排行第一,别名孙行者、孙猴子。' '自封美猴王、齐天大圣。因曾在天庭掌管御马监而又被称为弼马温,在取经完成后被如来佛祖授封为斗战胜佛')
# 下面打印promt_content仅做展示,实际不需要:prompt_content = llm2._prompt.generate_prompt({'input':'孙悟空有哪些名字?', 'content':passage}, return_dict=True)print(prompt_content)
# 模型推理:print(llm2({'input':'孙悟空有哪些名字?', 'content':passage}))
复制代码

上面例子中,我们希望在推理过程中,能把文段信息替换`{content}`,这里我们取了个变量名叫做content,您可以取任意其他变量名(除了input)。


接下来我们根据内容用generate_prompt拼接了内容 (其中return_dict用于线上模型的格式输出,默认会是线下模型的格式输出,这里我们用的模型是在线 QWen 大模型,所以需要开启这个参数,否则输出格式就是线下的格式),这里我们打印查看了一个它拼接成的内容print(prompt_content)

{'messages': [{'role': 'system', 'content': 'You are a large-scale language model from Alibaba Cloud, your name is Tongyi Qianwen, and you are a useful assistant.\n根据给出的文段回答问题,文段:孙悟空,是在小说《西游记》当中唐僧的四个徒弟之一,排行第一,别名孙行者、孙猴子。自封美猴王、齐天大圣。因曾在天庭掌管御马监而又被称为弼马温,在取经完成后被如来佛祖授封为斗战胜佛\n\n'}, {'role': 'user', 'content': '孙悟空有哪些名字?'}]}
复制代码

未开启return_dict下的拼接内容展示:

'You are a large-scale language model from Alibaba Cloud, your name is Tongyi Qianwen, and you are a useful assistant.根据给出的文段回答问题,文段:孙悟空,是在小说《西游记》当中唐僧的四个徒弟之一,排行第一,别名孙行者、孙猴子。自封美猴王、齐天大圣。因曾在天庭掌管御马监而又被称为弼马温,在取经完成后被如来佛祖授封为斗战胜佛\n\n\n\n\n\n孙悟空有哪些名字?\n\n'
复制代码

从拼接后的模板内容可以看到这是符合我们的预期的:内容被动态拼接到了 Prompt 模板中,接下来,我们查看送入大模型后输出的实际效果:

孙悟空有以下几个名字和别称:
1. 孙行者2. 孙猴子3. 美猴王(自封)4. 齐天大圣(自封)5. 弼马温(曾掌管天庭御马监)
在取得真经后,他还被如来佛祖授封为“斗战胜佛”。
复制代码

可以看到模型根据我们的需求正确从文本段中提取出来了内容。


独立的 Prompt

前面介绍的 Prompt 都是在大模型上直接设置的,有时候我们需要单独先定义好一个 Prompt,然后再给它设置给大模型来使用(这样定义好一个 Prompt 就可以设置给不同的大模型使用了)。LazyLLM 主要有两种 Prompt:AlpacaPrompter 和 ChatPrompter(前面其实用到的都是这种 ChatPrompter)。它们两者主要是格式不一样,具体来说:

AlpacaPrompter:

{system}\n{instruction}\n{tools}\n{user}### Response:\n
复制代码

ChatPrompter

{sos}{system}{instruction}{tools}{eos}\n\n{history}\n{soh}\n{user}{input}\n{eoh}{soa}\n
复制代码

其中:

  • instruction: 任务指令,我们前面设置的 Prompt 内容主要就是这个部分;

  • history: 历史对话,由用户的输入得到,格式为 [[a, b], [c, d]] 或 [{"role": "user", "content": ""}, {"role": "assistant", "content": ""}]

  • tools: 可以使用的工具,在构造 prompter 时传入或者由用户使用时传入,当构造 prompter 时定义了工具之后,将禁止用户使用时再次传入。格式为 [{"type": "function", "function": {"name": "", "description": "", "parameters": {}, "required": []}]

  • user: 用户级指令,可选指令。由用户通过 instruction指定,如果 instruction是字符串,则默认是系统指令,如果是字典,且其键值只能是 system 和 user 。system 指定的是系统级指令, user 指定的是用户级指令。


由模型归属信息自动填入的参数(用户和开发者都不用关心如何填入这部分信息,LazyLLM 会自动处理,这里做了解就好):

  • system: 系统提示,一般会读取模型的归属信息并进行设置(当设置到某个模型上后会自动设置上),如不设置默认为 You are an AI-Agent developed by LazyLLM. ;

  • sos: start of system , 标志着系统提示的开始;

  • eos: end of system , 标志着系统提示的结束;

  • soh: start of human , 标志着用户输入的开始;

  • eoh: end of human , 标志着用户输入的结束;

  • soa: start of assistant , 标志着模型输出的开始;

  • eoa: end of assistant , 标志着模型输出的结束;


让我们先看看这两种独立的 Prompt 的拼合效果:

假设文段和用户提问是:

import lazyllm
passage = ('孙悟空,是在小说《西游记》当中唐僧的四个徒弟之一,排行第一,别名孙行者、孙猴子。' '自封美猴王、齐天大圣。因曾在天庭掌管御马监而又被称为弼马温,在取经完成后被如来佛祖授封为斗战胜佛')query = '孙悟空有哪些名字?'
复制代码

AlpacaPrompter(独立)

prompter1 = lazyllm.AlpacaPrompter({    'system': '系统指令',    'user': '用户指令。\n### 文段内容:{content}\n### 问题:{input}\n'    })content = prompter1.generate_prompt({'input':query,'content':passage})print("\n独立Prompt(Alpaca):\n", repr(content))
复制代码

输出:

独立Prompt(Alpaca): 'You are an AI-Agent developed by LazyLLM.\nBelow is an instruction that describes a task, paired with extra messages such as input that provides further context if possible. Write a response that appropriately completes the request.\n\n### Instruction:\n系统指令\n\n用户指令。\n### 文段内容:孙悟空,是在小说《西游记》当中唐僧的四个徒弟之一,排行第一,别名孙行者、孙猴子。自封美猴王、齐天大圣。因曾在天庭掌管御马监而又被称为弼马温,在取经完成后被如来佛祖授封为斗战胜佛\n### 问题:孙悟空有哪些名字?\n### Response:\n'
复制代码

ChatPrompter(独立)

prompter2 = lazyllm.ChatPrompter({    'system': '系统指令',    'user': '用户指令。\n### 文段内容:{content}\n### 问题:{input}\n'    })content = prompter2.generate_prompt({'input':query,'content':passage})print("\n独立Prompt(Chat):\n", repr(content))
复制代码

输出:

独立Prompt(Chat): 'You are an AI-Agent developed by LazyLLM.系统指令\n\n\n\n用户指令。\n### 文段内容:孙悟空,是在小说《西游记》当中唐僧的四个徒弟之一,排行第一,别名孙行者、孙猴子。自封美猴王、齐天大圣。因曾在天庭掌管御马监而又被称为弼马温,在取经完成后被如来佛祖授封为斗战胜佛\n### 问题:孙悟空有哪些名字?\n\n\n'
复制代码

现在再让我们把它塞到模型里,让模型自动添加上和它相关的信息,这里我们选择一个本地模型 InternLM2-Chat-7B。


AlpacaPrompter(带 LLM)

m1 = lazyllm.TrainableModule("internlm2-chat-7b").prompt(prompter1)res = m1._prompt.generate_prompt({'input':query,'content':passage})print("\n带LLM的Prompt(Alpaca):\n", repr(res))
复制代码

输出:

带LLM的Prompt(Alpaca): 'You are an AI assistant whose name is InternLM (书生·浦语).\n- InternLM (书生·浦语) is a conversational language model that is developed by Shanghai AI Laboratory (上海人工智能实验室). It is designed to be helpful, honest, and harmless.\n- InternLM (书生·浦语) can understand and communicate fluently in the language chosen by the user such as English and 中文.\nBelow is an instruction that describes a task, paired with extra messages such as input that provides further context if possible. Write a response that appropriately completes the request.\n\n### Instruction:\n系统指令\n\n用户指令。\n### 文段内容:孙悟空,是在小说《西游记》当中唐僧的四个徒弟之一,排行第一,别名孙行者、孙猴子。自封美猴王、齐天大圣。因曾在天庭掌管御马监而又被称为弼马温,在取经完成后被如来佛祖授封为斗战胜佛\n### 问题:孙悟空有哪些名字?\n### Response:\n'
复制代码

ChatPrompter(带 LLM)

m2 = lazyllm.TrainableModule("internlm2-chat-7b").prompt(prompter2)res = m2._prompt.generate_prompt({'input':query,'content':passage})print("\n带LLM的Prompt(Chat):\n", repr(res))
复制代码

输出:

带LLM的Prompt(Chat): '<|im_start|>system\nYou are an AI assistant whose name is InternLM (书生·浦语).\n- InternLM (书生·浦语) is a conversational language model that is developed by Shanghai AI Laboratory (上海人工智能实验室). It is designed to be helpful, honest, and harmless.\n- InternLM (书生·浦语) can understand and communicate fluently in the language chosen by the user such as English and 中文.系统指令<|im_end|>\n\n\n\n<|im_start|>user\n\n用户指令。\n### 文段内容:孙悟空,是在小说《西游记》当中唐僧的四个徒弟之一,排行第一,别名孙行者、孙猴子。自封美猴王、齐天大圣。因曾在天庭掌管御马监而又被称为弼马温,在取经完成后被如来佛祖授封为斗战胜佛\n### 问题:孙悟空有哪些名字?\n\n<|im_end|>\n<|im_start|>assistant\n\n'
复制代码

格式对比:


4. 大模型多重复用


上一部分介绍了如何设置独立的 Prompt 给不同的大模型用。那么可以设置不同的 Prompt 但底层共用同一个大模型吗?在 LazyLLM 中这个回答是肯定的!尤其是对于本地的模型,这样不用为了设置多个不同角色大模型而部署多个本地大模型,进而可以极大地节省显存。


用法 1​:在同一个进程内,通过 share 来实现大模型的共享

代码GitHub链接

import lazyllm
prompt1 = "你扮演一只小猫,在每次回答问题都要加上:喵喵喵"prompt2 = "你扮演一只小鸡,在每次回答问题都要加上:咯咯哒"
llm = lazyllm.TrainableModule("internlm2-chat-7b")llm1 = llm.share(prompt=prompt1)llm2 = llm.share(prompt=prompt2)
# Deploy LLMllm.start()
# Show:inputs = '你好'print('未设置Prompt的LLM: ', llm(inputs))print('设置Prompt1 的LLM: ', llm1(inputs))print('设置Prompt2 的LLM: ', llm2(inputs))
复制代码

在上面代码中,我们仅部署了一个大模型(InternLM2-Chat-7B),但是,我们通过share并且同时设置不同的 Prompt,这样就构建出另外两个带有角色的大模型。输出效果如下所示:

未设置Prompt的LLM:  你好!我是书生·浦语,很高兴为你服务。有什么我可以帮助你的吗?设置Prompt1 的LLM:  喵喵喵,你好!有什么我可以帮助你的吗?设置Prompt2 的LLM:  咯咯哒,你好!我是书生·浦语,很高兴认识你。
复制代码


用法 2​:在不同进程中,通过制定推理框架url 来实现大模型的共享

import lazyllmm = lazyllm.TrainableModule('internlm2-chat-7b').deploy_method(    lazyllm.deploy.lightllm, url='http://10.119.17.169:36846/generate')
复制代码

小彩蛋​:除了用法 1 在代码中起推理服务之外,我们还提供了命令行工具

lazyllm deploy internlm2-chat-7b
复制代码

5. 三行聊天机器人


用 LazyLLM 构造一个简单的聊天机器人只需三行代码。这里引入 lazyllm.WebModule,它可以将任意数据流封装为一个 Web 服务,让您可以在图形界面进行对话调试。

import lazyllmllm = lazyllm.TrainableModule("internlm2-chat-7b").prompt("你扮演一只小猫,在每次回答问题都要加上喵喵喵")webpage = lazyllm.WebModule(llm, port=23466, history=[llm], stream=True).start().wait()
复制代码


上面代码中的WebModule

  • 指定用大模型 llm 来作为对话的机器人;

  • port指定了聊天界面发布的端口;

  • history中指定了要将 llm 的输出作为历史信息,这样机器人就具有了历史对话记忆能力;

  • stream开启了输出的对话是流式的;

  • start用于启动整个聊天机器人的部署;

  • wait表示启动后就一直服务不停止,如果不加上服务部署好后会立刻停止。


数据流简介


LazyLLM 是一款以数据流(Data Flow)为核心的多 Agent 大模型应用开发框架,所以 LazyLLM 中定义了大量的数据流组件,配合 LazyLLM 中提供的工具和组件,可以让您像搭积木一样搭建复杂的大模型应用。数据流的核心设计思路是无需您手动对数据流动进行指定,而是通过数据流内部将上一阶段的数据直接分发给对应的下游接收组件。LazyLLM 支持 Pipeline、Parallel、Switch、If、Loop、Diverter、Warp、Graph 等数据流。


image.png 本节将详细为您介绍 LazyLLM 中的各种数据流,方便您在接下来的教程中理解和使用。


注意:


LazyLLM 支持数据流的 with 语句。with 语句可以让数据流定义代码更加的简洁和清晰。下面关于数据流的所有例子不仅展示了基于函数式的数据流构建,同时在右侧也对应展示了通过 with 语法定义的数据流,with 语句的巧妙之处在于定义代码的缩进与目标数据流结构有一定的关联性,可以清晰的看出整体结构。

1. Pipeline

Pipeline 是顺次执行的数据流,上一个阶段的输出成为下一个阶段的输入。pipeline 支持函数和仿函数(或仿函数的 type),其工作流如下所示:

input -> module1 -> ... -> moduleN -> out
复制代码

下面是通过 Pipeline 执行顺序结构程序的例子, 任意函数、匿名函数以及可调用实例(含__call__()函数的类)都可以作为 pipeline 中的一员。

函数式:


代码GitHub链接

import lazyllm
f1 = lambda x: x * 2
def f2(input): return input - 1
class AddOneFunctor(object): def __call__(self, x): return x + 1
f3 = AddOneFunctor()
# 手动调用:inp = 2x1 = f1(inp)x2 = f2(x1)x3 = f3(x2)out_normal = AddOneFunctor()(x3)
# 使用数据流ppl = lazyllm.pipeline(f1, f2, f3, AddOneFunctor)out_ppl1 = ppl(inp)
print(f"输入为{inp},手动调用输出:", out_normal)print(f"输入为{inp},数据流输出:", out_ppl1)
复制代码

输出:

输入为2,手动调用输出: 5输入为2,数据流输出: 5
复制代码

with 式:

代码GitHub链接

import lazyllm
f1 = lambda x: x * 2
def f2(input): return input - 1
class AddOneFunctor(object): def __call__(self, x): return x + 1
f3 = AddOneFunctor()
# 使用with方式的数据流with lazyllm.pipeline() as ppl: ppl.func1 = f1 ppl.func2 = f2 ppl.func3 = f3 ppl.func4 = AddOneFunctor
inp = 2out_ppl1 = ppl(inp)
print(f"输入为{inp},数据流输出:", out_ppl1)
复制代码

输出:

输入为2,数据流输出: 5
复制代码

2.Parallel


Parallel 支持我们并行调用多个 pipeline,其数据流示意如下:


      /> module11 -> ... -> module1N -> out1 \input ->  module21 -> ... -> module2N -> out2 -> (out1, out2, out3)      \> module31 -> ... -> module3N -> out3 /
复制代码


Parallel 支持对输出格式进行格式化处理,方便下游组件进行针对性使用,目前 Parallel 支持输出字典、元组、列表和字符串形式的输出,具体效果可见下方例子:

函数式:


代码GitHub链接

import lazyllm
test1 = lambda a: a + 1test2 = lambda a: a * 4test3 = lambda a: a / 2
prl1 = lazyllm.parallel(test1, test2, test3)prl2 = lazyllm.parallel(path1=test1, path2=test2, path3=test3).asdictprl3 = lazyllm.parallel(test1, test2, test3).astupleprl4 = lazyllm.parallel(test1, test2, test3).aslistprl5 = lazyllm.parallel(test1, test2, test3).join(',')
print("默认输出:prl1(1) -> ", prl1(1), type(prl1(1)))print("输出字典:prl2(1) -> ", prl2(1), type(prl2(1)))print("输出元组:prl3(1) -> ", prl3(1), type(prl3(1)))print("输出列表:prl4(1) -> ", prl4(1), type(prl4(1)))print("输出字符串:prl5(1) -> ", prl5(1), type(prl5(1)))
复制代码

输出:

默认输出:prl1(1) ->  (2, 4, 0.5) <class 'lazyllm.common.common.package'>输出字典:prl2(1) ->  {'path1': 2, 'path2': 4, 'path3': 0.5} <class 'dict'>输出元组:prl3(1) ->  (2, 4, 0.5) <class 'tuple'>输出列表:prl4(1) ->  [2, 4, 0.5] <class 'list'>输出字符串:prl5(1) ->  2,4,0.5 <class 'str'>
复制代码

with 式(代码GitHub链接):

import lazyllm
test1 = lambda a: a + 1test2 = lambda a: a * 4test3 = lambda a: a / 2
with lazyllm.parallel() as prl1: prl1.func1 = test1 prl1.func2 = test2 prl1.func3 = test3
with lazyllm.parallel().asdict as prl2: prl2.path1 = test1 prl2.path2 = test2 prl2.path3 = test3
with lazyllm.parallel().astuple as prl3: prl3.func1 = test1 prl3.func2 = test2 prl3.func3 = test3
with lazyllm.parallel().aslist as prl4: prl4.func1 = test1 prl4.func2 = test2 prl4.func3 = test3
with lazyllm.parallel().join(',') as prl5: prl5.func1 = test1 prl5.func2 = test2 prl5.func3 = test3
print("默认输出:prl1(1) -> ", prl1(1), type(prl1(1)))print("输出字典:prl2(1) -> ", prl2(1), type(prl2(1)))print("输出元组:prl3(1) -> ", prl3(1), type(prl3(1)))print("输出列表:prl4(1) -> ", prl4(1), type(prl4(1)))print("输出字符串:prl5(1) -> ", prl5(1), type(prl5(1)))
复制代码

输出:

默认输出:prl1(1) ->  (2, 4, 0.5) <class 'lazyllm.common.common.package'>输出字典:prl2(1) ->  {'path1': 2, 'path2': 4, 'path3': 0.5} <class 'dict'>输出元组:prl3(1) ->  (2, 4, 0.5) <class 'tuple'>输出列表:prl4(1) ->  [2, 4, 0.5] <class 'list'>输出字符串:prl5(1) ->  2,4,0.5 <class 'str'>
复制代码

3. Diverter

Diverter 是一种专门的并行处理工具,其中多个输入分别通过一系列并行的模块。然后将输出聚合返回。

#                 /> in1 -> module11 -> ... -> module1N -> out1 \# (in1, in2, in3) -> in2 -> module21 -> ... -> module2N -> out2 -> (out1, out2, out3)#                 \> in3 -> module31 -> ... -> module3N -> out3 /
复制代码

当您拥有可以并行执行的不同数据处理管道,并希望在单个流构造中管理它们时,该工具非常有用。和 Parallel 一样,该工具支持对输出格式进行格式化处理,目前支持输出字典、元组、列表和字符串形式的输出,具体效果可见下方例子:

函数式(代码GitHub链接):

import lazyllm
test1 = lambda a: a + 1test2 = lambda a: a * 4test3 = lambda a: a / 2
prl1 = lazyllm.diverter(test1, test2, test3)prl2 = lazyllm.diverter(path1=test1, path2=test2, path3=test3).asdictprl3 = lazyllm.diverter(test1, test2, test3).astupleprl4 = lazyllm.diverter(test1, test2, test3).aslistprl5 = lazyllm.diverter(test1, test2, test3).join(',')
inputs = [1, 2, 3]
print("默认输出:prl1(1) -> ", prl1(inputs), type(prl1(inputs)))print("输出字典:prl2(1) -> ", prl2(inputs), type(prl2(inputs)))print("输出元组:prl3(1) -> ", prl3(inputs), type(prl3(inputs)))print("输出列表:prl4(1) -> ", prl4(inputs), type(prl4(inputs)))print("输出字符串:prl5(1) -> ", prl5(inputs), type(prl5(inputs)))
复制代码

输出:

默认输出:prl1(1) ->  (2, 8, 1.5) <class 'lazyllm.common.common.package'>输出字典:prl2(1) ->  {'path1': 2, 'path2': 8, 'path3': 1.5} <class 'dict'>输出元组:prl3(1) ->  (2, 8, 1.5) <class 'tuple'>输出列表:prl4(1) ->  [2, 8, 1.5] <class 'list'>输出字符串:prl5(1) ->  2,8,1.5 <class 'str'>
复制代码

with 式(代码GitHub链接):

import lazyllm
test1 = lambda a: a + 1test2 = lambda a: a * 4test3 = lambda a: a / 2
with lazyllm.diverter() as prl1: prl1.func1 = test1 prl1.func2 = test2 prl1.func3 = test3
with lazyllm.diverter().asdict as prl2: prl2.func1 = test1 prl2.func2 = test2 prl2.func3 = test3
with lazyllm.diverter().astuple as prl3: prl3.func1 = test1 prl3.func2 = test2 prl3.func3 = test3
with lazyllm.diverter().aslist as prl4: prl4.func1 = test1 prl4.func2 = test2 prl4.func3 = test3
with lazyllm.diverter().join(',') as prl5: prl5.func1 = test1 prl5.func2 = test2 prl5.func3 = test3
inputs = [1, 2, 3]
print("默认输出:prl1(1) -> ", prl1(inputs), type(prl1(inputs)))print("输出字典:prl2(1) -> ", prl2(inputs), type(prl2(inputs)))print("输出元组:prl3(1) -> ", prl3(inputs), type(prl3(inputs)))print("输出列表:prl4(1) -> ", prl4(inputs), type(prl4(inputs)))print("输出字符串:prl5(1) -> ", prl5(inputs), type(prl5(inputs)))
复制代码

输出:

默认输出:prl1(1) ->  (2, 8, 1.5) <class 'lazyllm.common.common.package'>输出字典:prl2(1) ->  {'func1': 2, 'func2': 8, 'func3': 1.5} <class 'dict'>输出元组:prl3(1) ->  (2, 8, 1.5) <class 'tuple'>输出列表:prl4(1) ->  [2, 8, 1.5] <class 'list'>输出字符串:prl5(1) ->  2,8,1.5 <class 'str'>
复制代码

4. Warp

Warp 是一款强大的控制流工具,旨在将同一处理模块并行地应用于一系列输入数据。它通过高效地“形变”单个模块至各个输入,确保每个输入都能得到并行处理,从而大幅提升处理效率。

工作原理示意图:

#                 /> in1 \                            /> out1 \# (in1, in2, in3) -> in2 -> module1 -> ... -> moduleN -> out2 -> (out1, out2, out3)#                 \> in3 /                            \> out3 /
复制代码

注意​:

  • Warp 流不应用于异步任务,如训练和部署。

  • Warp 流不支持字典输出


与 Parallel 工具类似,Warp 支持对输出格式进行灵活处理。目前,它能够输出元组、列表和字符串形式的结果输出(注意:暂不支持字典输出)。具体的格式化效果及示例,请参见下方例子:

函数式(代码GitHub链接):

import lazyllm
test1 = lambda a: a + 1test2 = lambda a: a * 4test3 = lambda a: a / 2
prl1 = lazyllm.warp(test1, test2, test3)# prl2 = lazyllm.warp(path1=test1, path2=test2, path3=test3).asdict # Not Implementedprl3 = lazyllm.warp(test1, test2, test3).astupleprl4 = lazyllm.warp(test1, test2, test3).aslistprl5 = lazyllm.warp(test1, test2, test3).join(',')
inputs = [1, 2, 3]
print("默认输出:prl1(1) -> ", prl1(inputs), type(prl1(inputs)))print("输出元组:prl3(1) -> ", prl3(inputs), type(prl3(inputs)))print("输出列表:prl4(1) -> ", prl4(inputs), type(prl4(inputs)))print("输出字符串:prl5(1) -> ", prl5(inputs), type(prl5(inputs)))
复制代码

输出:

默认输出:prl1(1) ->  (4.0, 6.0, 8.0) <class 'lazyllm.common.common.package'>输出元组:prl3(1) ->  (4.0, 6.0, 8.0) <class 'tuple'>输出列表:prl4(1) ->  [4.0, 6.0, 8.0] <class 'list'>输出字符串:prl5(1) ->  4.0,6.0,8.0 <class 'str'>
复制代码

with 式(代码GitHub链接):

import lazyllm
test1 = lambda a: a + 1test2 = lambda a: a * 4test3 = lambda a: a / 2
with lazyllm.warp() as prl1: prl1.func1 = test1 prl1.func2 = test2 prl1.func3 = test3
with lazyllm.warp().astuple as prl3: prl3.func1 = test1 prl3.func2 = test2 prl3.func3 = test3
with lazyllm.warp().aslist as prl4: prl4.func1 = test1 prl4.func2 = test2 prl4.func3 = test3
with lazyllm.warp().join(',') as prl5: prl5.func1 = test1 prl5.func2 = test2 prl5.func3 = test3
inputs = [1, 2, 3]
print("默认输出:prl1(1) -> ", prl1(inputs), type(prl1(inputs)))print("输出元组:prl3(1) -> ", prl3(inputs), type(prl3(inputs)))print("输出列表:prl4(1) -> ", prl4(inputs), type(prl4(inputs)))print("输出字符串:prl5(1) -> ", prl5(inputs), type(prl5(inputs)))
复制代码

输出:

默认输出:prl1(1) ->  (4.0, 6.0, 8.0) <class 'lazyllm.common.common.package'>输出元组:prl3(1) ->  (4.0, 6.0, 8.0) <class 'tuple'>输出列表:prl4(1) ->  [4.0, 6.0, 8.0] <class 'list'>输出字符串:prl5(1) ->  4.0,6.0,8.0 <class 'str'>
复制代码

5. IFS

IFS 是 LazyLLM 框架中实现的 If-Else 功能,可根据条件评估结果选择执行两条路径之一(条件为真的路径或条件判断为假的路径)。IFS 使用 with 语句没有意义,所以这里仅展示函数式的使用:

代码GitHub链接

import lazyllm
cond = lambda x: x > 0true_path = lambda x: x * 2false_path = lambda x: -x
ifs_flow = lazyllm.ifs(cond, true_path, false_path)
res1 = ifs_flow(10)print('输入:10,输出:', res1)res2 = ifs_flow(-5)print('输入:-5,输出:', res2)
复制代码

输出:

输入: 10,输出: 20输入:-5,输出: 5
复制代码

6. Switch

Switch 数据流工具提供了一种根据表达式的值或条件的真实性来选择不同流的方法,如下所示。它类似于其他编程语言中的 switch-case 语句。


用户在使用该控制流工具的过程中需要定义好条件控制函数 cond,及其对应的分支函数 moduleX(可以是其他的控制流,如:Pipeline 等)。其中有个特殊的条件控制函数可以直接设置为字符串default来作为兜底的默认分支。


工作原理示意图:

# switch(exp):#     case cond1: input -> module11 -> ... -> module1N -> out; break#     case cond2: input -> module21 -> ... -> module2N -> out; break#     case cond3: input -> module31 -> ... -> module3N -> out; break
复制代码

另外值得注意的是 Switch 中有一个叫做judge_on_full_input的参数,默认情况下该参数为 True,这意味着每次输入到 Switch 中的数据都会同时作为条件控制函数和分支函数的输入;如果该参数设置为 False,这意味着至少需要两个输入,其中第一个会作为条件控制函数的输入,剩下的会作为分支函数的输入。具体示例如下所示:


函数式(代码GitHub链接):

import lazyllm
# 条件函数is_positive = lambda x: x > 0is_negative = lambda x: x < 0
# 每个条件函数对应一个分支函数:positive_path = lambda x: 2 * xnegative_path = lambda x : -xdefault_path = lambda x : '000'
# switch构建1(x同时作为条件函数和分支函数的输入):switch1 = lazyllm.switch( is_positive, positive_path, is_negative, negative_path, 'default', default_path)
# Show:print('\n输入x同时作为条件函数和分支函数的输入:')print("1Path Positive: ", switch1(2)) # 2不仅传入条件函数,2也传入对应的分支函数;print("1Path Default: ", switch1(0))print("1Path Negative: ", switch1(-5))
# switch构建2(条件函数和分支函数的输入指定不同的值):switch2 = lazyllm.switch( is_positive, positive_path, is_negative, negative_path, 'default', default_path, judge_on_full_input=False)
# Show:print('\n输入x,y按位置分别作为条件函数和分支函数的输入:')print("2Path Positive: ", switch2(-1,2)) # -1传入条件函数,2传入对应分支函数;print("2Path Default: ", switch2(1,2))print("2Path Negative: ", switch2(0, 2))
复制代码

输出:

输入x同时作为条件函数和分支函数的输入:1Path Positive:  41Path Default:   0001Path Negative:  5
输入x,y按位置分别作为条件函数和分支函数的输入:2Path Positive: -22Path Default: 42Path Negative: 000
复制代码

with 式(代码GitHub链接):

import lazyllm
# 条件函数is_positive = lambda x: x > 0is_negative = lambda x: x < 0
# 每个条件函数对应一个分支函数:positive_path = lambda x: 2 * xnegative_path = lambda x : -xdefault_path = lambda x : '000'
# switch构建1(x同时作为条件函数和分支函数的输入):with lazyllm.switch() as sw1: sw1.case(is_positive, positive_path) sw1.case(is_negative, negative_path) sw1.case('default', default_path)
# Show:print('\n输入x同时作为条件函数和分支函数的输入:')print("1Path Positive: ", sw1(2)) # 2不仅传入条件函数,2也传入对应的分支函数;print("1Path Default: ", sw1(0))print("1Path Negative: ", sw1(-5))
# switch构建2(条件函数和分支函数的输入指定不同的值):with lazyllm.switch(judge_on_full_input=False) as sw2: # 分离条件函数和分支函数的关键开关。注意默认是True sw2.case(is_positive, positive_path) sw2.case(is_negative, negative_path) sw2.case('default', default_path)
# Show:print('\n输入x,y按位置分别作为条件函数和分支函数的输入:')print("2Path Positive: ", sw2(-1,2)) # -1传入条件函数,2传入对应分支函数;print("2Path Default: ", sw2(1,2))print("2Path Negative: ", sw2(0, 2))
复制代码

输出:

输入x同时作为条件函数和分支函数的输入:1Path Positive:  41Path Default:   0001Path Negative:  5
输入x,y按位置分别作为条件函数和分支函数的输入:2Path Positive: -22Path Default: 42Path Negative: 000
复制代码

7. Loop

Loop 是一个循环控制流工具,可以将一系列函数重复应用于输入,直到满足停止条件或达到指定的迭代次数。Loop 结构允许定义一个简单的控制流,其中一系列步骤在循环中应用,可以使用可选的停止条件来根据步骤的输出退出循环。


Loop 中有个叫judge_on_full_input的参数,默认情况该值为 True,这意味着,输出的完整结果会被作为条件控制函数和分支函数的输入;如果该值为 False,那么输出的结果会被切分为两部分,第一部分会作为条件控制函数的输入,剩下部分作为下次循环的输出。所以当主动设置该参数为 False 时候要注意,分支函数需要返回至少两个值,第一个值作为条件输入,第二个值作为下次循环的输入。如下面例子中所示:


函数式(代码GitHub链接):

import lazyllm
# 条件函数stop_func = lambda x: x > 10
# 分支函数module_func = lambda x: x * 2
# loop构建1loop1 = lazyllm.loop( module_func, stop_condition=stop_func)
# Show:print('1输出:', loop1(1))
#==========================# 分支函数2def module_func2(x): print("\tloop: ", x) return lazyllm.package(x+1, x*2)
# loop构建2loop2 = lazyllm.loop( module_func2, stop_condition=stop_func, judge_on_full_input=False)
# Show:print('2输出:', loop2(1))
复制代码

输出:

1输出: 16        loop:  1        loop:  2        loop:  4        loop:  8        loop:  162输出: (32,)
复制代码

with 式(代码GitHub链接):

import lazyllm
# 条件函数stop_func = lambda x: x > 10
# 分支函数module_func = lambda x: xmodele_func2 = lambda x: x * 2
# loop构建with lazyllm.loop(stop_condition=stop_func) as loop1: loop1.func1 = module_func loop1.func2 = modele_func2
# Show:print('输出:', loop1(1))
#==========================# 分支函数2def module_funcn2(x): print("\tloop: ", x) return lazyllm.package(x+1, x*2)
# loop构建2with lazyllm.loop(stop_condition=stop_func, judge_on_full_input=False) as loop2: loop2.func1 = module_func loop2.func2 = module_funcn2
# Show:print('2输出:', loop2(1))
复制代码

输出:

输出: 16        loop:  1        loop:  2        loop:  4        loop:  8        loop:  162输出: (32,)
复制代码

8. Bind

通过上述对数据流的介绍,我们会发现有一个问题是数据按照预定义的路径流动,我们似乎只能控制入端数据,当我们遇到想要在某个环节引入上两级的数据时就会遇到问题,如下面图示中的 in 到 f3 我们很难用上述的流来搭建。



针对这个问题,LazyLLM 提供了一种参数绑定的方式,使数据在数据流中向下游自由地游走(跳跃的数据流)。


让我们先定义 f1,f21,f22,f3 上图中的几个函数:

def f1(input): return input ** 2def f21(input1, input2=0): return input1 + input2 + 1def f22(input1, input2=0): return input1 + input2 - 1def f3(in1='placeholder1', in2='placeholder2', in3='placeholder3'):     return f'get [input:{in1}], [f21:{in2}], [f23: {in3}]]'
复制代码

LazyLLM 提供了 lazyllm.bind 函数进行函数绑定,bind 函数接收的参数格式如下所示:

lazyllm.bind(func, param1, param2, ...)
复制代码

其中:

  • func 为需要进行参数绑定的函数,

  • param1param2 依次为 func 接收的参数。实际上我们观察上图可以发现:

  • 我们需要输入的param1就是 ppl 的输入(ppl.input),此处我们可以通过 ppl.input 在当前数据流获取对应的输入。

  • param2 和 param3 是 f3 的上一级,LazyLLM 对这种情况定义了一种占位符,_0。_0 表示数据流中当前节点的上一级输出,如果上一级中有多个输出,则可以通过_1, _2, _3 依次获取,这里有两个输出所以分别是_0, _1。

基于 LazyLLM 的参数绑定可以实现上图中的数据跳连:

代码GitHub链接

from lazyllm import pipeline, parallel, bind, _0, _1
with pipeline() as ppl1: ppl1.f1 = f1 with parallel() as ppl1.subprl2: ppl1.subprl2.path1 = f21 ppl1.subprl2.path2 = f22 ppl1.f3 = bind(f3, ppl1.input, _0, _1)
print("ppl1 out: ", ppl1(2))
复制代码

输出:

ppl1 out:  get [input:2], [f21:5], [f23: 3]]
复制代码

注意,参数绑定仅在当前数据流内生效,您无法将外部变量数据绑定至数据流内,也无法跨数据流进行数据绑定。


LazyLLM 为 bind 函数重载了 | 运算符,可以通过它实现更直观的参数绑定,将函数和参数区分开来(|运算符之前的是被绑定的函数,之后是需要绑定的参数)。此外,子数据流也支持绑定入参。下面我们将上图修改为更复杂的流,我们将数据流输入绑定为 subprl2 的第一个输入(下图红色箭头线),上游 f1 的输出为 subprl 的第二个输入。



代码GitHub链接

from lazyllm import pipeline, parallel, bind, _0, _1
with pipeline() as ppl1: ppl1.f1 = f1 with parallel().bind(ppl1.input, _0) as ppl1.subprl2: ppl1.subprl2.path1 = f21 ppl1.subprl2.path2 = f22 ppl1.f3 = f3 | bind(ppl1.input, _0, _1)
print("ppl1 out: ", ppl1(2))
复制代码

输出:

ppl1 out:  get [input:2], [f21:7], [f23: 5]]
复制代码

基于 LazyLLM 实现 RAG

在基础 1 中我们介绍了 rag 的具体原理及实现过程,简单 RAG 的推理步骤只有三步,即检索、增强、生成。这里我们可以通过上面讲述的数据流来重新实现一下这个 RAG,使得到一个更清晰的代码块。详细代码如下:

import lazyllmfrom lazyllm import bind
# 文档加载documents = lazyllm.Document(dataset_path="/mnt/lustre/share_data/dist/cmrc2018/data_kb")prompt = 'You will act as an AI question-answering assistant and complete a dialogue task. \ In this task, you need to provide your answers based on the given context and questions.'
with lazyllm.pipeline() as ppl: # 检索组件定义 ppl.retriever = lazyllm.Retriever(doc=documents, group_name="CoarseChunk", similarity="bm25_chinese", topk=3) ppl.formatter = (lambda nodes, query: {"query": query, "context_str": "".join([node.get_content() for node in nodes])}) | bind(query=ppl.input) # 生成组件定义 ppl.llm = lazyllm.OnlineChatModule().prompt(lazyllm.ChatPrompter(instruction=prompt, extra_keys=['context_str']))
lazyllm.WebModule(ppl, port=23466).start().wait()
复制代码

更多技术内容,欢迎移步 “LazyLLM” 讨论!

发布于: 刚刚阅读数: 3
用户头像

用AI大模型,找商汤大装置。 2023-04-04 加入

还未添加个人简介

评论

发布
暂无评论
LazyLLM教程 | 第3讲:大模型怎么玩:用LazyLLM带你理解调用逻辑与Prompt魔法!_商汤万象开发者_InfoQ写作社区